2006/11/05

「資訊組織進階班」研習筆記之四

2006.8.15第二堂課為鄭恆雄主任講授的「中文主題詞表」(2005年出版)。以下為我整理的資料:
...........綱 要...........................................................
一、主題檢索:從標題表到主題詞表
二、中文主題詞表使用說明
............................................................................
一、主題檢索:從標題表到主題詞表
.
主題檢索的方式有: 1. Natural language(free-text sarching)(自然語言全文檢索) ; Keyword searching (關鍵字檢索) 2. Controlled vocabulary access (控制字彙檢索):包括使用subject headings(標題),descriptors (敘述詞) ,synonymous terms (同義詞) 作標引,references (參見關係) (See/Use ; See Also/BT, NT, RT)

主題分析的工具---主題法與分類法(另可參見註2b: 2.4及註4)
1. 主題法以標題作為檢索標誌;分類法以類號作為檢索標誌。
2. 主題法主要是指引讀者從「不用的標題詞」引見「用的標題詞」。建立「不用」(UF)與「用」(USE、See)的關係;分類法是以知識的學術分類建立體系,著重在知識「論理」關係的層屬性 Hierarchical Relationships,因此屬於類號標記的層屬結構 Notational Hierarchy。
3. 主題表也使用「參照系統」,如 LCSH 的 BT、NT、RT以導引讀者查找「廣義詞」(Broader term)、狹義詞(Narrower term)及「相關詞」(Related term) 詞目,便利讀者進行擴大檢索與縮小檢索。

中文圖書標題表概述:最初是依據《中國圖書分類法.試用版》以及賴永祥《中國圖書分類法》第七版的類目,收錄標題以當時的中文圖書出版品為對象。(即literary warrant,文獻保證原則,註1) 但標題表的缺點有:標題詞之詞量不足、標題詞詞彙控制不夠嚴格、標題詞收錄的速度緩慢…等。民87年國圖鑒於標題表因時代變遷以致詞目不符使用,遂推動《中文主題詞表》編訂計畫。

‧ 《中文主題詞表》
編製流程 見下圖 (鄭主任上課簡報)


編訂原則:後組式之詞表、文獻保證原則、用戶保證原則、重視實用原則(參見註2),此外亦包括
1)各學科詞彙以規定之數量為上限,如確有需要增加,需經國家圖書館中文主題詞表工作小組同意調整.
2)主題詞之建立,應包含主題詞與參照關係.
3)詞彙控制只採用同義關係,參照關係僅保留用(USE) 與不用(UF) 關係;亦即僅建立「見」關係,唯必要之「參見」、「說明註」仍須建立.
4)主題詞之建立依擬定之建檔格式為依據。
.
選詞原則 見下圖 (鄭主任上課簡報)


「中文主題詞表」與「中文圖書標題表」最大不同者在於取消各式複分與採用單一概念的詞彙。「中文主題詞表」旨在提供圖書館進行分類編目時進行圖書標引之用,標引對象主要在「圖書」,並非期刊論文,和一般綜合性的主題詞表或索引典不同。在詞彙間關係的建立上,索引典所收錄的詞彙間的參考關係有層屬的、相關的、同義的、同形異義的等,參照款目以BT、NT、RT、Use及Use For建立關係;而「中文主題詞表」簡化為相關的、同義的、同形異義的關係,以「用」、「不用」及「參見」建立關係。 (錄自註3)
.
主題檢索語言的種類 
任何一種資訊檢索語言,就其實質而言,都是表達主題概念及其相互關係的標識系統。資訊檢索語言可分為自然語言及控制語言兩大類。其中增進主題檢索效率的主題檢索語言即為非自然的控制辭彙。主題檢索語言是人為的語言,針對特定檢索目的而設,人為語言是經過控制的、規範化的。主題語言是主題檢索語言的簡稱,有兩大類型:分類主題語言及字順主題語言。分類主題語言用分類標記表達各種主題概念,有體系分類法(或傳統之列舉式分類法及層屬式分類法)及組配分類法(或現代的分析組合式分類法)兩種,統稱為分類法系統;字順主題語言用語詞作為概念的表達,按筆畫字順排列,並用參照系統間接顯示概念之間的相互關係,包括標題型主題檢索語言(標題法)、單元詞型主題檢索語言(單元詞法)、敘詞型主題檢索語言(敘詞法)及關鍵詞型主題檢索語言(關鍵詞法),統稱主題法系統。其中標題法是主題法系統中最早出現的一種,可稱為傳統主題法。大陸地區常將敘詞稱為主題詞,敘詞法亦稱為主題詞法。(錄自註3,另可參考註2b:3.1-)
試描繪其間關係(左圖);右圖為一位作者自訂 keywords的例子:

有趣的 keywords


「中文主題詞表」屬單元詞法。而大陸的許多“主題詞表”(即索引典)是屬敘詞法,因數量龐大因此有人倡議應作些整合/兼容(註5)。
.
分類主題 一體化的議題
‧ 1) 分類法和主題法一體化詞表的編制宗旨,主要是為了使兩種不同類型的文獻標引工具兼容一體,互為表裡. 2)從而實現分類法和主題法、分類標引與主題標引的相互結合、相互轉換,使二者揚長避短、互補互利,發揮二者最佳的整體效應,實現文獻標引的一元化操作,達到文獻一體化標引的目的。(劉湘生,「中國分類法和主題法一體化詞表的編製與應用」,《香港圖書館協會學報》18( 1996),頁63)
.
兩岸主題詞表詞目數量比較
中文圖書標題表》(1995修訂版) 9,000+標題詞
中文主題詞表》(2005) 主題詞 23,162筆
相關網站 ....分類法/標題表資料庫檢索系統
...............國家圖書館中文主題編目規範系統(需申請帳號)
《漢語主題詞表》(大陸) (書目)108,568條主題詞(亦可參考中科院檢索系統)
《中國分類主題詞表》(大陸) (書目) 收錄分類法類目五萬餘條,主題詞款目16餘萬條。 (db簡介) (可參考註5)
.
兩岸書目記錄內容比較



二、中文主題詞表使用說明 (講義綱要如下)
‧1 目的功能 4 體系結構 7 標引原則
‧2 選詞原則 5 使用要點 8 標引實例
‧3 選詞範圍 6 標引步驟 9 詞表管理

重要簡報投影片如下(源自鄭恆雄主任)



感言
除關心大陸的發展外,對於國際社群的研發動態也應知曉,在IFLA的IV. Division of Bibliographic Control(書目控制部)便有兩個工作小組—Functional Requirements of Authority Numbering and Records (FRANAR) 及Functional Requirements for Subject Authority Records (FRSAR) ,後者是關於主題的權威控制,並欲針對FRBR中的第三組實體(即主題概念)建立一觀念模型。該工作小組主席為曾蕾(日前來過台灣) ,其網頁中有關於FRSAR控制詞彙之準則的簡報資料。
.
[註]
1. Fundamental principles of Library of Congress Subject Headings, 3.2 Literary warrant
2a.中文主題詞表概述(ppt)(陳友民,九十三年圖書資訊編目規範研習會2004/09/10)
2b. 上述資料之Text檔 (http://lib.fju.edu.tw/seminar/200408marc/file/¤¤¤å¥DÃDµüªí·§­z¥Ø¦¸.doc)
3. 見“主題詞表的內涵及在網路環境中所扮演的角色” (陳和琴)
4. “分類法與主題法之比較” (何世文)
5. “建立以《中国分类主题词表》为核心的检索语言兼容体系” (侯漢清)(http://www.lib.pku.edu.cn/98conf/paper/d/ºîººÇå.html)
.
補充說明
陳和琴老師原文(註3)中說到“「中文主題詞表」與「中文圖書標題表」最大不同者在於取消各式複分與採用單一概念的詞彙…”,因我只擷取部份文字,以致容易使人誤解,抱歉!以下再補充說明:
.
「中文主題詞表」與「中文圖書標題表」間的差異,可參考該文章關於“標題法”及“單元詞法”的述說:
(一)標題法  用經過規範的標題詞標引主題概念,以參照系統連結相關主題,並用字順提供主題檢索途徑,主題分析時直接標引標題詞,是前組合的檢索語言。在文法結構上標題詞有單一名詞、名詞加形容詞、片語、名詞加限定詞等等,有複分標題。選定標題詞須遵守特定性、唯一性、通用性及準確性的原則。標題表是標題詞的彙編,是一部標題詞典。
(二)單元詞法  單元詞法脫胎於標題法,是對標題法的一種改革。單元詞是指最小、最基本的辭彙單位,在概念上不能進一步分解,例如鐵路,不能分解為鐵+路。單元詞法的基本原理是任何複合主題概念都可分解為單元概念,每個單元概念只須由一個單詞表達。檢索時才組配單元詞,所以是一種後組合的檢索語言。標題法是直接地、精確地直接對文獻主題進行標引,選用較狹窄、較複雜的詞組;而單元詞法偏向於選用表達簡單、廣泛概念的單詞,對於複雜的主題概念則儘量以單一概念的單詞進行組配。
(三)敘詞法  (大陸)亦稱主題詞法。由於單元詞法可自由組配單詞,與檢索前預先組配好的標題法相比,確有其優點,所以它一出現,就吸引了許多的使用者。但是這些人使用之後,發現單元詞法嚴密性不足,經過不斷改進的結果,才形成了敘詞法。換言之,敘詞法是由單元詞發展而來。  
敘詞表或稱主題詞表,又稱索引典,乃收集足以表示知識概念的字或詞,並將之以特定的結構加以排列,這些字彙控制了同義字、區別了同形異義字,並顯現各相關詞彙間階層及語意互屬上的各種關係,以作為文獻標引人員或索引人員在分析處理資料及讀者在檢索資料時選用一致的、經過控制的詞彙。  
敘詞法綜合多種檢索語言的原理與方法,取各法之長、而捨各法之短。它保留了單元詞法的單詞組配,每一個詞彙可能為單字或片語,但只表示一個單一概念;採用組配分類法的概念組配來代替單元詞法的字面組配,並採用標題法預先組配的詞組,克服某些詞分拆後在組配時所產生意義失真的缺點。標題法多用於前組合索引,單元詞法僅用於後組合索引,而敘詞法用於前組合索引,也用於後組合索引。 (節錄完)
另想強調:主題詞表在網路(檢索)環境有其價值----可提高檢全率及檢準率(recall & precision ratio)
.
Originally posted on 2006/09/12, 2nd rev 2006/09/14

沒有留言: