2008/10/24

編目朝向語意網邁進(一)

最近注意到有兩個(圖書館)標題表以SKOS[註1]來表述的例子 -- 一個是美國國會圖書館標題表(LCSH)以SKOS語法來表述、另一個是大陸的《中国分类主题词表》(Chinese Classified Thesaurus,CCT),由遠洋過客所作SKOS表述的實驗與探討[註2]。
.
而新的編目規則“資源描述與檢索”(RDA)製訂之同時,有DCMI/RDA工作小組進行RDA詞彙集計畫(RDA Vocabulary Project) [註3]。當然書目世界關鍵的觀念模型FRBR,早已有其重要地位。這種種都顯示了編目(或稱資訊組織)正漸漸向語意網邁進。

傳統的編目工作常分為“記述編目”(descriptive cataloging)與“主題編目”(subject cataloging)這兩大方面,在走向語意網之際,這兩方面有何變化呢?

語意網:編目人員觀點

首先得了解一下“語意網”(Semantic Web),這對我而言是蠻技術及複雜的,至今仍迷茫,但還是將自己的一些理解及瀏覽過的資訊寫下來,或許能獲高人指點。

提到語意網不得不也提到知識本體(ontology)、及與本體相關的語法:OWLSKOS;還有底層、技術性的XMLRDF。這許多縮寫名詞可先參考下面圖1,有個概觀,以下說明其中一些名詞。

在陳昭珍老師的“知識本體架構與知識組織發展新趨勢”這篇文章對許多詞彙(語意網、本體、SKOS…)有相當清楚的說明,以下引號中的文字摘自該文。

現在的網路(Web)與下一代的語意網差別在那裡?可參考這張對照圖(Figure 2: Resources and links can have types in the Semantic Web)。“而如何做到語意網呢?基本上就是要讓電腦知道文件之間的關係,也就是要增加文件的語意。增加語意的方法有兩個:
1. 使用標準之metadata 格式建立外在的描述資料,如採用Dublin Core 來描述資料內容,但這種方法比較沒有彈性,能描述的內容數量有限;
2. 另一種方法就是採用知識本體架構來專指資料的意義,這是目前語意網最主要的核心技術。”

知識本體(Ontology)簡單說是用來表示資訊的結構、規範概念及顯示概念間的關係。現今已建立了很多類型的知識本體架構,就其結構化程度可分成:“詞表/用詞清單/術語工具(如:權威檔…等)、分類與歸類/類目(如:分類表、標題表)、概念關係表(如:索引典)”,參見這張圖(左邊圖)。

如何建立知識本體架構呢?下面是較重要的步驟:
“決定知識本體的領域和範圍、考慮採用現成的知識本體、
匯集重要的詞彙(Enumerate important terms in the ontology)、
定義知識類別及層級(Define the classes and the class hierarchy)、
定義類別屬性(Define the properties of classes – slots)、
定義屬性之面向(Define the facets of the slots)、
建議知識節點(Create instances)

…在Ontology 領域中,尚需以標準的語法來表達該知識本體架構。目前用來表達知識本體架構的標準主要有表達Topic Maps 的XTM 語法、及W3C 所推出的Ontology 語法OWL 及SKOS…
簡易知識組織系統(Simple Knowledge Organization System,簡稱SKOS)…主要目的乃在提供一個簡單有用之架構,以電腦可瞭解方式來表達知識組織系統,是一個用來支援知識組織系統使用的規範和標準,其知識組織系統包括索引典、分類表、主題標目…和在語意網架構內應用之其他各種控制詞彙方式。
SKOS 也是以資源描述架構(Resource Description Framework,簡稱RDF)和XML為基礎的語法…
SKOS 為一簡單語法,但因SKOS 是架於XML 和RDF 語法之上發展,提供可讀性和可擴充性,即機器只要能解譯XML 或RDF 語法即可讀取SKOS 格式;而且只要是基於RDF 和XML 語法上發展的語言,都可與SKOS 合併使用,如圖5[見下圖1] DC、FOAF 等語彙,都可與SKOS 混合使用,使SKOS 具有強大擴充性。”



圖1(取自http://dc2005.uc3m.es/program/tutorials/tutorial4_eng.ppt slide76)

“XML:主要乃在提供標示文件的表層語法(surface syntax),它不會為這些文件的意義加上任何語意說明。

RDF:是一種用以描述物件(“資源”)與物件彼此間之關係的資料模型。它為這種資料模型提供了簡單的語意,而這些資料模型可利用XML 語法來表示。

RDF Schema:是用來描述RDF 資源之屬性與類別的詞彙。為這些屬性與類別的一般化階層架構(generalization-hierarchies)提供語意。”
--------------------------------------------------------------------------------

[註1] SKOS(Simple Knowledge Organization System,簡易知識組織系統),本文“語意網”那段將有説明。

[註2]
1. 都柏林核心集及後設資料應用國際會議DC-2008(International Conference on Dublin Core and Metadata Applications)上的一篇報告說明了LC的這項實驗計畫:LCSH, SKOS and Linked Data - Ed Summers, Antoine Isaac, Clay Redding, Dan Krech (PDF);大陸的Keven也寫了一篇相關的文章:SKOS版的LCSH,該文末提到:

“9、希望不久看相到《中国图书馆图书分类法》、《汉语主题词表》、《中国分类主题词表》或其他国内规范的知识组织体系,尽快成为网络资源可用的工具……这是传统知识组织方式(主题表、叙词表、分类法等)在网络时代生存下去、发扬光大的必由之路。”

2. 大陸的《中国分类主题词表》(CCT)(書目評介)。遠洋過客的報告及文章:SKOS and Its Application inTransferring Traditional Thesauri into Networked Knowledge Organization Systems (PPT/PDF)、SKOS用于《中分法〉的编码和转型、及CCT2 senariors (metadata wiki)。

[註3] 參見code4lib年會的一些議題(二):RDA問題探討 (秋聲Blog)



[相關資料]
知識本體的發展及其在知識組織系統之應用/陳昭珍等 檔案季刊 v5n2 p79-98

語意網(Semantic Web)與知識本體(Ontology) /柯皓仁. 中華民國圖書館學會96年資訊組織進階班:主題分析與知識組織研習手冊

數圖研究笔記(Keven's Blog) DC2008聽會記系列博文

3 則留言:

匿名 提到...

受益匪淺,尤喜歡您的標題:“編目朝向語義網邁進”。

匿名 提到...

另:秋聲師,雨僧已在自己的玻殼中添加您的博客的鏈接,如有不妥,煩請告知,謝謝!

Debra 提到...

謝謝雨僧的鼓勵,鏈接沒問題,但我好像還不太夠格作"技術酒徒"。自覺技術底子差,寫東西不夠透徹、深入,還望您不吝指教!