2006/11/24

也談MODS

上週六(95.11.18)去聽了美國資訊科學與技術學會台北分會秋季的討論會RALIS2006 Autumn前三場簡報,主要是想了解第二場關於MODS(Metadata Object Description Schema,後設資料物件描述綱要)的報告,現將心得綜合整理如下[補註2006/11/28:摘要 報告之重點 這兩部份的內容皆摘錄自原文,可詳原文(全文投影片);報告之重點 的小標題及一些超連結則是我加上的 ]

題目:數位環境中機讀編目格式的新面貌:MODS 的產生與發展
(The New Aspect of MARC in Digital Era: the Creation of MODS and its Development)
(張慧銖所長等)

[摘要]
圖書館目錄長久以來以MARC 作為資訊資源描述的後設資料(Metadata),然而為因應電
子資源的快速增長與實際描述數位資源的需求,必須考慮資訊的互通性,以及簡化資源
描述的項目。因此,將MARC 轉化為依據XML Schema 所設計的後設資料物件描述綱
要(Metadata Object Description Schema,簡稱MODS)即為圖書館界所做的因應方式之
一。本文以MODS 的產生與發展為主軸,探討其優、缺點,並以美國國會圖書館
MINERVA 計畫與澳洲國家圖書館ANBDMP 計畫兩個實例作為標的,檢視其實際應用
的狀況。

報告之重點
1. MARC的困境
編目規則及MARC作為描述資源的標準,面臨了許多考驗,包括:描述結構過於繁複、互通性不足、需要透過特定軟體系統讀取資訊等等。…MARC、ISO 2709 在網際網路應用上互通性(interoperability)的不足,無疑仍是它在網路世界中極大的缺失

王妙娅、李小梅曾列舉MARC21 作為數位物件描述標準的限制,包括:
1) MARC 因其體系龐大,修訂程序複雜緩慢,而且只能由專業人員進行;
2) 字段重覆、而且紀錄中某些描述是程序性,而非描述性;
3) 書目關係的呈現是隱性而非顯性;
4) 不適於處理動態數位資訊的描述;
5) ISO 2709 所規定的語法結構不清楚;
6) 無法直接在Web 上瀏覽。

詹麗萍對於使用MARC處理數位資訊亦有疑慮,她認為MARC「將書目資料分別納
入不同欄位」的設計,此種分離式的架構很難處理資訊間豐富且複雜的關係。…

為建立MARC 和其他描述數位物件後設資料的溝通機制,美國國會圖書館發展
MARCXML(網頁),使MARC 資料得於XML 環境中運作,MARCXML 可謂將MARC 格式完整的「XML 化」,雖然解決MARC 互通性的問題,卻仍無法克服MARC 過於複雜的障礙。…

2. DC (Dublin Core) 的優、缺點 (註1)
DC 自1995 年產生後即深受矚目,其以建立一套簡潔而靈活,可使非專業圖書館員也易於掌握和使用的資源著錄格式為目標,故其特色為結構簡單、語意明確,一度被部分學者視為即將取代MARC 的後設資料。然而經過近十年的考驗,MARC 未死,而DC 雖簡潔明瞭,但是其字段的定義趨於模糊,容易形成理解及操作上的不一致,加上缺乏得以提供參照結構的方法,沒有規範控制,導致檢索率低。(鞠福琴,2005)為便於實際利用,DC 相關的描述項目及描述語也在一次次的會議中逐步增加,於是它原先為數位物件描述所設計的特點,在經過十年運作的考驗後,反而使得這些特點成為難以克服的障礙。(陳學清,2005)…

DC 實際上就是因應處理電子資源而產生的後設資料…具備下列幾個特色:
(1)可直接處理網路資源,既是後設資料的交換格式,更是後設資料內部處理的格式,帶來數位資源組織上極大的便利;
(2)係為著錄網路資源而制定,自然適用於眾多領域,更可解決資料變長、允許重覆等問題;
(3)它可應用於世界上通用的軟體,便於系統與時俱進,可推展網路資源編目自動化;
(4)其著錄格式簡單,可以減輕編目人員的工作負擔。(賀梅萍,2005)

由於DC 原就不是針對專業編目館員所設計,其規則簡潔正表示紀錄內部的連結極為薄弱,其質量自然較為偏低,亦無法像傳統編目紀錄那般完整。(陳學清,2005) 因而DC 的簡潔明瞭,卻又成為其發展與應用上的缺失。(鞠福琴,2005)

3. MOS (Metadata Object Description Schema,後設資料物件描述綱要)

由來:
MARCXML實際上並未解決問題…因此美國國會圖書館於2002年才公佈了MODS。MODS 是一種描述性的後設資料,可與MARC 相容。它與MARCXML 雖同樣使用XML 語法,資料元素也取自MARC21,但把資料元素經過重組與簡化…由於MODS 與MARCXML 都是描述性的後設資料,因此皆可作為METS(Metadata Encoding and Transmission Standard,後設資料編碼與傳輸標準)的一部分(McCallum, 2004)。此外,MODS 若依目前的規則來著錄資源,恰可解決DC 缺乏系統化規則的問題。…
目前最新的版本是2006 年6 月1 日公佈的MODS 3.2 版。…亦公佈了MODS_MARC21 與MODS_DC 的轉換對照表。…
因為MARC 的元素及結構過於複雜,而DC 的描述語又太過簡單,所以MODS 正好可以解決MARC 與DC 的缺點。MODS 雖是為便於圖書館的應用而發展,但也可適用於其他物件資源的描述。(Guenther , 2005)由於具備若干特性使得MODS 可作為傳統圖書館系統與非MARC 格式系統之間的橋樑,是支援MARC 書目元素互通機制的一種綱要(尤其是MARC21),能將MARC 紀錄轉成MODS 的格式。若再透過後設資料框架(metadata frameworks)如:METS,便可提供更高層次之概念結構。(Hodge, 2005)

MODS 的特性 (列舉部份):
1) 採用XML 語言
2) 採使用者導向的標籤,讓標籤具有較高的可讀性
3) 將MARC 的資料元素重組
4) 小幅修正MARC 以便納入電子資源:為了容納電子資源,MODS增加了一些雖小但卻很重要的資料元素,這些資料元素在MARC中並沒有相對應的標籤。如中的有三個值可供選擇,分別是access、preservation和replacement…
5) 可應用於多種資源的描述

MODS 的優點 (列舉部份):
1) 資料元素集比DC 豐富
2) 著錄的方式較DC 更具系統性與規則性
3) 較ONIX 更能與圖書館原有的系統相容
4) 資料元素較MARC 單純

MODS 的缺點 (列舉部份):
MODS 雖然與MARC 有很高的相容性,可以和MARC21 來回轉換…會造成資料遺失

MODS範例(長的啥樣?)請見原文或簡報檔

MODS的應用模式
將向美國國會圖書館註冊的MODS實驗計畫專案加以分類,可觀察出MODS的應用模式大致可分為四類:
1)在OAI-PMH架構中扮演資料轉換的角色
2)利用MODS直接描述電子資源
3)以MODS作為METS中的描述性後設資料
4)用MODS作為中介的後設資料,讓各領域不同的後設資料得以相互轉換

MODS的應用個案
1)MINERVA計畫 (Mapping the INternet Electronic Resources Virtual
Archive,美國國會圖書館)
嘗試以MODS直接著錄網路資源,並以原有的線上目錄為主體,將網站的後設資料(MODS)轉入以MARC為基礎的OPAC中。
結果:
(1)驗證了MODS與MARC的高度相容性。(2)MODS紀錄可以很容易與原有的圖書館自動化系統整合。(3)MODS在資料元素選擇上的彈性,讓編目人員可以更有效地產生編目紀錄。

2) 澳洲國家圖書館ANBDMP 計畫(ANBD, Australian National Bibliographic Database, 資料庫librariesaustralia檢索畫面)
即應用模式1及4,由於合作者(資料提供者)大都是非圖館社群的機構,其編目資料亦非MARC 格式,且大都為DC 格式。本專案先將DC轉換為MODS,再轉成MARC,最後轉入澳洲大利亞全國書目資料庫(ANBD)中。(註2)亦可參考下圖


以下是作者們提出的很好之建議
1) 國內應加強MODS的研究:相較於國外諸多實驗計畫,國內對於MODS的研究
與實驗計畫稍嫌不足。
2) 可利用MODS整合NBINet與數位典藏國家型科技計畫的成果:國內數位典藏國家型科技計畫成果係以DC為其後設資料標準,另NBINet則是以MARC為其後設資
料,這二大資源或許可以參考澳洲國家圖書館的ANBDMP計畫,以MODS作為中介格式,整合成國家級的書目資料庫,讓使用者既可以找到紙本也可以找到數位資源。

感想
有聽眾提到MARC, MODS 及DC 欄位比較及哪些是不可或缺的元素。這讓我想到FRBR 雖已初步勾畫出書目記錄(主要仍以非網路或電子資源為主?)的功能要件(functional requirements)及國家書目記錄基本著錄層次的資料要素(data elements)(即意味應有哪些欄位),然而FRBR 應用在數位資源方面顯然有所不足?(註3)

另外不管是MARC 或MODS ,其底層的設計觀念與FRBR 的觀念是否有距離?當讀到 IFLA FRBR p.6, Introduction -- 1.3 Areas for Further Study 中的一段文字:

The entity-relationship analysis reflected in the model might also serve as a useful conceptual framework for a re-examination of the structures used to store, display, and communicate bibliographic data. Further study could be done on the practical implications of restructuring MARC record formats to reflect more directly the hierarchical and reciprocal relationships outlined in the model. An examination of that kind might offer a new approach to the so-called “multiple versions” issue. The model could also be expanded in depth to create a fully developed data model that would serve as the basis for the design of an experimental database to assess the efficiency and effectiveness of a database structure patterned on the model.

再看Keven 在“MARC、 MARC,為什麼不死?”的評論中提到

“現在的問題是,不論哪種XML格式(MODS/MARCXML或者任何其他),要想利用MARC資料,都擺脫不了它的平面化設計(把所有語義和關係都揉在一個表格中表示),以及描述物件為複合物件(書作為一種形式、書的內容、人、出版社等等)、難以執行1:1原則等問題,也就是說資料記錄的抽象模型不同,很難“無損”地轉換。我所說的MARC裝機量大、陰魂不散,包括所有基於MARC、或者想借助XML借屍還魂的所有形式。實際上卻如您所說,目前所有的自動化系統的內部存儲,都是用關聯資料庫,都不是我說的“純”MARC,但畢竟脫不開MARC的影子。現在XML時代,存儲形式與語義表達,與語法形式可以完全分離了,但不同的系統所採用的抽象模型不同,他們之間的互操作也不完全,只能等以後在本體模型層面(例如FRBR用RDF表達)可以實現描述世間萬物的元資料方案的統一。當然災民住時代,這是永遠不可能的。keven (my.donews.com/keven/) 發表於 2006-09-16”

在Web環境下,MODS似乎是過渡時期的方法,資訊編碼的方式仍在不斷演變中。或可說,傳統的知識組織方法的邏輯思維已漸被類似 RDF(Resource Description Framework) 般的思維所挑戰了 ?!

註1:DC (Dublin Core,都柏林核心集) DCMI首頁中譯版(大陸);吳政叡之介紹
註2:參見 “Reengineering a National Resource Discovery Service ”(Missingham)一文
註3:可參考“從實體到需擬:談資訊組織發展現況與展望”(陳昭珍)

2 則留言:

匿名 提到...

冒昧一問,您的文中有一部分是擷取自張老師們的文章,但在文章開頭卻是自稱為個人的心得,難免會誤導讀者,以為整篇都是您的想法。也許稍加修正一下用詞會更好~

Debra 提到...

如造成誤導讀者,實感抱歉!我已加上補註說明以更正。謝謝您的指教。