2010/04/05

發掘MARC一些問題

在歐美大力推展圖書館編目轉型之際,不僅新編目規則RDA 正在測試中(年底是關鍵!)、MARC[1]也配合修訂中,另方面一些 metadata 的專家也朝語意網努力 -- 在2010 ALA 的刊物Library Technology Reports 便刊出Karen Coyle 關於語意網的文章[2]。

最近Karen Coyle 的部落格文章MARC: from mark-up to data (機讀格式:從標記語言到數據資料)指出MARC的一些缺點(對現今網路時代而言),或許這也是許多MARC 使用者長期的疑問吧!

1. 指標 (Indicators)的問題:有些可能可以廢除;但許多指標對該欄資料作了進一步的界定(如MARC21 的034 指標2)。就實際資料元素(actual data elements)而言,我們需要花很多功夫去明瞭這些指標的含意。

2. 重複、多餘(Redundancy)的情形:許多定長欄及代碼欄(MARC21 的00X及0XX)的資料與其他書目欄位的資料(具書目顯示功能)是重複的,例如出版日期(260 $c)。是否可以去除這種重複的情形?

3. 不一致 (Inconsistency) 的情形:例如個人作者欄 100 有 a,b,c,d,e,j,q,u 等分欄,但在連接款目欄 760僅有分欄 a 供鍵入相同的資料元素。(CMARC 90年版 無此情形)

4. 數據(資料)埋藏於文字資料中 (data buried in text):很多所謂的數據(資料)其實不是數據(資料),而是文字資料(text);或者是這些數據(資料)是埋藏於文字資料中。例如重要的數據資料ISBN,在MARC 書目記錄中並沒給它一個位置,讓它成為資料元素;而只在 020 的分欄 a ,將ISBN 與其他資料放在一起:
020 __ $a 0812976479 (pbk.)


看來Coyle 正在分析 MARC 中的資料元素,待完成後才能與 RDA 的資料元素相比對。讓我們持續關注相關發展及行動吧!


註[1] MARC:參見美國MARC21(MARC21 Formats for Bibliographic Data)、CMARC(中國機讀編目格式民90年修訂版)

註[2] 待讀:Understanding the Semantic Web: Bibliographic Data and MetadataRDA Vocabularies for a Twenty-First-Century Data Environment

其他資料:

標記語言(Markup language):維基解釋(英文 / 中文)
RDA Update ALA Midwinter 2010 (cunycataloging)
ALA ALCTS CC:DA (Committee on Cataloging: Description & Access) 網頁
編目朝向語意網邁進(二) (秋聲Blog)

沒有留言: