2009/05/29

RDA再認識(下)

[基礎參考資料]
RDA(編目規則.草案) 網址http://www.rdaonline.org/
JSC(註1)新網址 http://www.rda-jsc.org/
RDA—资源描述和检索:21世纪的编目标准 (大陸顧犇譯RDA簡介單張)(PDF)
-------------------------------------------------------------------------------
接續上篇,關於Diane Hillman的投影片:Getting Real With RDA.

Slide 39-- 我們現在能做什麼?
要看得更遠,我們需要做:
讓我們[圖書館界]的data[在網路上]能被取得、讓其他人能利用、
確定我們在網路上使用的資料結構及詞彙[集]、
讓我們的data更像data(“data-like”)、我們的系統更“雲端”(“cloud-like”)

Slide 41 鏈接資料(linked data)的圖示,其中包括圖書館的資料(library data)

Slide 42 圖書館資料成為linked open data 時,我們對這種資料能做些什麼?

Slide 43 有哪些挑戰?
在JSC(或以後接續的組織)的合作之下,做長程的維護計畫,我們需要一個輕型及更容參與的流程,變革不需要經年累月才能達到、
RDA繼續朝向更語意網的方向發展(例如:更少依賴複寫transcription[書上所載的資料])、
開發相關工具(Tool development)(各層級的工具,包括自動化系統廠商)

Slide 44 RDA的轉移作業要花多少時間?
壞消息是:這可能是個很繁雜的過程,比我們所希望的持續更長的時間、
OCLC的角色還是未定—現在他們正忙著鞏固圖書館的[書目]資料及推展WorldCat成為圖書館自動化系統、
好消息是:圖書館自動化系統廠商已開始覺醒了

Slide 45 RDA的測試期、測試些什麼?(註2)
與現在編目方式相比,測試以便確定RDA是否具備充分的優點以達到JSC當初擬定的目標(註3)、
根據測試結果的分析及考量實行RDA的成本,三所美國國家圖書館將決定是否實行RDA、
若出現否定的建議,這將意味什麼?現還不清楚

Slide 46 測試的方式

Slide 47 你需要做些什麼準備?
觀看(讀)、學習、提問:注意測試情形、試用RDA的工具(RDA Tools)、實際建立一些書目記錄,並針對非傳統資料作測試、學習更多網路技術、到NSDL註冊中心的Registry Sandbox(練習用沙盒、即練習用編輯頁面,http://sandbox.metadataregistry.org/)去做練習
促使你的同事及你的(管理)上司來參與

[其他引介及感想]

RDA可說有兩大部分,一部分是編目規範的條文內容,這在RDA官方網站 (JSC RDA)說明了RDA的內容及政策、行動等;另一部分是RDA中資料元素的形式化表述(formal representations of the RDA elements),這部分Diane Hillmann提供了很多相關知識、訊息及看法。

1.在JSC RDA網站,有對RDA相當充分的介紹(包括其背景、範圍及原則…常見問題、現在的行動進度),其中常見問題(FAQ)8 提到RDA和MARC21的關係(註4) ,也可見大陸顧犇翻譯RDA簡介單張中的敘述,或我回覆網友的一段文字(註5)。

2. RDA的推行是項多方合作的工作,見顧犇譯文中“合作的成果”這段文字 (註6)或2009年3月RDA會議記錄摘要中”Outreach”(擴展工作)這段文字(註7)。

3. 關於新編目程序(邏輯)及測試計畫:過去編目多以手頭上拿到的實際書籍來編,即針對“媒體展現”(manifestation)來編,而新的規則RDA是要先弄清楚作品家族,在編目實作上會增加多少負擔?或許要從上游的出版界的書目開始著手/梳理才行?而初期測試參與者很少、加上目前業界對FRBR的應用多止於manifestation 的程度,將來使用RDA網路版在大規模性的合作編目環境下(如OCLC合作編目環境)將會產生哪些問題呢?相信這些問題會被分析及評估,或許從舊到新的大轉移將是個不斷修正的歷程?

而像我們這種身處“邊緣”者要如何準備變動的來臨?我想應從熟悉RDA的基礎觀念—FRBR開始。(註8)

註1:JSA全稱為Joint Steering Committee for Development of RDA(RDA發展聯合指導委員會),是研訂RDA的團體。

註2:參見LC對RDA測試的說明:Testing Resource Description and Access (RDA)

註3:關於利用RDA創建書目資料這方面的目標(Functionality of Records Produced Using RDA – Objectives)是:Responsiveness to user needs、Cost efficiency、Flexibility、及Continuity等,見http://www.rda-jsc.org/docs/5rda-objectivesrev2.pdf

註4:RDA網站中RDA常見問題(FAQ)8

8.1 Will RDA include instructions for MARC coding along with the cataloguing instructions?
AACR2 and MARC 21 are two different standards designed for two different purposes. AACR2 is largely a content and display standard while MARC 21 is largely an encoding standard. RDA is being developed only as a content standard rather than as an encoding standard. It is important that the RDA standard maintain this separation. RDA will contain guidelines for choosing and recording data to include in bibliographic and authority records. MARC 21 is one possible schema for encoding records created using RDA, but it will also be possible to encode records created using RDA in other schemas, such as MODS or Dublin Core.

8.2 How will RDA affect the way that records are coded in MARC 21?
The RDA/MARC Working Group has developed a number of proposals for changes to the MARC 21 formats to accommodate the encoding of RDA data. See the listing of proposals and discussion papers at http://www.rda-jsc.org/rdamarcwg.html. The JSC expects that most RDA data elements can be incorporated into the existing MARC 21 structure using current MARC 21 guidelines for coding and order of data elements. Thus, in most cases, RDA will not necessitate users of MARC 21 to make changes to the way their MARC data displays. Draft Appendix D of RDA contains a mapping from MARC 21 Bibliographic to RDA, and Appendix E contains a mapping from MARC 21 Authorities to RDA.

註5:大陸顧犇譯RDA簡介單張“RDA—资源描述和检索:21世纪的编目标准” (PDF),其中“使用RDA的好处”一段提到:
RDA是一個為數字世界設計的新的資源描述和檢索的標準
■RDA側重于需要描述資源的資訊,而不是...要說明如何顯示該資訊。
■用戶將可以將RDA內容與許多編碼方案(例如MODS(元資料物件描述標準)、MARC 21或都柏林核心元資料)一起使用。RDA具有適應性和靈活性,具有被其他資訊行業和圖書館使用的潛在可能性。

另,秋聲Blog的訪客留言區 2009/5/25
RDA與MARC(或MODS, DC…等)是不同目的及層次的東西, RDA被稱為是”(書目)內容規範”, 而MARC, MODS, DC…屬編碼格式( formats for encoding). 因此編目時可依循編目規則(RDA,AACR…)來創建書目資料(記錄), 但可選擇使用你想要的機讀格式(MARC, MODS, DC…)來輸入資料供機器處理。因FRBR/RDA中的一些資料元素在原MARC中無此欄位,因此MARC21現為配合RDA的實行正在作修訂.也可參考http://www.collectionscanada.gc.ca/jsc/rdafaq.html(FAQ 8的說明)

註6:顧犇譯RDA簡介單張“RDA—资源描述和检索:21世纪的编目标准” (PDF),其中“合作的成果”一段提到:
RDA的工作涉及了圖書館界內外的徵求意見工作。除了FRBR和FRAD工作組以外,聯合指導委員會(JSC)還與如下組織共同工作:
■都柏林核心元資料和其他語義網領域:比較各自所採用的概念模型和標準。(根據這些工作組的會議所產生的建議,一致化的工作正在進行中。)
■美國國會圖書館網路發展辦公室和MARC標準辦公室:保證RDA和MARC 21之間的相容性。(在英國國家圖書館、加拿大圖書館和檔案館、美國國會圖書館的發起下,一個協調RDA和MARC 21的工作組已經成立。)
■國際圖聯國際編目規則專家會議(IME ICC):負責修訂和更新“巴黎原則”(AACR2以此為基礎),使其成為21世紀的原則。
■出版界:發展出一套基於其ONIX標準的載體術語,用於出版界和圖書館界。

註7:
Outreach
Members of the CoP, Co-Publishers, and JSC have always emphasized the importance of working with other groups in pursuit of compatibility of RDA with other metadata communities. To that end:
●An RDA/MARC Working Group was established in January 2008 to coordinate changes to the MARC format as a result of RDA. Proposals have been submitted to the appropriate groups and have been accepted by them. The result is that MARC 21 will be able to accommodate the additional RDA fields and elements.
●The JSC has been working with the Dublin Core Metadata Initiative (DCMI) on two projects relating to RDA. The first is a mapping of RDA elements to Dublin Core elements. The second is the development of registered vocabularies for the RDA element set and value lists.
●Members of the JSC continue to work in the international arena with the ISBD Review Group, the FRANAR Working Group, and those working on the creation of the new IFLA Statement of International Cataloging Principles, ensuring open communication and coordination.

註8:JSC RDA網站:RDA常見問題9“採用RDA”/Adopting RDA)提到( #9.1):
There are a couple of things that you can do in order to prepare for RDA. The first is to familiarize yourself with the concepts and vocabulary that is found in FRBR. The second is to keep up-to-date with RDA developments by reviewing drafts as they become available and monitoring comments about RDA on various listservs.

[相關資料]
據各方意見,RDA內容作了修改,參見ALA 代表J. Attig的部落格:http://www.personal.psu.edu/jxa16/blogs/resource_description_and_access_ala_rep_notes/

RDA 再認識(上)

2009/05/24

RDA 再認識(上)

最近注意到兩份投影片:一是Diane Hillmann 再次闡釋RDA(Resource Description and Access,資源描述與檢索),另一份是Denton及Schneider 講關於FRBR的發展(註1),都值一讀。先看RDA這份投影片的要意。

Diane I. Hillmann於20090429 在紐澤西圖書館協會(NJLA)的演講,題目是Getting Real With RDA(暫譯:真實了解RDA)(48 slides)。

Slide 4: RDA in the context of change中提到相關規範的演變:
書目世界的觀念模型(Bibliographic Model)從沒有(none)到FRBR及FRBRoo、
詮釋資料內容(Metadata Content)從AACR2到RDA、
Metadata Structure(詮釋資料結構)從MARC21 Bibliographic到RDVocab[RDA詞彙集]、
人名權威檔(Name Authority)從MARC21 Authority到FRAD、
主題權威檔(Subject Authority)從MARC21 Authority到FRASAR, SKOS、
編碼(Encoding)從MARC21到XML及 XML/RDF

Slide 8: Important Differences提到RDA[與過去]重要的不同處:
RDA是以FRBR為基礎的方法,去組織(結構化)書目資料、
RDA包含更適宜機器處理的鏈接項目(如URIs)、
更著重關係及角色(relationships and roles)、
減少編目員建立的附註及文字串、
減少複寫資料(書)上的文字[如:作者敘述]

Slide 10: RDA as Toolkit提到RDA是個工具集(toolkit):
RDA除了線上版的編目規則外,還包括一些工具(tools)、
免費工具應有:XML Schemas to use with RDA data、RSS feeds to keep track of vocabulary changes…

Slide 11: The Rest of the Story 其他一些事情:
正對MARC21進行修訂以配合FRBR及RDA、
eXtensible Catalog Project 此計畫猛進中、
不幸的是不知道OCLC正計畫些什麼、
RDA詞彙的其他語言版已著手進行了

Slide 20-21: RDA WEMI Relationships 顯示FRBR第一組實體(註2)[即作品、表現形、媒體展現及單件]間的WEMI(Works, expressions, manifestations, items)關係情況:已界定及登錄於NSDL

從Slide 25-38 Walking through a concrete example…(DCMI/RDA cataloger scenarios)
以實例說明如何根據RDA來編目[不同於已往的一套邏輯!] :

(Slide 26)編目員Jane要編一本拉脫維亞語(Latvian)翻譯的書(原著為英文)。首先她查出原作者、書名…等資料:
Author(作者): Kurt Vonnegut
Title of the work(作品名稱): Bluebeard: a novel
Form of work(作品類型): Novel(小說)
Original language of the work(原作品語文): English(英文)
----------------------------------------------------------
(Slide 27)以XML及鏈接資料來表述此作品(Work) -- RDA/XML表述、及RDA/XML+URI(連結links)方式來表述



(Slide 28)該作品有:一表現形(expression) 及一媒體展現(manifestation):
表現形
Language of expression(表現形之語文): English(英語)
Content type(內容類別): Text(文字)
媒體展現
Statement designating edition(版次描述): 1st trade edition
Place of publication(出版地): New York
Publisher’s name(出版者): Delacorte Press
Date of publication(出版年): 1987
Extent of text(文字長度): 300 pages(300頁)
Identifier for the manifestation(媒體展現識別號): [ISBN]0385295901
----------------------------------------------------------------------------------
(Slide 29-30)以上expression和manifestation以RDA/XML、及RDA/XML+URI(連結links) 方式來表述

(Slide 32)Jane 對於拉脫維亞語的譯本,她需建一個表現形及一個媒體展現,並與原作實體相連結;另譯者需建人名權威記錄

(Slide 33-34) 拉脫維亞語譯本的expression和manifestation,以RDA/XML、及RDA/XML+URI(連結links) 方式來表述

(Slide 35-38) 勾畫出FRBR關係圖(作品、作者/譯者、主題之間),其中Slide 38:

圖:Getting Real With RDA(Diane Hillmann) slide 38


註1:參見What We Talk About When We Talk About FRBR (The FRBR Blog)
註2:參見FRBR是什麼?(中譯) (上)、() (秋聲Blog)

[參考資料]On the Road at NJLA and the Five Colleges (Matadata Matters)

2009/05/13

LC新網站:權威資料與控制詞彙(Authorities and Vocabularies)

●[簡介]

美國國會圖書館(Library of Congress, LC)在眾人引頸期盼下終於在2009.5.1公佈一個官方新網站 – Authorities and Vocabularies (權威資料與控制詞彙) ( http://id.loc.gov/authorities/)(註1),它提供人及機器來取用LC的權威資料(authority data),採用鏈接資料(linked data)的方法(即透過統一資源標誌符URI來連結相關資料)(註2)。

此網站目前提供了34萬多筆的控制詞彙記錄供免費使用,首先提供的是國會標題表(Library of Congress Subject Heading, LCSH)(註3),今後會陸續增加更多控制詞彙集(如:圖像資料索引典TGM、MARC地區代碼…等)。

將LCSH的標題詞彙變為linked data,即是每個標題詞都有URI,如:標題詞 -- "Semantic Web"(語意網) 的URI是 http://id.loc.gov/authorities/sh2002000569#concept 。每個詞彙(term)都有其詳細資料頁面及視覺關係圖,如下面圖例:



..


詞彙的詳細資料可供下載,在頁面最下方有三種格式: (Alternate Formats) RDF/XML, N-Triples, JSON)(註4),另參見“技術中心”(Technical Center)頁面的說明。

●[感想]

誠如遠洋老師(遠洋過客)轉來的信息中提到:LCSH in SKOS now "officially" available. The primary goal of this service is to enable machines to programmatically access data at the Library of Congress but the web interface also provides simple user access. We view this service as a step toward exposing and interconnecting vocabulary and thesaurus data via URLs. LC的權威資料與控制詞彙一旦成為linked data後,便可供機器處理(透過程式),圖書館加值資料才能真正融入Web環境中。也如雨僧所說:“它[指LC這新網站]的第一服務物件是機器而不是人,機器是主體,人是附帶的,所以這個服務的啟動,其意義是深遠的…”。

在由document web邁向data web(或稱web of data,語意網的)時(註5),諸如圖書館的data(如:LCSH、RDA…等控制詞彙) 的表述都需經過適當的轉變,讓機器可處理及可再利用,同時與廣大網路上的概念或詞彙相連結、並開放供眾利用 – 這便是開放性鏈接資料 (linked open data, LOD),應是網路及資訊檢索未來的道路。
.
註1:在去年(2008)5-6月(?)時LC的職員Ed Summers曾公佈一網站lcsh.org,將LCSH以鏈接資料的方式表述,算是現在正式官網的前身,後來在12月時LC要他撤除。參見Summers的UNCOOL URIS (http://lcsh.info/comments1.html),及Keven的SKOS版的LCSH 有相當清楚的解說。

註2:Linked data,有譯為鍵連資料(維基)、關連數據(大陸Keven),這裡暫參考國立編譯館的學術名詞資訊網中linked data structure (鏈接資料結構),將linked data譯為“鏈接資料”。
“鍵連資料是正在快速發展的語義網的一系列的活動,它描述了一套在全球資訊網上發佈、分享、及連結資料的方法。主要以可參照的URI作為最基本的要素、以RDF作為描述連結的語言。”(維基)

另可參閱:
关联的数据 (Linked Data)--1. Linked Open Data (LOD)(遠洋過客)
关联的数据 (Linked Data)--2. 关联的图书馆数据Linked Library Data(遠洋過客)
语义互操作与关联数据 (ppt) (Keven)

註3:國會標題表(LCSH)現在有紙本(第31版,2008-2009);也有web版(Classification Web,和國會分類法一併販售)。或直接查閱Library of Congress Authorities(LC的權威檔),免費線上查詢、且有MARC記錄。

註4:
N-triples:N-Triples is a line-based, plain text serialisation format for RDF (Resource Description Framework) graphs(維基解釋);或參考“RDF/XML 並不是 RDF 模型的唯一表示。W3C 開發了 N-Triples,這是一種特別適合於測試套件的 RDF 表示格式…”(Thinking XML: N-Triples 簡介用於 RDF 的一種更簡單的序列化)。

Json(Javascript Object Notation)是一種輕量級的資料交換語言,以文字為基礎,且易於讓人閱讀。儘管JSON是在Javascript的一個子集,但JSON是獨立於語言的文字格式,並且採用了類似於C語言家族的一些習慣。(維基解釋)

註5:语义互操作与关联数据 (ppt) (Keven/劉煒) slide 26

[其他參考資料]
Linked Data - Connect Distributed Data across the Web
The Web of Data: Creating Machine-Accessible Information (ReadWriteWeb 20090417)

2009/05/09

2009年母親節

孩子從學校帶回來一張小卡片,說是(慈濟)大愛媽媽發的。他的書桌上有個小層(書)架,他便把紙片黏在正中間的位置--抬頭可見的位置,卡片上寫著:

...... 媽媽 ......

媽媽,您是一棵大樹
我是樹上的小毛蟲
我每天吃樹上的葉子,媽媽沒有怨言

媽媽,您這一棵大樹
還是不停的長出新葉子
使我成長,使我茁壯

媽媽,我們感恩您!
..................................................................................

在Flickr相片分享網站上看到一張有趣的相片 -- 山胡椒(?)葉上金鳳蝶的毛毛蟲(Swallowtail caterpillar),想必樹媽媽的葉子餵養牠肥肥壯壯了:

圖By poppy2323 (http://www.flickr.com/photos/66132721@N00/2763084259/in/set-72157608339939097/ )

(眼睛狀斑點有偽裝作用,有些誇張、好玩)

希望孩子早日成為蝴蝶!也祝辛苦的媽媽們節日愉快!

2009/05/05

美國圖書館學會對Google和解案的態度

美國圖書館學會(ALA)的資訊技術政策辦公室(OITP)2009.5.4發佈了一則消息:三個圖書館學會(ALA、ACRL、ARL)對Google和解案(Google Book Search settlement) (註1),已向法院提出評論(評論title:LIBRARY ASSOCIATION COMMENTS ON THE PROPOSED SETTLEMENT,全文22頁PDF檔) (註2)。同時Library Journal 也作了報導 -- Warning of Abuse of Monopoly, Library Groups Ask Court To Closely Monitor Google Settlement (警告獨佔的濫用:圖書館團體要求法院嚴密監視Google和解案),可清楚看出美國圖書館學會明顯的立場及作為。以下是LJ文章的重點:

美國圖書館學會(ALA)、大學及研究圖書館學會(ACRL),和研究圖書館學會(ARL)對Google與出版社等團體的和解案,向美國法院提出評論/意見,要求法院在解釋及實行此和解案上強力行使其裁判權 -- 這可能要花上數年時間,以確保最可能的公眾利益。

三個圖書館學會表示他們並不反對此和解案,但警告:高昂的收費及不透明的控制將危害圖書館的基本價值 -- 即公平取用資訊、讀者隱私,和知識自由(intellectual freedom)。Google將掃描二千萬本書,作者、出版者及Google (而不是一般大眾及圖書館社群) 有無比的權力掌控這些資料的內容及其註冊登記等事務。Google及「圖書版權登記機構」(Book Rights Registry)能以其利潤觀點來制定收費標準,一旦價格調高勢將損及大眾取用權益;且市場上並無可相比較(競爭)的產品或服務。完全由Google及登記機構決定圖書館的訂閱費,圖書館並沒有地位/角色(role)。

其他問題還包括:

各圖書館情況不同,很多館無足夠終端設備去取得這種服務以滿足讀者需求。

Google並未表明:掌握多少使用者在資料檢索及列印的個人隱私資料,Google必須對個人隱私資料有明確的政策。

書中插圖的創作有其著作權,他可將插圖抽離作品而使得作品不完整…等情形。

Google可能會遭遇到外界壓力(政治…等)而排除掉(掃描)一些爭議性書籍。


三個圖書館協會表示他們已明確指出必然會發生的問題,需要法院介入仲裁。此和解案牽涉廣大,它的全面性影響現在仍不可知,它可能只衝擊到一些學者(在研究工具的使用方面),但也可能重構出版業及對圖書館性質有重大的改變。對於和解案成立後所提供的(數位資料)服務,法院應採行必要的監督以擴展最大的公眾利益。

[感想]
在這種涉及到資訊公平取得及資訊服務爭議時,圖書館不能缺席、不能不表態(發聲)、不能沒有立場。

註1:Google與美國作家協會及出版協會的和解案現尚未定案、尚待法院裁定,案子的來龍去脈可參閱“圖書館觀點”Ted詳細的介紹:各界對Google 與美國作家及出版業達成和解的一些反應 或章忠信的邁向世界圖書館之路?—Google與出版界和解之後

註2:向法院提出評論(file comments)原截止日為2009.5.5,現已延長四個月。
LIBRARY ASSOCIATION COMMENTS ON THE PROPOSED SETTLEMENT文中提到此和解案的問題有:The Settlement Creates An Essential Facility With Concentrated Control, The Settlement Could Limit Access to the ISD, The Settlement Will Heighten Inequalities Among Libraries, The Settlement Does Not Protect User Privacy, The Settlement Could Limit Intellectual Freedom, The Settlement Could Frustrate the Development of Innovative Services,最後一點提出:This Court Can Address The Library Associations' Concerns Through Rigorous Oversight of the Implementation of the Settlement 力促法院確保六點具體的公眾權利。

[相關資料]
Google Book Settlement (ALA OITP專設的網頁)
Google Book Search Settlement: A Set of Links (Library Journal 彙集很多討論文章的清單)
Google與美出版協會和解涉壟斷 美司法部要查(鉅亨網)