2007/06/26

一些RDA訊息

ALA 2007年會中RDA議題
.
Karen Coyle在Digiblog中的一篇文章RDA Update Forum, June 23,得知現正召開的ALA 2007年會其中RDA Update Forum會議的一些看法:

● RDA的四個主要成員(LC, 加拿大圖書館, 大英圖書館及澳洲國家圖書館)即將發表一份聲明,支持RDA的共同合作計畫(與DCMI合作)。(Wiggins)
●RDA不僅是一套資料元素集(a set of data elements)也是一份應用綱要(a community application profile)。(Attig)[註]
●RDA成員與CDMI將合作把RDA內容中的資料元素(elements)抽取出來,使之成為機器可運用且其他社群能了解者(make the data machine-actionable and understandable by other communities)。(Hillmann)

●也有聽眾表示出疑慮與不滿,如:RDA不是個有用的編目指引(規則)、作者則寫道:若讓參與的300名聽眾投票 -- 針對RDA是否朝一個正面方向發展?-- 相信很少人會投肯定票。
.
看來RDA/DC還要一塊兒走段很長的路吧!
.
ALCTS Programs
另ALCTS在此次年會中安排的演講議程(含演講摘要)(ALCTS Programs at the 2007 ALA Annual Conference in Washington, DC),也很有意義。
.
離開祕密花園:RDA/DC先導計畫
.
Karen Schneider的文章Out of the Secret Garden: The RDA/DC Initiative,將圖書館界的RDA與DCMI的合作用哈利波特般的故事來比喻 -- 圖書館書目資料猶如禁閉於(祕密花園)高牆內的人(哈利),現正鑿洞而出;並認為RDA/DC的合作協定是具歷史性。

Schneider的文字蠻有趣也發人深省,以下是令我印象深刻的句子:

◎ 當我們抱怨為何無cool且新的應用程式能將圖書館書目資料分享至全世界、為何無Google式的混搭應用方式來連繫讀者與書籍,這乃是因為我們的資料是沉沒的(不顯的)(It's because our data suck)。
◎ 講到簡略的DC(以其 15個資料元素最為著名),它讓我們走向一個簡單的編目模型嗎?作者則認為DC可支援十分豐富的表綱(very robust schema),它是模組建構式的(a building-block model),可使編目語言現代化、結構化、明確化…
◎ 以Diane Hillman及Gordon Dunsire為首的合作小組,正為此先導計畫努力。這變革的成敗勢將決定我們圖書館專業的未來前途。

[註]可詳Attig的ppt ,或下面他對RDA的看法:
Think of it as a content standard. RDA is more than that: it is also a metadata schema and an application profiles.

Is a metdata scheme:
Organized as a list of data elementsbased on FRBR and FRAD
Structured: elements, sub-elements, and element sub-types.

This provides basic structure for metadata based on RDA. New document RDA Scope and Structure, with mapping to FRBR.

RDA is an application profile:
- elelemtns and terminology of a community
- interpretation of FRBR/FRAD, which are community models

RDA as content standard
- designed primarily for use in libraries
- based on AACR, FRBR/FRAD
- applicable to a variety of media and formats collected by libraries
- developed for use in English language environment but could be adopted in other language communities
- independent of format in which data is stored (RDA is not MARC any more than AACR is MARC), but MARC is not the only application that could encode it.

Recognize that there are other tasks beyond resource discovery, but concentrating on this now.

Gives outline, with FRBR user tasks associated with each chapter.
Part A is essentially Identify and Select, although 6 & 7 are related to FIND


rev on 2007/06/27

2007/06/15

生活雜記(2007年6月)

抉擇

當法官宣布那房子拍定時,懸宕兩年、如芒刺在背的一起恩怨就此打住
生命中不斷地在作抉擇,而自我性格及價值觀影響了每次的決定
回顧這起家族事件,曾問自己是哪裡做錯了? 是因顧念血緣親情、有那點婦人之仁... ?

就像我們用血汗、心力及感情建築的小小城堡,毀損了一片,這些城牆磚塊(猶如金錢,這怪物)竟成了親情的試金石?再加上嗜血的銀行。 還是怪我們的城堡太小經不起挖掘?

小小的怨就讓它煙消雲散,只願能了悟與重生!(2007/6/13)

兩本書

以前讀簡媜的紅嬰仔,不禁流淚。或許是自己的年齡、小孩與她如此相近,心境相仿吧。
簡媜又寫了她的小男孩 -- 老師的十二樣見面禮 :一個小男孩的美國遊學誌 ,希望能向圖書館借到閱讀。
不過回南部過端午節,希望能先將《隨意搜尋》(目次)(GBkSearch)看完。

2007/06/12

Google與CIC合作,千萬冊館藏將數位化

Google於2007.6.6與美國中西部大學合作委員會(Committee on Institutional Cooperation, CIC)簽約合作[1],將進行CIC聯盟的大學圖書館約一千萬冊館藏的數位化工作。CIC為美國重要的圖書館聯盟,包括12所中、西部大學,圖書館總藏書量超過7500萬冊。這次加入Google Book Search(即Google Books Library Project)計畫,將挑選約一千萬無版權限制的書進行數位化,其中包括許多可貴的特色館藏
.
CIC成為第16個Google合作的圖書館夥伴,在這項先導計畫(initiative)中 Google將提供屬於公共領域(public domain)資料的數位化複本一份予CIC收存,供其建立自己的數位典藏庫。[2] CIC的主管(director) B. McFadden Allen提到“在極短時間內我們即能瀏覽千萬冊書的內容、檢索其中字詞、連結至全文,這原需花數週至數年的精心分析[才能做到]”。[3]這也是CIC聯盟合作事項或稱聯合取用資源的一個例子(an example of collaborative sourcing)。
.
Google Book Search涵蓋內容不斷快速擴大,對圖書館方面的衝擊及影響為何?站在圖書館服務前端最有力的全球性組織OCLC的副總裁Lorcan Dempsey提到:這將影響至“[圖書館]全面性的改變”,見Systemic change: CIC and Google 一文。其中許多前瞻性的看法值參考:
.
一、關於此次CIC的決定,Dempsey提到“在一個重組(reconfigured)的網路環境下,圖書館支援著正在改變中的研究及學習行為”,圖書館面對的是規模大的資源合作與取用,與Google合作即是一例。
.
二、與“取用”(access)相關的影響:
.
1.全文數位化使文獻內的一些細節可以發掘,它的好處顯而易見。這種方式提昇了使用率及銷售。沒有這種方式,書籍文獻會比網路文獻少被取用。
2.Google 從學術搜尋、網頁及書籍中探勘相關資源並將其連繫起來,我們可以看到相關版本聚集在一起…當資料量益大及技術更精進時,這種服務將變得更好,是其他競爭者難以趕上的。
3. Google 是個依賴廣告的搜尋引擎(an advertizing engine),而非採一種較“資料服務”(data services)的方式,可能難於供眾利用它的內容及服務來作混搭利用。如果是這樣,則資源的可利用價值將會降低。這點還待觀察。(參閱另篇討論search API的文章)。[4]
4.這種網上取用廣大館藏的方式對參與館更顯重要,聯盟的廣大館藏及其產生的網路效益遠超過個別圖書館所能做的。
.
三、這不僅是大規模數位化(mass digitization)的問題,更對圖書館資源的管理方式有全面性的影響,從下列幾點來看:

1. 資源的公開、發掘、傳遞(Disclosure, discovery, delivery):在網路環境下,資源的發掘及傳遞的動態正在改變。圖書館希望Google Book Search的使用者知道在他們的學校裡,有哪些資源可利用。
2. 聯合館藏(Collective collection):越多資料數位化,我們將更會思考如何共同地管理館藏。
3. 著作權議題(Copyright ):能有效率地決定資料在不同生命週期的著作權狀況,這是很重要的。但現在還未能做到。
4. 知識組織( Knowledge organization):圖書館、博物館等建立的結構性書目資料需在網路上發揮其價值。Google已作全文探勘,如果進一步對資料再作電腦運算、處理,或許有機會在大規模全文資料中支援身份(人名、地名等)的辨識(identity identification)。
5. 數位資源保存(Preservation)

當今的課題是--在此網路環境下,圖書館整體資源如何重組?(how does the systemwide library resource reconfigure in a network environment)。對OCLC或類似其他機構來說,很重要的是:和圖書館合作發展網路規模(web-scale)的[事項]以回應網路環境下使用者的期望。

[一點點感想]
Google大規模數位化的行動之背後仍有許多疑點、大規模性資源的運用是種趨向且量大促成質變(所謂scale matters)、圖書館如何因應這質變?


[1] 見CIC Press Release 或 Google Announcement
[2] “Google will provide the CIC with a digital copy of the public domain materials that are targeted for this project… As a part of the agreement, the consortium also will create a first-of-its-kind shared digital repository to collectively archive and manage the full content of public domain works digitized by Google that are held across the CIC libraries.”(CIC Press Release, p.2)
[3] “ In seconds, we'll be able browse across the content of thousands of volumes, searching for words or phrases, and making links across those texts that would have taken weeks or months or years of dedicated and scrupulous analysis.”(A statement from the Director)
[4]這段內容較技術性,不知是否會誤解(?),故附上原文:Currently this material is made available within the Google destination site. Google is an advertizing engine and its approach depends on aggregating attention for adverts. This apporach may be difficult to deploy within a more 'data services' approach where others - especially the partners - have remixable access to content and services. However, the 'utility' value of this resource will be diminished if it is not made available in this way so that others can mobilize these resource within their own environments. How and if this gets done remains to be seen. (See the related discussion about the search API.)

2007/06/08

LC未來的書目控制工作小組第二次會議摘要

美國國會圖書館未來書目控制工作小組(Working Group on the Future of Bibliographic Control,LCWGFBC)第二次公聽會議已於2007.05.09於芝加哥舉行[1],此次會議主題為:書目資料的結構與標準(Structures and Standards for Bibliographic Data),會議議程、背景資料及會議摘要在此連結。以下簡譯會議摘要
.
此次會議的目是在促進討論構築書目控制的[書目資料]組織及標準(也就是規則、指引、模型及綱表(schema)等)及製訂它們的方式。本摘要記載此次會議的一些重點,這是來自邀請的講者及聽眾的評論。下列議題多次被提到:在製訂標準時與其他社群共同合作或諮詢是很重要的、維持書目資料的品質是很重要的、將圖書館方面採用的[書目資料]結構及標準轉為網路資源,以促成與其他社群間的資料共享與互通。大家關心的除了需要在書目資料、權威資料、詞彙…等方面的共享與互通,還有如何去達成此事。特別是要使圖書館界的詮釋資料及資訊工具(metadata and information tools)更符合網路的架構,才能讓他們的價值在開放的網路上展現
.
[講者]Bade提到書目控制需要館員對資源的詮釋與評估,以便提供使用者有用的資訊。母機構的目標及使用者的需求應引導書目記錄的建置。為改善[書目記錄]的品質,他建議編目人員應有學科專長,以了解資源被其他專家使用的目的。錯誤的書目記錄會阻礙使用者找尋相關資料,因此對書目記錄應有更高的品質要求。
[講者] Hillmann談論重點在書目控制的結構與標準之改革 -- 建立RDA元素詞彙及應用綱領(element vocabulary and application profile)。她報告了RDA與DCMI最近的會議是在研討書目控制的新資料模型。[2]她提出“網路化”("Webification")的觀點以探討圖書館運用[書目]資料的障礙。圖書館方面所用的資料、結構及標準如果易於取用,那將對其他社群會有明顯的價值及用途。
[講者]Jane Greenberg則建議:首先要改善共用性 -- 圖書館界所擁有的豐富書目資料 (在不犧牲其品質及目的情形下)及所採用的標準與結構的共享性。她特別指出:轉換為開放互通的標準將增進可用性及共享性,W3Cthesaurus links即是成功的例子。在新的應用方面,她建議應在傳統的與新近的應用間建立連繫(例如將社會標籤更規範化),以及在標準方面應有一些新的重點(譬如,不僅對數位物件作描述,還需追尋其生命週期)。
[講者]Jennifer Bowen談到合作的議題,據她在RDA編訂的經驗,她討論了在標準建立過程中與其他社群諮商的情形。她建議與適當社群的充分諮商能改進詮釋資料的互通性…等等。最後她期盼工作小組能有領導性的行動:重新清楚界定角色與責任(尤其是LC的角色)、說明變革的得與失…等等。

其他聽眾的評論(意見)包括:
編目是公共資產(a public good),不論經濟因素都應予以支持、
書目資料是圖書館服務的核心,能連結使用者及資源、
需支援[處理]多國語言的資料、
公共,專門,學校圖書館應參與討論…

最後工作小組成員Clifford Lynch作總結並提出下列問題(僅列出部份):
1. 如何去評量品質?使用者能否加入品質控制的工作?品質控制的花費與益處之間的交換(trade-offs)是什麼(權衡取捨)?
2. 如何去界定書目記錄?譬如,想要包括目次、索引及參考書目在內嗎?在數位世界裡,需要書目記錄去描述述整個數位物件,還是僅提供指引路徑?
3. 如何讓人們更易於改進共建的詮釋資料?
.
------------------------------------------------------------------------------------
.
目前在研議及推動圖書館資訊組織相關標準的改革者,除LC未來的書目控制工作小組(成員包括為美國圖資專家及館員、業者)外,還有RDA's JSC(成員包括美國LC、ALA、加拿大、英國、澳洲圖書館的代表)[3]、IFLA FRBR Review Group,及MARC修訂者Dempsey即提過這些標準在不同的機構背景下有著不同的發展軌跡,參與人員或有重疊,但卻未作整體性的規劃...。似乎有些多頭馬車?不過從陸續的會議訊息及資料中讓我們了解各方的圖書館社群如何力求變革。
.
[1.1] 見“LC研討未來的書目控制問題” 一文;
[1.2]第一次會議的焦點在:書目資料的使用者使用。並確定兩個主要的使用者及其相關的使用環境:消費端環境及管理端環境(a consumer and a management enviroment),大多與會講者皆表示:現在的書目資料及用以表達它們的方式是無法滿足使用者之需求。(會議摘要)
[1.3]第三次會議訊息已公布,可能有網路轉播。
[2]見“RDA新動向”一文
[3.1]參見RDA計畫經理Ms. Bloss的文章(含RDA組織圖)
[3.2] ALA的部門(division)之一ALCTS(Association for Library Collections & Technical Services)及CC:DA(ALA Committee on Cataloging: Description & Access)應是代表ALA,均扮演重要的角色。
.
[其他參考資料]
Hillmann在LITA Blog 上的兩篇報導第二次會議的文章也寫的十分詳細。(pt.2)

2007/06/05

FRBR是什麼?(中譯)(中)

[翻譯說明:原文為 Barbara Tillett 寫的“What is FRBR? a Conceptual Model for the Bibliographic Universe” (pdf) 。本篇是接續 FRBR是什麼?(中譯) (上) ]


書目關係 (Bibliographic Relationships)
一直以來大家都把注意力放在第一組實體間的“天生關係”(inherent relationships)上。[1]但在此之外,還有很多豐富的內容關係(content relationships),這些關係能類聚相關的著作,以及在複雜的書目網路中導引(enable navigation...)我們。

內容關係(content relationships)可視為是作品/表現形/媒體展現/單件的連續現象(continuum)。從連續現象(如下圖 Family of Works)的左方移動到右方:左方開始的是原始作品、相關作品、表現形、及媒體展現等,他們可視為原始作品的同等物,也就是他們都有相同的智慧或藝術內容,且有相同的表現形[式]。[2]接著過來的作品/表現形/媒體展現與原作的相關性,是一種衍生關係(derivative relationship)。這些包括一些新的表現形(如:翻譯、不同的表演方式、少許的修改、不同版本)。[3]而沿著此連續現象向右跨越過一條奇妙的界線,越過界線者便成為新的作品,但仍與原作相關。[4]在連續現象的最右邊是一種描述性的關係(descriptive relationships),即這些新作品是在描述原作品。[5]FRBR提醒我們這些“關係”的重要性,而且要將焦點放在那些符合使用者需求的最重要的“關係”上。
.
.


原文"What is FRBR?" by Barbara Tillett (p.4)
.
.
FRBR也涵蓋整體/部份部份對部份的關係(whole/part and part to prat relationships)。當我們組織編目數位資源時,我們發現這些整體/部份部份對部份的關係特別有關聯性。例如,一個網站可視作一個“整體”,而它的組成份子是“部份”;或將整個數位資源及其組成份子都視為“部份”,他們能藉由詮釋資料(是關於儲存及顯示這些數位資源的)查尋得到。

部份對部份的關係包括“相繼”(sequential)及“伴隨”(accompanying,或稱“同伴”companion)的關係。同伴的關係可以是互相依賴的或各自獨立的,這將影響到我們對這些相關作品及其媒體展現編立多少個書目記錄。[6]

事實上,編目人員決定要編立多少個書目記錄,是根據各自的編目政策,此乃反映了各自使用者的需求。我們可以選擇不同層次的編目方式:以整套作品(FRBR稱為一個聚集)、單獨作品、或作品的組成份子來編目。在整套編目時,我們可以對所有組成部份作描述,並應對每個組成份子建立檢索點。以作品的組成份子這種層次編目時,我們應提供連結連到大“整體”(whole)。無論我們是以哪種觀點來看“整體”(whole),FRBR提省我們 -- 在滿足使用者需求上,這些(書目)關係是很重要的。[7]

-------------------------------------------------------------------------------------------
[1] 此處的 inherent relationships 指作品“與生俱來”的關係,即一個作品與它自己的表現形、媒體展現或單件的關係。
[2] 如“作品家族”(Family of Works)圖的最左邊者:一作品的微縮複製品、影本、重印本等,皆與原作相同(同等物)。
[3]與原作有衍生關係者,如:翻譯本(translation)、精簡版(abridged edition)、插圖版(illustrated edition)、修訂版(expurgated edition)等。
[4]依據編目規則來區分怎樣才是新作品,即是跨越此分界線後的是改編本(adaptations)、摘要(summary, abstract, digest)、變更原作品類型者(如:文字作品改為戲劇…等)。
[5] 新作品是在“描述”(describe)原作品,如:某作品的評論(review, criticism, commentary)、注釋本(annotated edition)。
[6] “同伴的關係可以是互相依賴的或各自獨立的”可參見FRBR p.64-66 ,或(遠距學園)戴怡正“書目記錄功能要件”講義 p.57-60: 作品對作品的關係可分為依附性作品及獨立性作品,依附性作品指此一作品與另一作品關係密且切,且須與另一作品同時使用,譬如:《說苑逐字索引》須與《說苑》同時使用,他們便是互相依賴(或稱依附性)的關係。
[7.1] 不同層次的編目方式(to catalog at various levels)可參見FRBR(p.28) 3.3 Aggregate and Component Entities 或 FRBR(p.69) 5.3.1.1 Whole/Part Relationships at the Work Level。
[7.2] 舉個例子說明不同層次的編目方式:
名家名著選》這套書,至今已出版20冊。其分成第一、二輯,第一輯包含10位作家的10部著作,如:v.1 雅舍精品 / 梁實秋著;v.2 母親的金手錶 / 琦君著 …
兩種不同的編目方式(依各自圖書館編目政策):
套編:整套書建一筆書目記錄
單編:每冊書(每部不同的作品)建一筆書目記錄
.
或參見“套書編目實例”(黃淑廷)(ppt)

[其他相關資料]
The FRBR Model (presented by Dr. Barbara B. Tillett for the FRBR Seminar
Australian Committee on Cataloguing Feb. 2, 2004) (ppt)

2007/06/01

Google的全域搜尋(Universal Search)

現在使用Google搜尋,有時會覺困擾,因為要常切換至Google ScholarGoogle BooksGoogle Blog Search…等等,因Google為不同類型的資源(媒體)各建有搜尋引擎(vertical engines for videos, books, blogs, news, maps, pictures…)。2007.5.16 Google宣布一項新進展 -- 全域搜尋(或譯為通用搜尋, universal search)的作法,實驗中網頁為Google Experimental Search,可同時查詢不同類型的資源。其中特色包括:查詢結果可選擇以資料年代順序瀏覽(timeline views)或相關地區圖示(map views)、查詢結果畫面的左/右邊欄有導航(提示)選項(Left-hand search navigation, Right-hand contextual search navigation)。不過實驗階段可能限於英文資料(?)。

.Left-hand search navigation左邊欄導航作用
.
雖然這種整合查詢對一般性使用者或許蠻方便的,但也會使網路流量(web traffic)遽增(?)、重要相關資料擠不進查詢結果(顯示)的前10名?這類跨資料庫查詢已不是新鮮事,但重要的是:以更精進的技術如何秀出最相關者(或說more comprehensive and useful),而非更多垃圾。不過我想該注意的是這些發展給圖書館界的啟示是什麼?
.
Google提供簡單的檢索欄位(框) (a simple search box)為檢索起點,接下來則對檢索結果提供許多建議(是經由資料探勘而來),也就是導航。Lorcan Dempsey便提到:由Google採行的方式來看,這已是一種趨勢,圖書館界也正在研究如何更進一步去利用書目資料的組織架構去建立一種導航的關係(faceted browsing, FRBR, ...)。使用者在檢索前不需作複雜的判斷,而是在檢索結果出來後引導使用者再繼續循線查尋。
.
[參考資料]