2007/05/29

四種詮釋資料

Loran Dempsey的文章Four sources of metadata about things,提到圖書館使用的描述性詮釋資料(descriptive metadata),依其來源的不同,分為四個種類:professional、contributed、programmatically promoted及intentional metadata,他們不是互相排斥的,問題在如何使他們一起有效地運作。
讀到這篇文章時即順手中譯下來,而編目精靈動作通常更快,已在2007.05.22對這篇文章作了翻譯介紹:四種來源的元數據,譯的簡明扼要,感謝她。不過我仍將自己的文字及由此文章引發的漫想張貼上來,請互相參照吧!

這四種詮釋資料的含義是:

1.專業的詮釋資料(professional):指圖書館編製的詮釋資料。現面臨的挑戰之一是:在網路環境下,它們的價值無法張顯,仍待繼續努力。

2.使用者貢獻的詮釋資料(contributed):指近年許多社會性服務網站(如:FlickrLibraryThing等等),他們邀請、蒐集及挖掘使用者貢獻的資料,來作(檢索結果)排序、推薦及連結相關資源。他們組織資源的方式創造了另一種價值。例如,OCLC的作者識別檔(WorldCat Identities),我們也想讓作者自己來評論、補充[資料]。

3.程式產生的詮釋資料(programmatically promoted): 指在處理數位資源時,可由程式自動辨識及產生詮釋資料,也可進一步作資料探勘以辨識其中關係及模式。如Google為書籍所製作的首頁,其中提供的訊息便是對Google Scholar、Google Book Search等作資料探勘而來的。

4.使用者意向相關的詮釋資料 (intentional):指收集使用者“使用”(use and usage)方面的資料。如網頁排序(pagerank)是收集使用者連結的數據,亞馬遜網路書店的推薦服務是收集購買情形的數據。在各網站分析利用大量性數據資訊以提供用戶有用的路徑時,這類資料已成為核心的要素。

這四種詮釋資料可互相搭配運用。有關這四種方法(approaches)的討論經常是對立不容的。Dempsey認為出發點應是:如何提供使用者更好的服務及哪些方法能支援這樣做,而不是站在某些方法的技術面向上[想問題]。

----------------------------------------------------------------------------------------
為何會形成詮釋資料的多樣性?
在紙本時代,多由資料仲介者(如圖書館)提供使用者(讀者)資源的目錄、銓釋資料,對資源的詮釋是仲介者的觀點,讀者必須自行納入軌道;但在網路、數位時代,或許是科技及人們觀念的轉變(兩者互為因果?),形成去中心化、個人化(個人空間權力的湧昇)的態勢,個人的發言益受重視,一般大眾都可對資源提出詮釋觀點(賦予標籤tag、一種歸類)。或許未來圖書館的目錄是繽紛大集合(hybrid?)的展現。
這樣就會便於使用嗎? 是否雜訊太多令人困擾?如何梳理、控制這些大雜燴,讓其互補以發揮更大效用乃是重要課題。

2 則留言:

brom 提到...

您好 我有些問題不太明白 想請請教您
(1)professional元數據為何在網路無法章顯呢
不管是書局或是圖書館他的metadata都是靠
opac以網路張顯不是嗎?

(2)使用者意向相關的詮釋資料 (intentional)
網頁排序(pagerank)是收集使用者連結的數據
這邊 我看不太懂說,可以給我一個例子嗎
拜託
謝謝

Debra 提到...

Brom,
我的看法供您參考:
1.圖書館使用的MARC及編目規則…等等並不符合網路的組織架構(web architecture),因此才有RDA與DC的合作行動(見“RDA新動向”一文)。圖書館OPAC的資料並不一定能在網路搜尋引擎上找得到。
2.Lorcan原文為Pagerank is based on aggregate linking choices. Pagerank是基於使用者選擇連結哪些網頁來演算,可參見Google的簡介:
我們的軟體工具核心是 PageRank(TM)…PageRank 如同個別網頁價值的指示器…簡單來說,Google 說明網頁 A 連結至網頁 B 時,則視為網頁 A 投給網頁 B 一票。當然,Google 會查看票數來源,或是連結網頁接收的票數;同時它也會分析參予投票的網頁。透過「重要的」網頁來參予投票,並且幫助其它的網頁也成為「重要的」網頁資料…。