秋聲 Blog: 四種詮釋資料

2007/05/29

四種詮釋資料

Loran Dempsey的文章Four sources of metadata about things，提到圖書館使用的描述性詮釋資料(descriptive metadata)，依其來源的不同，分為四個種類：professional、contributed、programmatically promoted及intentional metadata，他們不是互相排斥的，問題在如何使他們一起有效地運作。
讀到這篇文章時即順手中譯下來，而編目精靈動作通常更快，已在2007.05.22對這篇文章作了翻譯介紹：四種來源的元數據，譯的簡明扼要，感謝她。不過我仍將自己的文字及由此文章引發的漫想張貼上來，請互相參照吧！

這四種詮釋資料的含義是：

1.專業的詮釋資料(professional)：指圖書館編製的詮釋資料。現面臨的挑戰之一是：在網路環境下，它們的價值無法張顯，仍待繼續努力。

2.使用者貢獻的詮釋資料(contributed)：指近年許多社會性服務網站(如：Flickr、LibraryThing等等)，他們邀請、蒐集及挖掘使用者貢獻的資料，來作(檢索結果)排序、推薦及連結相關資源。他們組織資源的方式創造了另一種價值。例如，OCLC的作者識別檔(WorldCat Identities)，我們也想讓作者自己來評論、補充[資料]。

3.程式產生的詮釋資料(programmatically promoted)：指在處理數位資源時，可由程式自動辨識及產生詮釋資料，也可進一步作資料探勘以辨識其中關係及模式。如Google為書籍所製作的首頁，其中提供的訊息便是對Google Scholar、Google Book Search等作資料探勘而來的。

4.使用者意向相關的詮釋資料 (intentional)：指收集使用者“使用”(use and usage)方面的資料。如網頁排序(pagerank)是收集使用者連結的數據，亞馬遜網路書店的推薦服務是收集購買情形的數據。在各網站分析利用大量性數據資訊以提供用戶有用的路徑時，這類資料已成為核心的要素。

這四種詮釋資料可互相搭配運用。有關這四種方法(approaches)的討論經常是對立不容的。Dempsey認為出發點應是：如何提供使用者更好的服務及哪些方法能支援這樣做，而不是站在某些方法的技術面向上[想問題]。

----------------------------------------------------------------------------------------
為何會形成詮釋資料的多樣性？
在紙本時代，多由資料仲介者(如圖書館)提供使用者(讀者)資源的目錄、銓釋資料，對資源的詮釋是仲介者的觀點，讀者必須自行納入軌道；但在網路、數位時代，或許是科技及人們觀念的轉變(兩者互為因果？)，形成去中心化、個人化(個人空間權力的湧昇)的態勢，個人的發言益受重視，一般大眾都可對資源提出詮釋觀點(賦予標籤tag、一種歸類)。或許未來圖書館的目錄是繽紛大集合(hybrid？)的展現。
這樣就會便於使用嗎？ 是否雜訊太多令人困擾？如何梳理、控制這些大雜燴，讓其互補以發揮更大效用乃是重要課題。

2 則留言:

匿名提到...: 您好我有些問題不太明白想請請教您
(1)professional元數據為何在網路無法章顯呢
不管是書局或是圖書館他的metadata都是靠
opac以網路張顯不是嗎?

(2)使用者意向相關的詮釋資料 (intentional)
網頁排序(pagerank)是收集使用者連結的數據
這邊我看不太懂說，可以給我一個例子嗎
拜託
謝謝; 2007年6月1日晚上11:24:00
匿名提到...: Brom,
我的看法供您參考：
1.圖書館使用的MARC及編目規則…等等並不符合網路的組織架構(web architecture)，因此才有RDA與DC的合作行動(見“RDA新動向”一文)。圖書館OPAC的資料並不一定能在網路搜尋引擎上找得到。
2.Lorcan原文為Pagerank is based on aggregate linking choices. Pagerank是基於使用者選擇連結哪些網頁來演算，可參見Google的簡介：
我們的軟體工具核心是 PageRank(TM)…PageRank 如同個別網頁價值的指示器…簡單來說，Google 說明網頁 A 連結至網頁 B 時，則視為網頁 A 投給網頁 B 一票。當然，Google 會查看票數來源，或是連結網頁接收的票數；同時它也會分析參予投票的網頁。透過「重要的」網頁來參予投票，並且幫助其它的網頁也成為「重要的」網頁資料…。; 2007年6月2日下午3:58:00

張貼留言