2006/12/05

聽Google Books演講

95.11.28下午前去聽了簡立峰所長的一場演講,講題為:「第一次面對Google從數位出版到數位圖書館的連鎖效應」,紙本的資料題目為:“Google Books and Its Impacts”。此演講為「數位出版的關鍵契機」系列講座之一,由北市出版商業同業公會及聯合線上、UDN數位閱讀網等單位舉辦。因此較偏重Google 與出版品數位化及與出版商的關係。這場演講與其95.9.30的另場演講“數位閱讀與Google”(註1)大致相同,亦可參閱 Snowred.tw's watching之報導文章(註2)

[演講紀要]
演講之 Outline:(據會場所發紙本資料)
-----------------------------------------------------------

Google Today
Google's Strength
-- Infrastructure
-- Business Model
Google Books
Potential Impact


-----------------------------------------------------------

解說 (斜體字部份 錄自講者之紙本資料)

I. Google Today

Google其實是家硬體公司,而非軟體公司 [如此全球化的服務是靠其硬體支撐]

Google Today Metrics (現況)
至2006.9.30 Google 員工為9,378 人;在世界各地有超過 20 個銷售及工程辦公處;有 109 種語言界面及 113 個國際性網域(domains) …
Google’s Mission (目標):Organize the word's information and make it universally accessible and useful (組織世界的資訊且讓世界上都可取得及有用處)
另Google的信條 --“do no evil”(不作惡)極為重要
Connecting users, advertisers, publishers (連接使用者、廣告商及出版者)
Family of Products (Google 的各項產品) (可至Google主頁點選 Google.com in English,再選上方列的more >> even mor 可見約有39項產品或見註1 的p.10~12圖示)

II. Google Infrastructure

Google's explosive computational requirements
Google每項應用(applications)在使用者、資料量及品質方面都有極大的成長及規模(有爆炸性電腦科技的需求)(見註1 的p.6圖示,如下圖)


It's Not Just About Search … (不僅僅是搜尋,Google還有下列領域的專家 – 除了資料結構、運算法、程式開發外,還有硬體、機械工程、網路、統計、資訊檢索、人工智慧、使用界面、產品設計 … 等等)
Google Query Seving Infrasturcture (分散式搜尋架構,可見註1 的p.9圖示)

III. Google Books (Google圖書搜尋)

很明確的宗旨:
Google圖書搜尋(Google Book Search) 提供技術平台,幫助出版社推廣圖書
Google不創作圖書內容,Google只為出版社推廣圖書內容
出版社可完全控制自己的內容,選擇參與的圖書,任何時間都可以增加/刪除圖書
Google圖書搜尋“非排它”
Google不期望“擁有”版權,只希望將圖書電子化,使讀者通過Google找到圖書


Google Books 已推出七個月,現已與超過一萬家出版社合作;Google以OCR掃描書籍內容(將影像檔與文字檔並存),並不向出版社收費;至於利潤源自附帶性(出現在邊欄)的廣告收益,Google是與出版社分享(即Google的business model?)
Google Books 的中文版已快要推出,目前負責該業務的工作人員僅一人(在上海),故與出版社洽談的進行較慢。

IV. Potential Impacts (潛在之衝擊)

對出版社之衝擊:一旦出版社與Google合作,出版社可能要調整哪些圖書需要數位化、注意書名的用字(因為這些都關係到線上檢索) … 出版社本身的物流及金流系統(如e-commerce等)都需配套

[感想]

Google Books 計劃包括兩大部份(註3):
一是與出版社合作(Google Books Partner Program – an online book marketing program),
另一與圖書館合作(Google Books Library Project – an enhanced card catalog of the world's books),
因此Google的雄圖可謂宏大。對使用者而言也的確如此,要先讓他能找到想要的東西,之後再提供他有哪些可取得東西的途徑,Google只管最前端與使用者的介面,至於其後面的構築便是書籍銷售或非營利圖書館的系統(又以OCLC的WorldCat為主架)了。這就是Google一直重申的--他們不做內容方面的事,只管搜尋面的事。
當然其中書籍的版權(著作權)問題是Google現今只能走到這步的重要關鍵,Google Books Library Project 簡介中已提到 -- 當一本書版權不存在時,你可以下載整本書 (If the book is out of copyright, you'll be able to view and download the entire book)。另亦提到此計畫的目的是 (What's the goal of this project?) The Library Project's aim is simple: make it easier for people to find relevant books – specifically, books they wouldn't find any other way such as those that are out of print – while carefully respecting authors' and publishers' copyrights. Our ultimate goal is to work with publishers and libraries to create a comprehensive, searchable, virtual card catalog of all books in all languages that helps users discover new books and publishers discover new readers.
目前加入合作的圖書館有最近加入的美國維吉尼亞大學圖書館等九所圖書館

已往圖書館站在面對使用者前端的態勢已漸漸改變,這無非是資訊查尋整合化及全球化趨勢使然(是社會變動的現象之一吧?),單一圖書館實無能力如OCLC或Google般勢力強大、提供出那般服務。Google不僅衝擊出版業及圖書館界(註4) ,亦衝擊學術文獻資料庫供應商(註5)。Google副總裁李開復亦提到“Google使命并不是搜索,而是对于信息的整合。让全球的信息人人可用,人人受益”。(註6) Google Books或許將來會與 Google Scholar(Google學術搜尋) 作更佳的整合吧?!

另外讓人思索的是:搜尋引擎對資訊的處理及檢索方式對傳統圖書館資訊組織方式的影響,搜尋引擎背後運用的運算法及涉及IR科技(語言及知識體系面)日漸成熟後是否可取代(部份)現行圖資界人力密集的metadata類的編製工作?

註1:未來發生堂辦的研討會,其中簡所長的投影片(pdf檔)。
註2:Snowred.tw的文章“簡立峰談數位閱讀與Google”。
註3:“About Google Book Search
註4:歐洲圖書館界有反制措施,已建立其 The European Library 聯合目錄 (參見EDL計畫)。法國圖書館館長曾提到“圖書數位化是一個非常重大的文化事業,它不能靠一個私有企業(指google公司)去承擔 … 對google公司此舉可能造成的文化壟斷表示擔憂…”,參見新聞1新聞2
註5:資料庫廠商 ProQuest 曾作出此回應:“Google對資訊供應的影響與衝擊”(ProQuest’s Yamashita) (PQDD研討會)
註6:“李开复叫不惯谷歌?称Google使命不在于搜索

Reading More ...
1. Google Library /Google Book Search -- 一些反應與思考(黃鴻珠) 淡江大學圖書館電子報 no.1
2. 數位典藏國家型科技計畫-訓練推廣分項計畫-專業培訓課程 -關於「文件資料檢索與應用」或「資訊儲存與檢索」等課程(簡立峰、鄭卜壬等老師主講)

2 則留言:

匿名 提到...

真的覺得你寫的太好了
還附了很多的相關資料
十分喜歡也很感謝
謝謝

Debra 提到...

謝謝您,請繼續指教.