華文網

管理數字時代:紐約公共圖書館對書籍、圖片等資料進行數位化存取

紐約公共圖書館數字館藏中版權過期的資料,你現在可以下載其高清版本了。

無需許可,沒有條條框框的限制,儘管放心地下載使用吧!——紐約公共圖書館

我曾在2013年2月的《科技縱覽》“咬文嚼字”欄目中提到過“平衡”,這種理念將我們的線下生活與線上生活相分離指責為一種數位二元論。但當涉及虛擬物體和數位資料的區別時,就沒那麼多爭論了。沒錯,同一本書的列印版和電子版包含著同樣的詞彙,但很明顯,對於大部分人(以及越來越多的研究人員)來說,

這兩種形式帶來的閱讀體驗是非常不同的。

我們需要理解這種不同,因為在不遠的將來,這個世界將見證多得多的數位資料,其中包括以電子格式產生的原生數位(born-digital)資料,以及最初以物理實體形式出現、然後進行數位化再生(reborndigital)的原生類比(born-analog)資料。2016年,紐約公共圖書館發佈了超過18萬條數位化資源,並宣佈任何人都可以通過網路無條件地下載。

圖書管理員毫無疑問地將變身為數字管理人(digitalcurators)。過去幾個世紀裡,一直以模擬管理員(analogcurators)身份工作的他們總是會遭到儲藏空間和材料腐朽發黴這樣的實體限制。一種解決辦法是“扔”。在處理館藏中不需要的資料或是重複資料的過程中,圖書管理員和檔案保管員使用了各種各樣有意思的詞語:“除草”和“剔除”通常指丟棄個別資料,而“清洗”“篩選”和“剝離”通常指丟棄多份相關資料。

不過用檔案管理員比較委婉的說法來講,實體資料的主要問題在於它們具有“內在缺陷”:由於材料本身具有某種缺陷(如廉價紙張上存在的木質素會導致紙張變黃),或是材料與周圍環境相互作用的方式(例如紙張受潮發黴會吸引蟲子蛀蝕),它們的品質會隨著時間的推移變得越來越差。

模擬材料的數位化能夠解決這些問題,工程師們正不斷尋找更快速的方法來將原子轉變成比特。

不過,目前我們主要還是依靠掃描人員(scanops)的技術生成這些資料。可掃描人員技術不太熟練的時候,往往會把自己的手指和手掌等身體部位也掃描進去,這種現象被稱為谷歌手(Googlehands)。一些公司利用眾包(crowdsourcing)和遊戲化(gamification)的方式創造一些休閒活動,讓使用者參與到數位化過程中來。與數位化相反的過程也要提一下,否則我就太疏忽了:將數位網路文檔和資料轉換為書籍和雜誌的模式被稱為網頁列印(printedWeb)。

數位化資料在理想情況下是線上的(隨時可獲取),但也可能是離線(不可獲取)或近線(nearline,只能間接獲取)的。它們還可以被稱為完全可以獲取的明檔(lightarchives)、通常情況下無法獲取但可以通過某種方式獲取的暗檔(dimarchives),以及公眾無法企及的黑檔(darkarchives)。

如今,一些資料的數位化使檔案管理員面臨著一個新問題:用於存儲資料的資料結構或媒體最終會因陳舊而被淘汰,導致不得進行格式遷移(formatmigration)或媒體遷移(mediamigration),重新存儲資料。不改變資料格式或媒體類型的資料複製被稱為刷新(refreshing)。

人生導師和自封的專家們的家庭作坊已經大大產業化,他們的急迫和尖銳程度不盡相同,但都建議我們變成數字二元主義者並減少線上時間。對數位化的抨擊已經難覓蹤跡,不過那倒也無妨,因為有像紐約公共圖書館這樣的啟蒙組織帶路,將書籍、圖片以及其他類比資料進行數位化存取只會是件好事。至於紙印,就當沒看見吧。

作者:PaulMcFedries

導致不得進行格式遷移(formatmigration)或媒體遷移(mediamigration),重新存儲資料。不改變資料格式或媒體類型的資料複製被稱為刷新(refreshing)。

人生導師和自封的專家們的家庭作坊已經大大產業化,他們的急迫和尖銳程度不盡相同,但都建議我們變成數字二元主義者並減少線上時間。對數位化的抨擊已經難覓蹤跡,不過那倒也無妨,因為有像紐約公共圖書館這樣的啟蒙組織帶路,將書籍、圖片以及其他類比資料進行數位化存取只會是件好事。至於紙印,就當沒看見吧。

作者:PaulMcFedries