圖書館數(shù)字化內(nèi)容選擇原則闡釋

時間:2022-07-15 06:14:00

導語:圖書館數(shù)字化內(nèi)容選擇原則闡釋一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

圖書館數(shù)字化內(nèi)容選擇原則闡釋

【內(nèi)容提要】內(nèi)容選擇是圖書館信息資源數(shù)字化項目的一個重要步驟。文章在對信息資源數(shù)字化內(nèi)容選擇原因分析的基礎(chǔ)上,闡明了數(shù)字化內(nèi)容選擇應該遵循的基本原則

【摘要題】信息資源建設(shè)與管理

【關(guān)鍵詞】數(shù)字化/信息資源數(shù)字化/數(shù)字化內(nèi)容/圖書館

【正文】

由于計算機技術(shù)、數(shù)字存儲技術(shù)、現(xiàn)代通訊技術(shù)和網(wǎng)絡技術(shù)的飛速發(fā)展及有機結(jié)合,信息存貯和檢索的地理界限已經(jīng)被打破,人們能通過計算機網(wǎng)絡,查詢分布于世界各地的數(shù)據(jù)、圖表、文獻等信息。圖書館作為信息資源的收集、整理、存貯和交流的中心,要改變以往的工作模式,能夠在任何空間、任何時間,準確、快捷地為任何用戶提供所需信息,需要圖書館將自己的信息資源數(shù)字化,由于各圖書館資金有限,不得不對數(shù)字化內(nèi)容進行選擇。圖書館信息資源數(shù)字化內(nèi)容選擇是依據(jù)確定的標準進行相符性判斷,將符合條件的原始資源遴選出來,繼而進行數(shù)字化加工的一個過程。良好的選擇原則有助于確保以盡可能低的成本將最重要和最有用的信息資源進行數(shù)字化,避免知識產(chǎn)權(quán)糾紛,產(chǎn)生良好的社會效益和盡可能高的投資回報。

1進行數(shù)字化內(nèi)容選擇的原因

數(shù)字化內(nèi)容選擇的原因有很多,概括起來主要有:(1)存儲空間的原因。數(shù)字化的產(chǎn)品是通過網(wǎng)絡被廣大用戶存取利用,而大家都知道數(shù)字化產(chǎn)品是存放在磁盤陣列上的,磁盤陣列由服務器來管理,磁盤空間是有限的,服務器的能力也是有限的,不可能無限量地存入數(shù)字資源,這就需要我們對文獻資源數(shù)字化內(nèi)容進行選擇。(2)解決數(shù)字化生產(chǎn)高成本和圖書館經(jīng)費有限性之間矛盾的需要。幾乎沒有圖書館有充足的資源來對整個館藏進行數(shù)字化,內(nèi)容選擇不可避免。(3)數(shù)字資源管理的需要。技術(shù)的快速發(fā)展使數(shù)字化項目所生成的數(shù)字資源的生命周期越來越短,投入巨資進行數(shù)字遷移是延長數(shù)字資源生命的一個重要途徑,昂貴的維護成本就必須考慮數(shù)字化的內(nèi)容選擇。(4)產(chǎn)權(quán)保護的需要。圖書館對絕大多數(shù)館藏都缺乏產(chǎn)權(quán)的擁有,只能選擇那些能夠得到產(chǎn)權(quán)許可的館藏進行數(shù)字化。(5)特殊文獻的考慮。圖書館大都收藏一些對文化倫理乃至民族問題敏感的信息資源,對這些資源進行數(shù)字化就要考慮很多因素。(6)殘缺文獻處理成本的考慮。圖書館館藏文獻中有一部分是殘缺不全的,對這些文獻進行數(shù)字化之前就要進行補缺或作相應的說明,其費用較多。(7)圖書館信譽的需要。圖書館作為責任機構(gòu),要對所數(shù)字化且的信息資源的可靠性和準確性負責。

2高校圖書館數(shù)字化內(nèi)容選擇應遵循的基本原則

不同的數(shù)字化項目其內(nèi)容選擇原則不盡相同,西南政法大學圖書館現(xiàn)在正在籌備兩個數(shù)字化項目:一個是法律古籍的數(shù)字化;另一個是法律經(jīng)典圖書的數(shù)字化。選擇這兩個項目是因為這是一個政法大學的圖書館,它面對的讀者是政法院校的學生,故選擇的內(nèi)容都是法律方面的。重慶大學圖書館選擇的數(shù)字化內(nèi)容主要是理工科類的和建筑類的文獻資源;重慶師范大學選擇的數(shù)字化內(nèi)容是教育類的文獻資源。無論哪個高校在數(shù)字化內(nèi)容選擇的時候都遵循了以下八個原則:

2.1原始文獻知識價值原則

影響原始信息資源的知識價值因素有很多,但主要包括資源的唯一性、相關(guān)價值、對相關(guān)主題領(lǐng)域理解的重要性、對相關(guān)主題領(lǐng)域覆蓋的廣度和深度、實用性和準確度、特定主題領(lǐng)域中其他載體記錄質(zhì)量差的信息內(nèi)容、具有強化項目實施的歷史價值以及數(shù)字化產(chǎn)品潛在的長期價值等。另外,文獻知識價值也可能包括管理價值、藝術(shù)價值、證據(jù)價值和市場價值,文獻知識價值的判斷具有很大程度的主觀性。圖書館不同,對文獻知識價值的判斷也不相同,在國內(nèi),每個高校的圖書館都有自己的基本館情,他們都積極對館內(nèi)自己認為有特色的東西進行數(shù)字化。例如,同樣是法律文獻,在政法院校的圖書館可能認為這些法律文獻是很有價值的,數(shù)字化之后可以給更多學生訪問下載。而法律文獻不是理工科院校的重點,數(shù)字化的意義不大。

2.2知識產(chǎn)權(quán)原則

館藏資源的產(chǎn)權(quán)狀態(tài)識別與數(shù)字化項目實施和數(shù)字資源所在的國家地區(qū)有關(guān),每個國家都有自己的知識產(chǎn)權(quán)保護法律。學者針對圖書館信息資源數(shù)字化項目制訂了產(chǎn)權(quán)狀態(tài)識別模型,比如,美國北卡羅萊納州立大學法律圖書館主任LauraN.Gasaway建立并維護的用于圖書產(chǎn)權(quán)狀態(tài)識別模型;康奈爾大學PeterHitle教授構(gòu)建了用于手稿產(chǎn)權(quán)狀態(tài)的識別模型;印第安納州立大學和得克薩斯州立大學的產(chǎn)權(quán)管理中心也分別提供了圖書館信息資源產(chǎn)權(quán)狀態(tài)識別框架[3,4]。館藏資源的產(chǎn)權(quán)歸屬有四種情況:第一,館藏文獻是通過接收的方式,把原本屬于國家所有的文獻收進館中,這種文獻的所有權(quán)和著作權(quán)都屬于國家所有,圖書館代為行使,在這種情況下圖書館在遵守有關(guān)法律的前提下,有權(quán)根據(jù)需要自主進行數(shù)字化。第二,圖書館通過購買集體或個人所有的受著作權(quán)保護的作品,在這種情況下,如果圖書館沒有購買其著作權(quán),則著作權(quán)仍屬于原所有者,因此圖書館要對此類檔案進行數(shù)字化,必須在征得原所有者的同意,并向其支付一定的報酬后方可進行,否則就構(gòu)成侵權(quán)。第三,館藏中的一些文獻資源是通過受捐贈的方式得來的,這種情況下,捐贈人一般只是將文獻實體所有權(quán)贈給圖書館,自己仍保留著作權(quán),所以在數(shù)字化這類文獻時,與通過購買方式得來的文獻一樣,同樣要征得文獻著作權(quán)人的法定許可,并向其支付一定的報酬后方可進行。但也有在捐贈時,聲明將所有權(quán)和著作權(quán)一并捐贈給圖書館的情況,這種情況除外。第四,一些寄存在圖書館里的文獻資源,寄存只是由圖書館代為保存,不發(fā)生所有權(quán)和著作權(quán)的轉(zhuǎn)移,這種情況下,圖書館在進行數(shù)字化之前,必須征得文獻資源所有者的同意,否則就侵犯文獻所有者的權(quán)益[2]。目前數(shù)字化項目中保護產(chǎn)權(quán)的主要技術(shù)有:對每個數(shù)字圖像添加可視水印或版權(quán)戳;給每個數(shù)字圖像添加不可視水印,這種水印標志可以用來證實數(shù)字圖像的版權(quán)身份,也可用來跟蹤這個數(shù)字圖像在因特網(wǎng)上的傳播軌跡;對數(shù)字圖像加密,并僅把密鑰發(fā)送給注冊用戶,這種方法會限制公共存取;將公共瀏覽的圖像限制在低分辨率;將公共存取限制在截取數(shù)字圖像的一小部分之中,這種方法在一些項目中應用得非常成功;將圖像的瀏覽權(quán)僅限定在一些注冊或被授權(quán)的用戶。

2.3能獲得更多的用戶原則

用戶利用的本質(zhì)就是館藏文獻的利用率,從理論上講,圖書館信息資源數(shù)字化項目應把有限的資金用在利用率高的資源的數(shù)字化上,但一些問題需特別關(guān)注:其一是要對利用率高的文獻的原因進行分析,如果主要用戶群體分布在本地,且類似文獻又不存在,這類文獻的利用率自然可能高,但數(shù)字化后在網(wǎng)絡上,其利用率如何就比較難以判斷,因為這時的用戶就不僅局限于本地了。其二是文獻的利用率有時與文獻的知識價值并不一致,有些具有高知識價值的文獻由于存放地點和圖書館存取方針的限制或目錄的不完整等因素,可能導致利用率偏低,比如說,西南政法大學的法律外文圖書,其實它對讀法律的學生來說是非常有知識價值的,由于這些書經(jīng)濟成本很高,一般每本書就是幾十上百美元,折合人民幣就是幾百上千,為了降低這些圖書的丟失率和預防別人翻版這些外文圖書,以至于這些圖書只能復印,并且不用復印全本圖書。其三是利用率也會與文獻的物理狀態(tài)有關(guān),一些文獻的物理狀態(tài)限制了用戶對其的訪問,比如易碎載體的文獻、古舊的手稿等。如西南政法大學圖書館的法律古籍,許多都是線裝書,并且紙張都已經(jīng)發(fā)黃,很容易被損壞,如果開放由讀者隨意借閱,會使這些珍貴的古籍被損壞,以致消失,這對西南政法大學圖書館乃至整個法律界都是一個不可估量的損失。其四是在多館合作數(shù)字化項目中,一些大部頭的系列文獻分散在各成員單位,對這些文獻的訪問率可能較低,但數(shù)字化后可以形成完整的虛擬館藏,其訪問率可能就會提高。其五是一些技術(shù)因素不應該成為阻止一些文獻數(shù)字化的原因,比如,一些文獻的數(shù)字化文件的格式或像素導致在網(wǎng)上傳播速度慢,乃至用戶難以瀏覽,但網(wǎng)絡技術(shù)的快速發(fā)展(如帶寬的不斷提高)可能在數(shù)字化周期之內(nèi)就能得到解決,另外文獻數(shù)字化后的格式改變也是促進技術(shù)發(fā)展的一個重要動因。

2.4原始文獻存在狀態(tài)原則

在數(shù)字化內(nèi)容選擇過程中,需要考慮的與原始文獻存在狀態(tài)相關(guān)的問題有:原始文獻的存在狀態(tài)是否有利于數(shù)字化?其內(nèi)容是否能被目前的數(shù)字化技術(shù)完全和充分地抓取?物理材質(zhì)和形狀是否會對數(shù)字化過程構(gòu)成障礙?是否有保存良好的替代品(如縮微膠片)?最常見的物理材質(zhì)有一般紙張、牛皮紙、草紙、微縮膠片、光學材料、三維物體、玻璃器皿、記錄音頻的盒帶光盤和磁帶、視頻等。不同物理材質(zhì)的文獻需要不同的技術(shù)進行數(shù)字化,比如,一般紙張可以采用數(shù)字掃描,但三維物體只能采用數(shù)碼拍照。存在狀態(tài)對其內(nèi)容的充分抓取也有重大影響,比如,一般紙張中內(nèi)容的抓取要比草紙充分得多,甚至,有些物理材質(zhì)的內(nèi)容數(shù)字化目前還難以實施。所以,只能選擇那些當前技術(shù)條件下適合于數(shù)字化的載體材質(zhì)館藏資源,載體的物理尺寸也是影響內(nèi)容選擇的一個重要因素。比如,常見掃描設(shè)備對大型地圖和海報進行數(shù)字化很困難,這時,也許對其替代物(如照片)進行掃描是一種較好的選擇[1]。載體的健壯性對數(shù)字化內(nèi)容選擇也會產(chǎn)生影響,比如,一些珍貴或易損的資源需要在特殊環(huán)境中數(shù)字化。牛津大學的“難民研究數(shù)字化項目”和耶魯大學的“開放圖書項目”支持資源載體的拆分,以提高數(shù)字化設(shè)備的吞吐量。健壯性的另一個體現(xiàn)是對數(shù)字化處理的特殊要求,如牛津大學的“塞爾特語和中世紀手抄本數(shù)字化項目”要求設(shè)計一種特殊的保護托架來放置手稿。

2.5對文獻資源進行保存原則

為了保存的需要,數(shù)字化內(nèi)容選擇的原則之一是安全數(shù)字化(safedigitiza2tion),包括原始信息資源的狀態(tài)允許被完全數(shù)字化;數(shù)字化實施過程需要搬運原始資源時,其狀態(tài)適合于搬運;盡可能掃描原始資源的替代品(如照片),從而減少對原始資源的損傷;數(shù)字化的產(chǎn)品必須建檔,并制訂由于時間和技術(shù)變化等因素導致的長期維護策略。數(shù)字保存的另一層含義是保護易碎載體的原始資源,數(shù)字資源的本身就是原始資源的新版本,可以代替原始資源供用戶訪問,并由此減少對原始文獻的操作從而使其得到保護。如對古籍來說,由于它極其容易被損壞,從這個原則上來講它是應該拿來數(shù)字化的,但在數(shù)字化過程中,特別要注意不要將這些珍貴的圖書損壞,這也將對數(shù)字化帶來很多麻煩。

2.6經(jīng)濟效益原則

館藏文獻的數(shù)字化成本受眾多因素影響。分辨率越高的圖像所需的成本也越高,彩色圖像的成本要比黑白圖像的成本高,數(shù)字化生成純文本文件有助于全文檢索,且占用較少的存儲空間,但需要OCR識別,并需要大量的人工校對,如果生成帶標記的文本文件(如XML文件),雖然有助于各種分析乃至納入數(shù)據(jù)庫管理,但成本必然增加。成本也取決于數(shù)字化過程,比如,單頁掃描比裝訂在一起掃描成本要低,保存狀態(tài)良好的資源掃描要比保存狀態(tài)差的資源掃描所需成本要低,因為后者需要更多的人工處理。從效益角度看,受益最大的是用戶。另外,數(shù)字化也便于圖書館管理人員對館藏資源的管理,并能更高效地提供服務,盡可能提高成本效益是數(shù)字化內(nèi)容選擇的宗旨。實現(xiàn)相同功能而采用不同方法的成本會有所不同,比如,數(shù)字化生成文本文件與生成圖像文件,后者加入元數(shù)據(jù)與圖像文件鏈接,兩種方法得到的效果可能差不多,但很明顯后者的成本要低些。另外,規(guī)模很大的項目單件數(shù)字化成本要低,長期保存的費用也會降低。

2.7避免重復數(shù)字化原則

對于已有數(shù)字化版本的館藏避免再次數(shù)字化是目前內(nèi)容選擇的一個基本原則。目前,都覺得數(shù)字圖書館有利可圖,于是國家圖書館、各地區(qū)各行業(yè)圖書館甚至是一些企業(yè),都一哄而上,從自身利益出發(fā),紛紛建立自己的數(shù)據(jù)系統(tǒng),在內(nèi)容上缺乏明確的分工,相互之間在技術(shù)上、數(shù)據(jù)格式和標準并不兼容,往往好大喜功,力圖“最大”、“最全”,無法實現(xiàn)資源共享,實際上形成一種“信息割據(jù)”的局面[5]。但要考慮已有數(shù)字化版本的質(zhì)量、記錄狀況和功能是否能夠滿足用戶的需要,以及獲取數(shù)字化版本的條件,甚至還要評估獲取數(shù)字化版本與重新數(shù)字化兩者所需費用。一般來講,自己再數(shù)字化的成本要比獲取數(shù)字化版本的費用要高,如果我們確實需要這部分數(shù)字化資源,我們可以向這部分數(shù)字化資源的所有者購買使用權(quán)。這樣就可以節(jié)省自己圖書館的開支,也達到了目的。在其它條件都允許的情況下,最好不要重復數(shù)字化,因為重復數(shù)字化,是對金錢、時間、人力、物力的一種浪費。

2.8技術(shù)條件限制原則

數(shù)字化內(nèi)容選擇將受現(xiàn)有技術(shù)條件的限制,我們在選擇數(shù)字化內(nèi)容的時候必須要考慮現(xiàn)在的技術(shù)是不是能夠順利地把這個內(nèi)容數(shù)字化。考慮的主要因素有:數(shù)字化過程中對原始資料識別技術(shù)方面的問題,會導致數(shù)字技術(shù)生成的文獻數(shù)字版與原始文獻包含信息相比出錯率很大;數(shù)字資源顯示在用戶終端的質(zhì)量;圖書館支持的現(xiàn)行平臺和網(wǎng)絡環(huán)境對數(shù)字資源的存取能力;數(shù)字資源網(wǎng)絡傳播速度的合理性;對未來用戶使用先進設(shè)備的預測,以免日后需重新掃描;搜索引擎對圖書館數(shù)字資源的索引能力。另外,還要考慮一些特殊資源數(shù)字化的技術(shù)可行性,如,需要超高分辨率的文獻資源、顏色至關(guān)重要的原始資源、超大尺寸的資源、三維形態(tài)的資源以及易讀性很差的資源載體等。

圖書館在進行數(shù)字化內(nèi)容選擇的時候,只有滿足了以上的原則,數(shù)字化才有價值,才能給圖書館和讀者都帶來好處。

【參考文獻】

[1]臧國全.圖書館信息資源數(shù)字化內(nèi)容選擇原則研究.圖書情報知識,2006(1):21-24

[2]向立文.檔案數(shù)字化建設(shè)中若干問題的研究.湘潭大學碩士學位論文,2004

[3]CopyrightManagementCenter.[2005-07-30].www.copyright.iupui.edu/

[4]CopyrightCrashCourse.[2005-07-30].www.copyright.iupui.edu/

[5]陸娜,李綱.論我國數(shù)字信息資源建設(shè).情報科學,2006(2):204-205

a