千文網(wǎng)小編為你整理了多篇相關的《綜合檔案館檔案資源建設的重點和難點問題(大全)》,但愿對你工作學習有幫助,當然你在千文網(wǎng)還可以找到更多《綜合檔案館檔案資源建設的重點和難點問題(大全)》。
第一篇:數(shù)字檔案館建設面臨的難題
數(shù)字檔案館建設面臨的難題
來源:bet365 http://www.xiexiebang.com
【內(nèi)容提要】數(shù)字檔案館是數(shù)字信息時代檔案傳遞和利用的新途徑。數(shù)字檔案館與傳統(tǒng)檔案館相比有著極大的優(yōu)越性,然而它也存在著不少缺陷。在數(shù)字檔案館的建設中面臨著諸多不容樂觀難以解決的問題,對此我們要有清醒的認識。本文提出了數(shù)字檔案館建設所面臨的10個方面的問題。
【關 鍵 詞】數(shù)字檔案館/問題
【 正 文】
隨著現(xiàn)代信息技術的迅速發(fā)展和大量電子文件的產(chǎn)生,數(shù)字檔案館的研究和建設成為我國檔案界關注的熱點。數(shù)字檔案館與傳統(tǒng)檔案館相比,有著豐富的數(shù)字化資源、海量的存儲、便捷的檢索、快速的傳輸、高度的開放、信息的共享等優(yōu)點,使傳統(tǒng)的檔案館望塵莫及。然而,它也不可避免地存在一些缺陷和不足,有的甚至可能是致命的缺陷。因此,我們應該清醒地認識到數(shù)字檔案館存在的缺陷,數(shù)字檔案館的建設還存在著諸多的難點和問題亟待深入研究解決。如果對存在的問題視而不見,或掉以輕心,必將給未來的檔案事業(yè)留下巨大而無法彌補的遺憾。數(shù)字檔案的憑證價值問題
檔案的基本價值有兩方面,憑證價值和參考價值,而尤以憑證價值最為重要,雖然,“目前人們對數(shù)字化檔案具有參考價值這一點已無疑義,然而,由于一系列技術和立法問題還未解決,數(shù)字化檔案目前還不具備法律憑證效力”[1]這無疑使數(shù)字檔案的作用大打折扣。因此,確認數(shù)字檔案的憑證價值就成為數(shù)字檔案館建設中無法回避的難題。目前,主要存在以下幾方面的問題:
1.1 認識上的問題。數(shù)字檔案不具備“白紙黑字”的直觀性,必須依賴特定的計算機設備加以解讀。數(shù)字檔案完全脫離了以往人人對檔案“原件”的認識,從而引起人們對其原始性、可靠性的懷疑。而且,有些數(shù)字檔案即使載體保存完好,內(nèi)容亦可能在無形中丟失,它不像紙質檔案那樣載體與內(nèi)容“一損俱損,一榮俱榮”。數(shù)字檔案與以往其他載體的檔案都不一樣,從甲骨檔案到簡牘檔案再到紙質檔案,只是載體的耐久性有差別,并沒有改變其直觀性,而數(shù)字檔案的非人工識讀性與其他載體的檔案有著質的區(qū)別。要確認數(shù)字檔案的憑證價值,恐怕不僅僅是改變觀念的問題,要真正認識數(shù)字檔案,確認其憑證價值,可能還需要走很長的路。
1.2 技術上的問題。數(shù)字檔案是高新技術的產(chǎn)物,它給人們帶來極大便利的同時,也給人們留下了困惑與難題。其一,數(shù)字檔案具有易復制、修改、刪除的特點,使得檔案“原件”的概念變得難以確認。其二,計算機硬、軟件技術不斷更新?lián)Q代,迫使數(shù)字檔案必須不斷適應新的“生存環(huán)境”,不斷地變換載體、格式,因而無法通過載體、格式的鑒定來判定其原始性。其三,數(shù)字檔案不再具有特定的字跡,人們可以根據(jù)需要以不同的字體、字號將其輸出,傳統(tǒng)的字跡鑒定技術無法分辨數(shù)字檔案的原始性。其四,數(shù)字檔案對背景信息和元數(shù)據(jù)具有很強的依賴性。“電子文件的背景信息常常與文件內(nèi)容信息相分離保存,一旦失去背景信息,文件的內(nèi)容即便仍有意義,但也不再具有憑證價值。元數(shù)據(jù)是電子文件、電子檔案所特有的,“元數(shù)據(jù)由于其隱含性而易被忽視,而元數(shù)據(jù)一旦丟失或破壞,電子文件的原始性就會改變?!盵2]
1.3 管理制度上的問題?!皞鹘y(tǒng)檔案之所以具有憑證價值,在一定程度上取決于嚴格的管理制度”,而目前“從電子文件的生成到歸檔都缺乏十分規(guī)范的程序化管理,缺乏嚴格而科學的標準體系和業(yè)務管理制度,一些標準、制度雖已制定,但全面推行尚需時日”[3]而且也有一定的難度。數(shù)字檔案信息的長期存取問題
數(shù)字檔案信息的長期存取問題是數(shù)字檔案館建設的一個具體而又棘手的難題?!皳?jù)報道,美國航空航天局在20年前發(fā)射的‘海盜’號火星探測器上的計算機中,已經(jīng)有20%的數(shù)據(jù)完全丟失,還有大約4000卷的統(tǒng)計數(shù)據(jù)因存儲的格式模糊無法讀出,程序員也無法保證將其恢復”。[4]數(shù)字檔案信息長期存取所面臨的主要問題有:
2.1 存儲的介質材料?!艾F(xiàn)代介質的存儲設備還不可能解決計算機數(shù)據(jù)存儲問題”。[5]一般說來,磁盤的壽命是3~5年,光盤也不過30年左右,與能保存千年以上的紙質載體相比,其壽命相差甚遠,而且它還要受到溫度、磁場、記錄存儲格式、硬件配置等多方面的影響,10年前還經(jīng)常使用的5.25英寸的軟盤,現(xiàn)在已經(jīng)沒有一臺普通電腦可以讀出來。
2.2 機讀語言格式?!坝嬎銠C語言平均每三個月就會問世一種,而語言之間的互換大部分存在問題。很難想象,若干年以后,我們用現(xiàn)行的機器語言描述的數(shù)據(jù),還能百分之百的還原”。[6]
2.3 對設備的依賴。數(shù)字檔案必須依賴于計算機設備才能讀出,這個特征對其長期存取帶來很多問題:“如設備發(fā)生故障、系統(tǒng)癱瘓,電子文件就讀不出來;電子文件對其它設備環(huán)境的不兼容性,使其只能在某種設備上處理,而不能在其它設備上處理;不同軟件環(huán)境形成的電子文件存貯在載體上,有時難以互換;電子文件加密后,不解密就無法識別;技術設備更新時,不及時解決格式轉換問題,也無法讀取等等”。[7]
數(shù)字檔案的失真問題
“檔案數(shù)字化工作的生命線在于其能夠保持檔案原貌”。[8]然而,“就目前的研究水平而言,還難以保質保量地完成館藏檔案數(shù)字化的任務。如已研制出的OCR掃描輸入技術,其平均識別率是95%。這對于追求最大程度真實性的檔案來說無疑是致命弱點”。[9]數(shù)字化的主要方式是掃描加工,在這一過程中造成數(shù)字檔案失真的原因還有以下幾個方面:其一,技術參數(shù)選擇不當。針對不同色調(diào)、紙質和字跡,有時需調(diào)整不同的技術參數(shù),如分辨率、明暗度、對比度等,選擇不當會直接影響掃描的質量,造成信息丟失、圖像模糊或產(chǎn)生額外信息,客觀上造成檔案原貌的改變。其二,工作失誤。檔案掃描是大量的重復勞動,難免有時失誤。如掃錯檔案或打錯順序,或存錯,或在建索引時鏈接錯誤等,如不及時發(fā)現(xiàn),將直接導致數(shù)字化檔案失真。其三,轉換過程中的失真。在進行數(shù)字檔案的遷移或在提供利用時,往往需要將掃描后形成的圖像文件轉換成另一種格式的文件,如果格式選擇不當,同樣會導致數(shù)據(jù)發(fā)生變化。數(shù)字檔案信息的安全問題
安全問題是計算機網(wǎng)絡世界最為頭痛的難題,也是數(shù)字檔案館中的重大難題之一。數(shù)字檔案館雖然被稱之為“館”,但它的存在更仿佛是一個巨大的沒有警察的自由市場,給不法分子帶來可乘之機,主要表現(xiàn)為:其一,計算機病毒。網(wǎng)絡信息安全的最主要的敵人就是計算機病毒?!皣庥腥斯烙?,現(xiàn)在計算機病毒的傳染每兩個月增加1倍。網(wǎng)絡病毒的泛濫已對計算機網(wǎng)絡系統(tǒng)構成嚴重的威脅”。[10]其二,計算機黑客。由于網(wǎng)絡的加密性和匿名性,使入侵者難以被發(fā)現(xiàn)。黑客對信息資源的攻擊,不僅僅是好奇和自我挑戰(zhàn),程序設計高手可以篡改系統(tǒng)控制參數(shù)。其三,有竊取行為的間諜活動,窺視其機密信息進行復制或擴散。其四,有意破壞,摧毀系統(tǒng)的信息處理功能或破壞電子通訊裝置。其五,人為或偶然事故造成的威脅。如工作人員操作失誤而產(chǎn)生的不可預知的事件、網(wǎng)絡系統(tǒng)軟件硬件的故障、電子系統(tǒng)故障引發(fā)的系統(tǒng)問題等,所有這些,都使數(shù)字檔案信息的安全變得十分“脆弱”。
數(shù)字檔案館建設的諸多技術問題
數(shù)字檔案館完全是高新技術、電子設備和計算機網(wǎng)絡技術支撐起來的產(chǎn)物,離開了高新技術的支撐,就沒有了數(shù)字檔案館。但是高新技術也給數(shù)字檔案館帶來了致命的弱點,真是“成也蕭何,敗也蕭何”。諸多的技術問題成為制約數(shù)字檔案館建設的難點。
5.1 數(shù)字化設備技術條件。網(wǎng)絡系統(tǒng)中的硬件技術之一是必須有足夠的帶寬,以保證快捷地傳輸文本、語音、圖像、影像檔案,以便實現(xiàn)多網(wǎng)互連、高速互訪,實現(xiàn)跨平臺、跨系統(tǒng)、跨語種的互相轉換和鏈接。毫無疑問,足夠的帶寬條件和用戶對網(wǎng)絡信息傳輸?shù)男枨髮⒁恢笔且粚γ荏w。
5.2 技術難題。數(shù)字檔案館是以信息源、網(wǎng)絡、數(shù)據(jù)庫為基礎的,其相關技術是較復雜較先進并且不斷發(fā)展的,它幾乎囊括了計算機網(wǎng)絡技術所需要解決的所有問題,技術密集。如數(shù)字化圖像的存儲與壓縮、數(shù)據(jù)組織技術、信息檢索技術、多語言平臺互換互訪技術、海量信息存儲與調(diào)配技術等,既是計算機網(wǎng)絡技術的難關,也是制約數(shù)字檔案館建設發(fā)展的難題。此外,“數(shù)字檔案館的建設和運行需要解決一些特殊問題,為此必須開發(fā)應用一系列新技術,如:身份認定、智能檢索、信息隱蔽、數(shù)字水印、電子簽章、操作跟蹤、信息加密等,其中有很多技術有創(chuàng)新性”。[11]這些技術也都是不容易解決的問題。
5.3 技術過時問題。在飛速發(fā)展的IT業(yè)中,電腦硬件、操作系統(tǒng)、應用軟件及存儲載體等不斷地被新產(chǎn)品所替代,IT產(chǎn)品是真正的“短命鬼”。雖然絕大多數(shù)新產(chǎn)品承諾向下兼容,但其兼容的“代”數(shù)在跨越若干年后,舊的數(shù)字信息就很難被新的硬件設備和軟件系統(tǒng)讀出?!凹夹g過時”的陰影一直會籠罩著數(shù)字信息。專家們提出的解決方案是數(shù)據(jù)遷移,但遷移卻存在著一個致命弱點,就是每次遷移總會丟失一定的相關信息,這些丟失的信息積累起來會造成數(shù)字檔案信息無法準確恢復原貌。數(shù)字檔案館建設的標準化問題
數(shù)字檔案館建設的目的是要使地區(qū)檔案館、全國檔案館乃至全世界的檔案館連成一個整體,以實現(xiàn)檔案信息資源共享。這個整體性的數(shù)字檔案館事實上是一種基于網(wǎng)絡環(huán)境下的數(shù)字化檔案信息資源共享的社會檔案館系統(tǒng),是一個面向對象的分布式的網(wǎng)狀結構模式,是由一個個相對獨立的數(shù)字檔案館實體組成的。要對這分散在各地的數(shù)字檔案信息資源進行組織控制,就必須要有彼此兼容的硬件環(huán)境,要有一致的文件格式、統(tǒng)一的著錄標引標準、數(shù)據(jù)描述標準、元數(shù)據(jù)標準、全文數(shù)據(jù)庫標準等等,這些標準也僅僅是幾個主要的標準?!岸鴮嶋H上,在數(shù)字檔案館建設中,標準化是一個體系,是一個系統(tǒng),因此對于我們來說,如何結合我國實際,迅速建立起一個適合我國數(shù)字檔案館建設的標準化體系是擺在我們面前的一個迫切需要解決的新問題”。[12]然而,要解決這個問題并不容易,我們面臨著很多問題:其一,一個嚴峻的事實是我國檔案信息系統(tǒng)沒有相應的具體標準可遵循;其二,有些標準規(guī)范要超出檔案工作的范圍,如綜合數(shù)據(jù)處理格式就需滿足跨行業(yè)、跨部門的要求。如何統(tǒng)一是一個很麻煩的問題;其三,與整個檔案工作的標準相銜接的問題;其四,與國際通用標準的接軌問題;其五,由于計算機技術更新速度非??欤看渭夹g設備的更新,都會對原標準產(chǎn)生相應的影響,因而必須不斷適時修訂標準。
數(shù)字檔案館建設的投入與產(chǎn)出問題
數(shù)字檔案館建設存在著投入與產(chǎn)出不協(xié)調(diào)的問題。如果我們把數(shù)字檔案館與數(shù)字圖書館作比較,會對這個問題看得更清楚。數(shù)字檔案館建設投入的費用是巨大的,而且它的建設費用要遠遠高于數(shù)字圖書館的建設費用。由于圖書有復本,許多圖書館保存的圖書都一樣。因而國家圖書館和省市圖書館的部分圖書數(shù)字化后,其他圖書館特別是中小型圖書館完全可以坐享其成,不必再花費資金重復建設。而檔案館則不行,全國各個檔案館保存的檔案幾乎都是孤本,因而檔案館在用于檔案數(shù)字化的費用上要比圖書館多,如,僅檔案館進行數(shù)字化檔案目錄的“工作量約是圖書館的35倍”。[13]但是檔案館的利用人次與圖書館讀者的人數(shù)相比卻少得多,“以北京市檔案館和國家
圖書館(原北京圖書館)為例,前者年利用人次約四五千人,后者一年的讀者數(shù)不少于二百萬人”。[14]兩者相差400倍?!凹词挂?、二史館和中央檔案館三個國家檔案館的年平均利用人次也不過5960人次”,[15]三個館加起來與國家圖書館相比仍相差100多倍。檔案館的利用長期處于低谷已是不爭的事實,就是建成數(shù)字檔案館后,這種情況也不會改變多少,因為檔案信息有保密和時效的限制,有利用者的限制,并不會增加太多的利用者,更不可能趕上數(shù)字圖書館的讀者人數(shù)。事實上,傳統(tǒng)檔案館本來就存在著投入與產(chǎn)出不協(xié)調(diào)的問題,只不過未引起人們的關注,但是,數(shù)字檔案館的建設卻拉大了這種不協(xié)調(diào)的距離,使這個問題凸現(xiàn)出來。它也成為擺在數(shù)字檔案館建設面前很難解決的問題。數(shù)字檔案中的經(jīng)濟問題
與其說數(shù)字檔案館是高新技術支撐起來的,不如更實際地說是由巨額資金支撐起來的,因為所有的高新技術和設備都將由資金來兌現(xiàn)。數(shù)字檔案館的建設與利用,不論對于檔案部門還是利用者,都有很重的經(jīng)濟負擔,經(jīng)濟問題可能是困擾數(shù)字檔案館建設的根本性難題之一。
8.1 檔案部門方面的問題。
8.1.1 數(shù)字檔案館建設的費用問題。數(shù)字檔案館的建設費用是巨大的,開發(fā)一個稍具規(guī)模的數(shù)字檔案館系統(tǒng),不論是購買軟件和硬件,還是開發(fā)專用軟件,還是館藏檔案的數(shù)字化工作,都需要花費可觀的人力、財力和時間,這些都需要有強大的經(jīng)濟實力做后盾。而數(shù)字檔案館的建設說到底,仍是以政府投入為主。但國家的綜合國力不可能在短期內(nèi)發(fā)展到較高的水平。因此,資金短缺是建設數(shù)字檔案館的最不好解決的難題。檔案館是公益性和社會性的部門,也不能走“以文養(yǎng)文”、“以館建館”之路,即便是想走此路也走不通,正如上文所述的數(shù)字檔案館存在著投入與產(chǎn)出的巨大反差,即使對利用者收費,數(shù)字檔案館也根本不可能收回投資成本。數(shù)字檔案館建設的巨額費用對于本來就經(jīng)費緊張的檔案部門來說是有相當難度的。而對中西部欠發(fā)達地區(qū)的大部分市、縣檔案館來說,連維持日常工作的經(jīng)費都成問題,建設數(shù)字檔案館恐怕在相當長的時間內(nèi)都是可望而不可及的。
8.1.2 數(shù)字檔案館的使用和維護費用問題。雖然數(shù)字檔案館的建設費用巨大,但它并不是一勞永逸的。它的維護和使用的費用并不少于初建的費用。數(shù)字檔案館就像一個“無底洞”,需要不斷地投入大量資金來維持其正常運轉。
8.1.2.1 平時正常的使用和維護費用。數(shù)字檔案館是靠技術支撐起來的,平時正常的使用和維護也需要很大一筆資金才能維持,如通信費、數(shù)據(jù)使用費和設備維護費等都需要不斷地支出,且費用不低。
8.1.2.2 設備更新費用?,F(xiàn)代信息處理技術發(fā)展迅猛,其軟硬件更新非常快,而在市場經(jīng)濟利益的強大動因驅使下,更加快了這種更新速度,“錄制、存貯信息的設備、方法及軟件隨著新產(chǎn)品、新方法的問世,正以5-9年的周期更新,新產(chǎn)品、新方法的不斷問世,必將導致原有設備及軟件的淘汰”[16]。數(shù)字檔案館要維持正常使用,也必須不斷地更新設備和軟件,但要更新設備和軟件,卻又要花費大量的資金,而且是每隔幾年就要又投入一次。
8.1.2.3 數(shù)字檔案信息長期存取使用的費用。正如上文所述數(shù)字檔案信息長期存取是數(shù)字檔案館的一個具體而棘手的難題。而數(shù)字檔案館又必須使用數(shù)字檔案信息,專家們給出了一個不得已而為之的方案,就是不斷地使數(shù)字檔案信息遷移轉錄。但是遷移轉錄的費用是相當可觀的和不可預知的。一般檔案館能否承受這不斷遷移轉錄所需的費用,也是一個既不可預見又不容易解決的難題。
8.1.3 向利用者收取數(shù)字檔案信息利用費的問題。檔案法規(guī)規(guī)定檔案館向社會提供利用檔案,可以收取費用。數(shù)字檔案館建設投資大,收取一定的費用也是應該的。但是,如何制定收取利用費的收費制度,如標準、數(shù)量、繳納程序等,也是數(shù)字檔案館建設的難題之一。
8.2 利用者方面的問題。利用者的經(jīng)濟承受能力,也是影響和制約.數(shù)字檔案館建設發(fā)展的問題之一。數(shù)字檔案館需上網(wǎng)閱覽,從目前我國上網(wǎng)所需資費來看,每小時的費用是發(fā)達國家的10多倍,而用戶的平均收入又低于發(fā)達國家的若干倍。我國80-90%的用戶認為網(wǎng)絡收費過高,通信費難以承受。再一點是下載檔案信息的打印費用,盡管并不是要將所有下載的檔案信息打印出來,就是部分打印也需要承受可觀的打印費。如果再加上數(shù)字檔案信息使用費,這些費用加在一起,將會相當高。必將影響利用者對數(shù)字檔案館的使用,也將使數(shù)字檔案館的建設失去應有的作用和意義; 數(shù)字檔案館法律法規(guī)方面的問題
數(shù)字檔案館建設中會涉及到許多法律問題,而這些法律問題恰恰又是亟待解決而又難以一時解決的問題。
9.1 檔案法規(guī)方面的問題。面對數(shù)字檔案館產(chǎn)生的新情況、新特點.檔案法規(guī)中的一些內(nèi)容已不適應,而要解決起來仍有一定的難度。如對利用者的身份認證問題,在網(wǎng)上進行借閱限定和身份認證不僅增加技術難度,而且還要增加開支。而對外國利用者來說,由于限制得更嚴格,在網(wǎng)上操作更加困難。數(shù)字檔案館是開放的,是不受國界限制的,數(shù)字檔案館建設的初衷就是實現(xiàn)檔案信息的社會共享。但如果取消身份認證,那么就等于中外利用者都一樣沒有限制。因此,真要修改完善檔案法規(guī),兼顧到方方面面,還是有相當?shù)碾y度。
9.2 著作權、知識產(chǎn)權、隱私權的保護問題。在數(shù)字檔案館的環(huán)境下,由于檔案信息通過網(wǎng)絡進行傳遞,它極容易被獲取、被復制、被傳播,對利用者控制的難度加大。原來意義上的著作權、知識產(chǎn)權、隱私權的保護方式對權利人已無法提供有效的保護,著作權、知識產(chǎn)權和隱私權很容易被侵犯。因此,如何對檔案著作權、知識產(chǎn)權和隱私權進行有效保護成為數(shù)字檔案館建設面臨的一大挑戰(zhàn)。從技術上說,真正切實可行的保護技術,目前尚屬于極其薄弱的環(huán)節(jié)。從完善相應法律法規(guī)方面說,目前進展緩慢,尚有許多難題不易解決。
9.3 數(shù)字檔案的法律效用問題。對于數(shù)字檔案的法律效用問題,它是數(shù)字檔案館建設中一個不能回避的特殊難題。要想讓它得到法律的認可,恐怕還需要相當長的時間。而“如果電子檔案的法律憑證問題得不到解決,數(shù)字檔案館的數(shù)字化館藏也就失去了利用的價值、存在的意義”。[17]
數(shù)字檔案館的基礎理論問題
數(shù)字檔案館的建設必然要受到數(shù)字檔案館理論研究的影響和指導。目前,對數(shù)字檔案館的研究還處于起步階段,許多認識不相同,統(tǒng)一尚需時日。而且有關數(shù)字檔案館的一些基礎理論問題,都是一些不易解決的難題。
10.1 數(shù)字檔案館的概念問題。自從數(shù)字檔案館概念出現(xiàn)以來,“關于數(shù)字檔案館的認識并不統(tǒng)一,其定義就有數(shù)十種之多,勢必會造成對數(shù)字檔案館建設方向把握上的不一致”。[18]觀點不一樣,建設的數(shù)字檔案館就不一樣,建設的難易程度、工作流程、服務功能、配套措施、系統(tǒng)邊界和社會影響等等也都會截然不同”。[19]而統(tǒng)一認識或基本統(tǒng)一認識都非一日之功。但這個問題不解決,將對數(shù)字檔案館的實踐產(chǎn)生不利影響。
10.2 數(shù)字檔案館的系統(tǒng)邊界問題?!皵?shù)字檔案館支持以網(wǎng)絡連接的相關檔案部門的數(shù)字化館藏,能夠提供分布于不同地區(qū)的檔案信息。然而信息網(wǎng)絡的一個重要特征就是鏈接,這種在技術上可以無限鏈接的情況下,就涉及到了系統(tǒng)的邊界問題”。[20]數(shù)字檔案館系統(tǒng)邊界的界定決定著數(shù)字檔案館所擁有的功能特性。同時也決定著數(shù)字檔案信息在信息中的地位。然而,“在圖書館情報學界,人們討論數(shù)字化圖書館時有種傾向,認為因特網(wǎng)就是一個數(shù)字圖書館,任何人都可以到這個無所不包的圖書館中查閱文獻、學習知識、合作交流甚至著書立說。這就把數(shù)字圖書館的地址空間和信息資源空間定位很廣,其系統(tǒng)邊界也無所不包。它不僅包括了書目文獻管理、信息網(wǎng)絡信息資源的組織與作用,甚至包括檔案館和博物館的信息內(nèi)容,因此建設規(guī)模異常龐大”。[21]數(shù)字圖書館的這種“擴張”,使本來就處于“弱勢”地位的檔案信息的地位更加岌岌可危,如果不對數(shù)字檔案館的系統(tǒng)邊界給以恰當?shù)慕缍?,并采取相應的技術措施,那么,在不久的將來,數(shù)字檔案館將會消失在數(shù)字圖書館的海洋里,成為數(shù)字圖書館的一部分。
10.3 數(shù)字檔案的概念問題。數(shù)字檔案是數(shù)字檔案館生存的基礎。但是目前對數(shù)字檔案概念的認識卻并不統(tǒng)一和清晰。其一,對數(shù)字檔案概念的研究并未引起檔案界太多的關注;其二,一些對數(shù)字檔案概念的認識,大部分都是以傳統(tǒng)的檔案概念為基礎的,仍舊把數(shù)字檔案當作電子文件的轉化物來認識,無非是傳統(tǒng)檔案概念在數(shù)字時代的翻版。這里暫不說傳統(tǒng)的以文件為屬概念的檔案概念本身就有許多可商榷的地方。單說在數(shù)字信息時代文件的概念、檔案概念和其他信息的概念都會受到影響而發(fā)生變化,它們之間有互相融合的趨勢。如何區(qū)分它們將變得越來越困難。在數(shù)字時代的信息網(wǎng)絡環(huán)境下,數(shù)字文件、數(shù)字檔案、數(shù)字圖書、數(shù)字情報、數(shù)字資料、數(shù)字文獻籌有什么不同?如何區(qū)分它們?如果不能把數(shù)字檔案從這些其他數(shù)字信息中區(qū)分出來,那么數(shù)字檔案的概念的存在就將走向消亡,而在數(shù)字檔案概念基礎上建立起來的數(shù)字館大廈也將隨之傾覆。因此,必須把數(shù)字檔案概念從其他數(shù)字信息中區(qū)別出來,數(shù)字檔案館才能生存。但這是一道擺在我們面前的并不容易找到答案的難題。
第二篇:檔案館數(shù)字信息資源建設應注意的幾個問題
檔案館數(shù)字信息資源建設應注意的幾個問題
[ 作者:丁轉貼自:本站原創(chuàng)點擊數(shù):235文章錄入:admin ]
為適應網(wǎng)絡、通訊和多媒體技術迅猛發(fā)展的新世紀信息化建設需要,目前各地檔案館都在積極引用計算機技術和網(wǎng)絡技術開發(fā)檔案信息資源,進行檔案信息化建設。檔案信息化和網(wǎng)絡化已成為檔案工作必然的發(fā)展方向。
而檔案信息資源建設是檔案信息化建設的基礎和核心,它的開發(fā)和利用是檔案信息化建設取得成敗的關鍵,也是衡量檔案信息化水平的一個重要標志。
一、檔案數(shù)字信息資源建設的主要內(nèi)容及信息獲取方式:
檔案數(shù)字信息資源建設主要指館藏檔案的數(shù)字化和電子文件的采集和接收,它的主要形式有館藏檔案目錄中心數(shù)據(jù)庫建設、各種數(shù)字化檔案全文及專門數(shù)據(jù)庫建設。其信息資源的獲取渠道與方式主要有:
1、現(xiàn)有館藏各種傳統(tǒng)介質檔案的數(shù)字化。主要是通過多媒體技術、數(shù)據(jù)庫技術、數(shù)據(jù)壓縮技術、網(wǎng)絡技術等手段,將館藏紙質、聲像、縮微膠片等各種傳統(tǒng)介質檔案通過計算機著錄、掃描儀掃描或數(shù)碼相機拍攝等方式進行數(shù)字化處理,并將數(shù)字信息整合到相應的檔案信息數(shù)據(jù)庫中,實現(xiàn)數(shù)字化檔案資源在網(wǎng)上的發(fā)布和傳遞。
2、收集和接收應歸檔的各種形式的電子文件及其元數(shù)據(jù)。主要有兩種移交接收形式,一種是網(wǎng)絡在線移交接收,即將需移交的電子文件通過網(wǎng)絡直接傳輸?shù)綑n案館,或加工后傳輸?shù)綑n案部門規(guī)定的地址中,并存儲在檔案館;另一種是介質移交接收,即將電子文件存儲在一定的介質上,再移交給檔案館。
3、采集有檔案性質的行業(yè)、專題信息資源庫。除了上述檔案文件之外,各種具有檔案性質的政府和行業(yè)信息及專題資源庫也是檔案館數(shù)字資源建設的重要采集內(nèi)容,它可以通過網(wǎng)絡在線采集網(wǎng)上現(xiàn)有的各種信息資源庫,也可以根據(jù)社會需求,采購一些全文光盤數(shù)據(jù)庫補充檔案館數(shù)字資源建設的不足。
4、下載互聯(lián)網(wǎng)上其他具有檔案價值的信息?;ヂ?lián)網(wǎng)上其他零散、無序的具有檔案價值的信息也是檔案館數(shù)字信息資源建設采集的對象。例如,各網(wǎng)站的歷史照片、新聞報道、網(wǎng)頁、統(tǒng)計數(shù)據(jù)、歷史事件的聲像資料等,將有檔案價值的網(wǎng)絡信息下載到本地,經(jīng)過整理、組織、加工可成為本地的現(xiàn)實資源。
二、檔案數(shù)字信息資源建設應注意的幾個問題
1、檔案數(shù)字信息資源建設應切合實際,科學規(guī)劃
近年來隨著國民經(jīng)濟的發(fā)展進步,檔案部門也正逐步改變過去那種封閉、落后的狀態(tài),然而,地區(qū)差別、行業(yè)差別乃至上級領導重視程度的差異,使得不同檔案館在資源、條件與基礎等方面仍然存在著較大差異。而檔案數(shù)字信息資源建設又是一項需要運用各種先進技術、投資多、開發(fā)周期長的系統(tǒng)工程。如果脫離實際盲目跟風、追多求全,不僅容易造成極大的浪費,還有可能產(chǎn)生事倍功半的效果。因此,在規(guī)劃檔案數(shù)字信息資源的建設時應首先進行全面的調(diào)研,如:檔案館和文件生成部門的現(xiàn)代化管理水平、計算機及網(wǎng)絡普及程度、辦公自動化狀況、資金與設備條件,歸檔人員及檔案工作者的業(yè)務素質與技術水準,新進檔案及館藏檔案概況、特點等等。在廣泛調(diào)查、系統(tǒng)分析、深入研究的基礎上,結合自身實際、社會需求、本地區(qū)或本單位的需要,按“統(tǒng)籌規(guī)劃、分步實施、突出重點、資源共享”的原則進行檔案信息資源建設的規(guī)劃和部署,并注意將分步實施和遠期規(guī)劃有機地結合起來。有條件的,可將重點放在中、長遠規(guī)劃上,以盡量減少重復投資所造成的浪費;而條件差點的檔案館,可按輕重緩急采取分步進行、逐步完善的辦法,并按規(guī)劃有計劃有步驟的實施和檢查各階段的建設目標,爭取以最小投入獲得最大收益。
2、館藏檔案數(shù)字化要注重實效,要在鑒定的基礎上優(yōu)化選擇
館藏檔案數(shù)字化是檔案數(shù)字信息資源建設的一個重要組成部分,也是影響檔案資源信息化和檔案信息開發(fā)、利用的重要因素。僅就信息資源建設來講,將館藏檔案全部進行數(shù)字化,對館藏信息資源的豐富性和完整性無疑是有益的,但對目前大多數(shù)在資金、人力、技術、設備等資源都還相對薄弱、匱乏的檔案部門來說,這將會大大增加檔案館的經(jīng)濟負擔。因此,館藏檔案數(shù)字化要注重實效,要在鑒定的基礎上優(yōu)化選擇。
一是分析館藏,根據(jù)本館實際館藏情況確定數(shù)字化目標,鑒定出需要優(yōu)先數(shù)字化的檔案。如:以提高利用效率為目的,應以利用者需求為中心,總結、分析和研究信息時代個人、本單位及社會各界不同利用者利用檔案的心理和需求,預測利用重點,從而選擇出利用頻率較高、用戶需求量較大的檔案優(yōu)先數(shù)字化。這樣不僅能提高利用效率,同時也可減少或避免對檔案原件利用頻繁所造成的磨損和破壞。如果以保護檔案原件為主要目的,應首先保證那些存儲載體易損或不穩(wěn)定的檔案原件以及稀有、珍貴的歷史檔案原件優(yōu)先進行數(shù)字化,使其成為數(shù)字化的多媒體文件,以實現(xiàn)在計算機上檢索、瀏覽和利用檔案。這樣就可以避免或大大減少對檔案原件的使用,從而達到減少磨損、保護檔案原件以及搶救檔案信息內(nèi)容、避免信息進一步丟失的目的。
二是分析數(shù)字化技術的難易程度,遵循先易后難的原則。由于館藏數(shù)字化技術對不同物理形式的檔案原件,其信息轉換技術的要求和支持程度有所不同。因此,有些檔案可能會因目前技術條件的制約難以進行數(shù)字化,或雖可進行數(shù)字化但無法達到滿意的數(shù)字化效果。因此,數(shù)字化時應分析其數(shù)字化技術的難易程度,對那些目前技術上較難處理或處理效果達不到要求,或雖能達到要求,但相應付出的成本太高的檔案,可暫緩進行數(shù)字化,因為數(shù)字技術的發(fā)展很快,待技術的發(fā)展能較容易的解決問題時,那時再做數(shù)字化可能較之現(xiàn)在會收到事半功倍的效果。
第三、由于檔案絕大多數(shù)都是“孤本”,因此應分析館藏資源,挖掘本館精華,選擇本館獨有的、具有資源優(yōu)勢的專題和項目,打造品牌特色,開發(fā)、建設特色數(shù)字化檔案信息資源系統(tǒng),實現(xiàn)網(wǎng)上各檔案館檔案信息資源優(yōu)勢互補和館際資源共享,從而避免重復建設,保證館藏數(shù)字化建設的效益。
第四,檔案作為原始的歷史記錄,是過去和現(xiàn)在的國家機構、社會組織以及個人從事政治、軍事、經(jīng)濟、科學、技術、文化、宗教等活動直接形成的各種原始記錄,記載著許多重要的秘密。檔案信息數(shù)字化后,一般都會在網(wǎng)上傳播利用,因此,涉密檔案信息的安全與保密問題也是檔案信息數(shù)字化時應重視和關注的問題。
3、電子文件的收集刻不容緩
辦公自動化的開展,產(chǎn)生了大量的電子文件,電子文件是檔案數(shù)字資源的重要來源和組成部分,然而目前電子文件的收集歸檔仍是制約檔案數(shù)字信息資源建設的瓶頸,各單位的電子文件大部分還處于無序狀態(tài),而電子文件信息與載體的可分離性、信息易更改、安全性差的特點,決定了電子文件如果不及時做好收集、積累和歸檔工作,隨著時間的推移,將會有越來越多的電子文件散落、丟失,同時文件的原始性、真實性和完整性也難以保證。因此,電子文件的收集與歸檔刻不容緩。
首先充分研究電子文件的形成規(guī)律,加快制訂電子文件的管理標準。由于電子文件在記錄方式、載體形式等方面與紙質文件不同,使得電子檔案在管理內(nèi)容、管理方式和方法上也與傳統(tǒng)檔案有所區(qū)別。因此,必須根據(jù)電子文件的特點和特性,加快制定相應的收集、鑒定、登記、歸檔、安全等管理標準,為電子文件的標準化、規(guī)范化管理提供依據(jù)和保障。
其次、努力爭取領導支持,主動介入本系統(tǒng)、本單位辦公自動化建設,爭取把電子文件歸檔與管理功能設置作為單位審批辦公自動化項目的內(nèi)容之一,通過技術支持與制度建設,建立起完善的電子文件歸檔機制。積極研究開發(fā)并推廣應用文檔一體化的電子檔案管理系統(tǒng),做好與本單位辦公自動化及各類數(shù)據(jù)庫系統(tǒng)的有效銜接。依托數(shù)據(jù)交換平臺,多層面、多門類采集需要長期或永久保存的、符合歸檔要求的各種電子信息。
第三、做好各類現(xiàn)行電子文件的收集積累工作。對于必須長期或永久保存的、符合歸檔要求的各種現(xiàn)行電子文件,無論是文本、圖形、表格文件,還是影像、聲音、多媒體等文件;也無論是草稿性或輔助性文件,還是在網(wǎng)上呈批后成為定稿的或正式的電子文件,只要有保存價值,就應及時歸檔。避免一方面是已生成的電子文件無法歸檔而流失,另一方面日后檔案館再花費大量的人力物力去重新掃描、著錄等重復勞動,更重要的是防止有些信息(如有重要修改過程的草稿性文件等)一旦被覆蓋就難以再恢復,從而造成不可挽回的損失。同時還應注意電子文件的相關背景信息及動態(tài)電子文件信息的收集積累,以保證電子文件的真實性、完整性和有效性。
4、做好網(wǎng)絡信息的采集積累
因特網(wǎng)是一個包含眾多信息格式、眾多信息內(nèi)容的信息混合體,是一個極具價值的信息源。與有著信息質量控制機制的傳統(tǒng)信息發(fā)布和傳播模式相比,自由、開放的因特網(wǎng)為用戶提供了更為方便、更加快捷和更為廣泛的信息獲取渠道。因此,下載網(wǎng)絡上有價值的信息也是獲取數(shù)字信息資源的重要渠道。但是網(wǎng)站成千上萬,網(wǎng)絡信息浩如煙海,不可能也做不到全部都進行搜索和采集。而且,網(wǎng)絡的自由與自發(fā)特性,使得網(wǎng)絡信息的發(fā)布缺乏質量控制機制,雖有一些單位、機構落實專人進行控制,但大多數(shù)信息發(fā)布隨意,從而導致網(wǎng)上信息來源復雜,信息資源良莠不齊,信息的真實性、可靠性得不到完全保證。
因此,網(wǎng)絡信息的搜索和采集必須注意要有所選擇,一是要把關注的重點放在那些能長期提供信息、而信息內(nèi)容范圍又較為穩(wěn)定并能經(jīng)常進行更新、維護的固定性網(wǎng)站,如政府機構、企事業(yè)單位、學術團體、網(wǎng)絡公司等機構網(wǎng)站。相對于那些提供信息內(nèi)容范圍經(jīng)常會發(fā)生變化或產(chǎn)生信息的隨意性很大或隨時都可能會消失的網(wǎng)站,如一些個人網(wǎng)站或正在試運行的網(wǎng)站等非固定性網(wǎng)站。這些出自機構的固定信息源,其信息的真實性與可靠性相對較高,信息的內(nèi)容范圍也比較穩(wěn)定,因此更符合信息資源建設的標準和要求。
為了保證網(wǎng)絡系統(tǒng)檢索的速度與穩(wěn)定性,網(wǎng)絡系統(tǒng)中的信息需要定期刪除,一般來說,因特網(wǎng)上網(wǎng)頁的平均壽命只有幾十天,一旦網(wǎng)頁更新,以前的資料將逐次消失,失去的信息將難以恢復。網(wǎng)上信息這種易逝性的特點,大大增加了網(wǎng)絡信息資源收集、積累的難度。因此,為了確保有保存價值的信息資源的安全,應有目的、有計劃地進行搜集和保存相關的信息資料,如新聞報道、行業(yè)信息、統(tǒng)計數(shù)據(jù)等,及時將其中有檔案價值的信息下載到本地,經(jīng)過整理、組織,收入館藏,從而確保信息資源的安全。
另外,網(wǎng)絡信息資源的使用權與所有權問題也是網(wǎng)絡信息資源采集時應特別注意的。關于如何利用網(wǎng)上數(shù)字信息資源方面,當前法律方面還無明確規(guī)定,所以對本單位以外的網(wǎng)站信息進行下載、歸檔時,有可能涉及到版權問題時,應盡量與網(wǎng)站所有單位協(xié)商,從而避免可能產(chǎn)生的侵權和糾紛。
參考文獻:
[1]、《檔案信息化建設講座》深圳檔案局網(wǎng)站
[2]、劉 軒:《 檔案數(shù)字化的策略分析及系統(tǒng)構建》《 北京檔案》2004年第 12期
[3]、徐義全 電子文件系列講座《電子文件的收集積累》《北京檔案》2001年第1.期
[4]、夏曉慧/竇紅梅《關于數(shù)字信息資源的另一面》
[5]、顧學中《談館藏檔案數(shù)字化范圍的科學界定》《檔案時空》2004年第12期