前言:本站為你精心整理了論氣象觀測資料電子檔案的安全性范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
電子檔案信息的可修復(fù)性及信息逆處理技術(shù)的歷史連貫性問題其實就是電子文件的可修復(fù)性及信息逆處理技術(shù)的歷史連貫性問題,而這個問題跟電子文件的格式類型直接有關(guān)。不同格式類型的電子文件,當(dāng)文件信息失真或損壞時其可修復(fù)的概率是不同的,文件信息的逆處理技術(shù)也是不同的。所以,電子檔案信息的可修復(fù)性及信息逆處理技術(shù)的歷史連貫性問題首先要解決的是如何選擇合適的電子檔案文件格式類型的問題。
電子文件格式類型和信息逆處理技術(shù)
電子文件格式類型電子文件的格式類型繁多,并有多種分類方法。根據(jù)文件中數(shù)據(jù)元的檢索方式可分為順序文件和非順序文件;根據(jù)文件中數(shù)據(jù)元的控制方式可分為格式化文件和非格式化文件,而格式化文件又可根據(jù)數(shù)據(jù)元的集合控制方式分為數(shù)據(jù)庫文件和非數(shù)據(jù)庫文件。目前,信息存貯類文件主要有文本文件、純文本文件、數(shù)據(jù)庫文件、圖形文件、音像文件、表格文件、圖文混排文件等。上述除文本文件、純文本文件、數(shù)據(jù)庫文件以外的其他文件,均側(cè)重于信息的特定表現(xiàn)目的而設(shè)計的,具有特定的結(jié)構(gòu)信息,并需要特定的軟件操作,標(biāo)準(zhǔn)化程度低,可以用于特殊檔案信息的保存,如音像資料等,但不適合保存字符數(shù)據(jù)。文本文件與純文本文件在字符數(shù)據(jù)的存貯方面具有相同的效果,但純文本文件是不帶格式控制信息的,具有更好的適應(yīng)性。所以純文本文件和數(shù)據(jù)庫文件是組織和存貯數(shù)據(jù)的兩種典型的文件類型,也是目前各級氣象檔案館在組織和存貯地面氣象觀測資料中所采用的主要文件類型。所以下面對該兩種文件類型的主要特點進行分析。
純文本文件信息逆處理技術(shù)純文本文件是非格式化的順序文件,文件中的所有信息都以標(biāo)準(zhǔn)的ASCII碼形式進行存貯,無任何控制信息和結(jié)構(gòu)信息,只有數(shù)據(jù)元,而且數(shù)據(jù)元的格式是透明的,信息在文件中的邏輯結(jié)構(gòu)也是透明的,并與顯示、修改和打印的視覺形態(tài)保持一致,具有最好的“直讀”特性,如果向某一物理載體中錄入文件時,采取順序錄入方法,則信息存貯的邏輯結(jié)構(gòu)與物理結(jié)構(gòu)保持一致,使“直讀”特性更加完備。該類文件的信息可使用任何字編輯軟件直接顯示、修改和打印,與任何計算機設(shè)備及操作系統(tǒng)相兼容,并可自編一個簡單的軟件直接讀出文件信息,所以該類文件的信息逆處理技術(shù)的歷史連貫性最穩(wěn)定,幾乎不受電子信息技術(shù)發(fā)展的影響。
數(shù)據(jù)庫文件信息逆處理技術(shù)數(shù)據(jù)庫文件是格式化的非順序文件,文件內(nèi)容由文件結(jié)構(gòu)信息、控制信息和數(shù)據(jù)3部分組成,其中文件結(jié)構(gòu)信息是對數(shù)據(jù)庫框架結(jié)構(gòu)的具體描述,控制信息包括各種屬性定義、指針鏈表、定位表和連接信息等內(nèi)容,數(shù)據(jù)庫的數(shù)據(jù)元、結(jié)構(gòu)信息和控制信息都是不透明的,數(shù)據(jù)庫中的“記錄”是用指針鏈的方法來定位的,所以數(shù)據(jù)庫中“記錄”的邏輯位置、物理位置和顯示形態(tài)之間的關(guān)系也是不透明的。因此,數(shù)據(jù)庫中的數(shù)據(jù)沒有任何“直讀”特性,數(shù)據(jù)的顯示、修改和打印等操作完全依賴于數(shù)據(jù)庫開發(fā)商所開發(fā)的專用軟件產(chǎn)品,而這種軟件產(chǎn)品經(jīng)常發(fā)生過時、淘汰和升級等現(xiàn)象。所以數(shù)據(jù)庫文件的信息逆處理技術(shù)的歷史連貫性是不太穩(wěn)定的,如果永久性檔案的電子文件采用數(shù)據(jù)庫文件,則隨著軟件的過時、淘汰或升級需要對電子檔案文件進行格式轉(zhuǎn)換,而每一次的格式轉(zhuǎn)換都存在著一定的風(fēng)險,因為所有件軟產(chǎn)品的兼容性都不是絕對的。
電子文件受損壞的幾種可能情況
電子文件的損壞情況可分為物理性損壞和邏輯性損壞兩種情況。因存貯介質(zhì)的物理特性改變或機械性損壞而造成信息不能準(zhǔn)確識別的稱為物理性損壞;因病毒攻擊、人為操作失誤或操作平臺不兼容等而造成信息失真的稱為邏輯性損壞。不管是物理性損壞或是邏輯性損壞,從存貯體的邏輯區(qū)域角度分析,其直接損壞的區(qū)域往往是局部性的,如果這種損壞發(fā)生在某一文件的數(shù)據(jù)區(qū)內(nèi),則造成該文件部分數(shù)據(jù)的丟失;如果發(fā)生在某一文件的控制信息區(qū)內(nèi),則造成該文件中與該控制信息相關(guān)聯(lián)的全部數(shù)據(jù)的丟失;如果發(fā)生在某一文件的結(jié)構(gòu)信息區(qū)內(nèi),則造成該文件全部數(shù)據(jù)的丟失;如果發(fā)生在存貯介質(zhì)的文件系統(tǒng)控制信息區(qū)內(nèi),則將造成該存貯體全部或部分文件資料的丟失。
電子文件損壞時的可修復(fù)性情況分析
由于文件的直接損壞區(qū)域是局部性的,所以就存在修復(fù)的可能性,但可修復(fù)的概率和修復(fù)后的失真程度與損壞區(qū)域及文件格式類型有直接關(guān)系。下面以純文本文件和數(shù)據(jù)庫文件兩種典型文件類型為例進行分析。
純文本文件的可修復(fù)性由于純文本文件中只包含數(shù)據(jù)元,沒有結(jié)構(gòu)信息和控制信息,所以損壞區(qū)域只能發(fā)生在文件的數(shù)據(jù)區(qū)內(nèi)或存貯介質(zhì)的文件系統(tǒng)控制信息區(qū)內(nèi)這兩種情況。下面對該兩種情況分別進行分析:損壞發(fā)生在某一文件的數(shù)據(jù)區(qū)內(nèi)時。這種情況如果是物理性損壞,則不管采用何種方法都不能直接修復(fù)被損壞的數(shù)據(jù),除非使用備份數(shù)據(jù)進行修復(fù),但未損壞部分的數(shù)據(jù)可全部修復(fù);如果是邏輯性損壞,并且損壞了數(shù)據(jù)元,該種情況同物理性損壞一樣;如果是邏輯性損壞,但沒有損壞數(shù)據(jù)元,只增加了無效信息(病毒攻擊往往是這種情況),則可全部修復(fù)。損壞發(fā)生在存貯介質(zhì)的文件系統(tǒng)控制信息區(qū)內(nèi)時。這種情況發(fā)生時文件中的數(shù)據(jù)并沒有被損壞,只是文件定位信息被破壞,如果在一個存貯體內(nèi)的所有文件都是以復(fù)制追加的方式進行保存,中間不進行刪除、覆蓋、編輯的操作,則所有文件的物理存貯區(qū)域都是按順序進行的,如果文件的首行和尾行都帶有標(biāo)識內(nèi)容(中國氣象局制定的地面氣象模式資料格式文件就屬于該類型的文件),則所有文件都可修復(fù),并且也很容易;否則修復(fù)難度較大,并且不能保證所有文件的修復(fù)。
數(shù)據(jù)庫文件的可修復(fù)性由于數(shù)據(jù)庫文件由文件結(jié)構(gòu)信息、控制信息和數(shù)據(jù)3部分組織,所以按下列幾種情況分別進行分析。(1)損壞發(fā)生在某一文件的數(shù)據(jù)區(qū)內(nèi)時。這種情況下不管采用何種方法,都不能直接修復(fù)被損壞的數(shù)據(jù),除非使用備份數(shù)據(jù)進行修復(fù)。(2)損壞發(fā)生在某一文件的控制信息區(qū)內(nèi)時。這種情況下所有與其相關(guān)聯(lián)的數(shù)據(jù)全都被損壞,無法修復(fù),雖然數(shù)據(jù)庫操作系統(tǒng)提供了修復(fù)功能,但其所修復(fù)的數(shù)據(jù)的正確性是不絕對保證的,并且也是不全面的。(3)損壞發(fā)生在某一文件的結(jié)構(gòu)信息區(qū)內(nèi)時。這種情況下整個數(shù)據(jù)庫中的數(shù)據(jù)將全部丟失,并無法修復(fù)。(4)損壞發(fā)生在存貯介質(zhì)的文件系統(tǒng)控制信息區(qū)內(nèi)時。這種情況雖然同純文本文件一樣,文件中的數(shù)據(jù)并沒有被損壞,但由于數(shù)據(jù)庫文件結(jié)構(gòu)和數(shù)據(jù)元都是不透明的,所以是不能修復(fù)的,除非整個存貯體內(nèi)只保存一個文件,才有修復(fù)的可能性,但修復(fù)難度極大。
純文本文件和數(shù)據(jù)庫文件的可修復(fù)性比較當(dāng)電子文件受到損壞時,純文本文件比較容易修復(fù),而且不易受計算機病毒的攻擊,這是因為純文本文件是非格式化的順序文件,結(jié)構(gòu)和數(shù)據(jù)都具有透明和可“直讀”的特性;而數(shù)據(jù)庫文件是非常不容易修復(fù)的,多數(shù)情況下是完全不能修復(fù)的,而且容易受計算機病毒的攻擊,其安全性比純文本文件要差得很多,其原因是因為數(shù)據(jù)庫文件是格式化的非順序文件,結(jié)構(gòu)和數(shù)據(jù)都是不透明和不可“直讀”的,信息組織結(jié)構(gòu)非常復(fù)雜而嚴(yán)密,當(dāng)其中某一處結(jié)構(gòu)性信息遭損壞時將引起整個數(shù)據(jù)庫文件的崩潰。根據(jù)數(shù)據(jù)修復(fù)服務(wù)機構(gòu)經(jīng)驗統(tǒng)計,文本文件檔案資料的可修復(fù)率約為85%,而數(shù)據(jù)庫檔案資料的可修復(fù)率約為65%。
電子檔案文件類型對電子檔案資料管理和服務(wù)效率的影響
數(shù)據(jù)庫文件在設(shè)計上側(cè)重于數(shù)據(jù)的管理與服務(wù),有相應(yīng)的商業(yè)軟件支撐,并且有一定的標(biāo)準(zhǔn)化數(shù)據(jù)庫應(yīng)用接口,所以數(shù)據(jù)庫資料的管理與服務(wù)最方便、快捷,檔案利用率高。隨著數(shù)據(jù)庫標(biāo)準(zhǔn)化水平的不斷改進和提高,數(shù)據(jù)庫檔案資料的管理、服務(wù)和開發(fā)利用能力將進一步提高。純文本文件是非格式化的順序文件,沒有結(jié)構(gòu)信息,信息檢索困難,所以檔案資料的管理、服務(wù)和開發(fā)利用能力比效差。
地面觀測資料電子檔案管理工作建議
通過上面的分析知道,純文本文件的可修復(fù)概率較高,信息逆處理技術(shù)的歷史連貫性更穩(wěn)定,幾乎不受電子信息技術(shù)發(fā)展的影響,但檔案資料的管理、服務(wù)和開發(fā)利用能力比效差。而數(shù)據(jù)庫文件的可修復(fù)性較差,信息逆處理技術(shù)的歷史連貫性也不穩(wěn)定,但檔案資料的管理、服務(wù)和開發(fā)利用能力強。所以,從檔案資料的存貯安全性與服務(wù)功能性方面考慮,建議如下。(1)采用不同文件格式建立相互備份檔案資料。即同一檔案資料同時采用純文本文件和數(shù)據(jù)庫文件分別保存,其中純文本文件主要用于檔案資料的修復(fù),數(shù)據(jù)庫文件主要用于檔案資料的服務(wù)。同時開發(fā)相應(yīng)的軟件,用于純文本文件資料與數(shù)據(jù)庫文件資料的相互轉(zhuǎn)存、校對、備份和修復(fù)。(2)為了使純文本文件的可修復(fù)概率達到最大化,還需要注意以下幾方面的問題:①數(shù)據(jù)格式問題。如果用純文本文件來組織檔案信息,則最好規(guī)定每一個文件的首行作為該文件的標(biāo)識行,并保證能從該標(biāo)識行的內(nèi)容中可直觀地判別出該文件的文件名和所存貯的數(shù)據(jù)屬性;同時規(guī)定每一個文件的尾行作為數(shù)據(jù)結(jié)束的標(biāo)識行。如,地面氣象觀測月資料文件(A0、A1、A文件)的首行中包含了資料所屬測站的區(qū)站號、資料所屬的年份和月份,并用6個“#”號組成的一行作為結(jié)束行。具有這種標(biāo)識的文件,可以不依賴其文件名而準(zhǔn)確地找到該文件的物理存貯區(qū)域,并能判別出它的文件名,從而最快地修復(fù)文件。②文件名的唯一性問題。在同一存貯體內(nèi)所有文件的文件名要確保其唯一性,即不能在其他子目錄中備份同一物理載體中的其他文件,防止在文件修復(fù)過程中造成文件名混亂。③物理位置的順序性問題。一個存貯體在錄入檔案文件前先要清空,然后再錄入檔案文件,一旦錄入了文件就盡可能不要對該存貯體內(nèi)的文件進行刪除、覆蓋和編輯的操作,而只能追加文件,以盡量確保文件數(shù)據(jù)的邏輯形態(tài)與物理形態(tài)保持一致,使文件更容易修復(fù)。7
結(jié)語
純文本文件的安全性高,但檔案資料的管理、服務(wù)和開發(fā)利用能力比效差。而數(shù)據(jù)庫文件的安全性相對差,但檔案資料的管理、服務(wù)和開發(fā)利用能力比效強。所以,利用該兩種文件的不同特點,通過建立純文本文件和數(shù)據(jù)庫文件相互備份機制,不僅可以最大程度地保證電子檔案資料的安全性,而且可以保證檔案資料的管理、服務(wù)及開發(fā)利用能力。
作者:封秀燕何志軍吳書成單位:浙江省氣象信息網(wǎng)絡(luò)中心浙江省舟山市氣象局