前言:本站為你精心整理了大數(shù)據(jù)企業(yè)檔案信息資源整合淺析范文,希望能為你的創(chuàng)作提供參考價(jià)值,我們的客服老師可以幫助你提供個(gè)性化的參考范文,歡迎咨詢。
“大數(shù)據(jù)”這一名詞伴隨著龐大數(shù)據(jù)群自20世紀(jì)90年代悄然出現(xiàn)后,逐漸聲名大噪。隨著云計(jì)算、物聯(lián)網(wǎng)等技術(shù)的產(chǎn)生和發(fā)展,隨著各種信息發(fā)布、信息存儲(chǔ)和信息傳播方式的興起,全球的數(shù)據(jù)都在以前所未有的速度飛速增加和積累。凡此,無(wú)不給檔案事業(yè)的信息資源累積、整合與利用帶來(lái)巨大的影響,進(jìn)而對(duì)全世界經(jīng)濟(jì)社會(huì)發(fā)展產(chǎn)生轟動(dòng)效應(yīng)。
一、大數(shù)據(jù)時(shí)代的到來(lái)
(一)大數(shù)據(jù)概念與含義大數(shù)據(jù),或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無(wú)法通過(guò)人工,在合理時(shí)間內(nèi)達(dá)到截取、管理、處理、并整理成為人類(lèi)所能解讀的信息。
(二)大數(shù)據(jù)與檔案的關(guān)系
1.檔案大數(shù)據(jù)是大數(shù)據(jù)的有效組成部分。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,大數(shù)據(jù)已經(jīng)幾乎滲透到了全球各個(gè)領(lǐng)域,檔案領(lǐng)域的大數(shù)據(jù)也隨之逐漸蓬勃發(fā)展起來(lái),檔案的來(lái)源更廣、數(shù)據(jù)更新、平臺(tái)更多、技術(shù)更過(guò)硬,使得檔案大數(shù)據(jù)的數(shù)據(jù)量和數(shù)據(jù)類(lèi)型都呈直線上升的增長(zhǎng)趨勢(shì)。2.檔案大數(shù)據(jù)的價(jià)值一般高于整體大數(shù)據(jù)的水平。檔案的性質(zhì)就決定了檔案領(lǐng)域的大數(shù)據(jù)價(jià)值勢(shì)必高于其他領(lǐng)域大數(shù)據(jù)的價(jià)值。檔案是一種原始記錄,檔案工作有其深厚的理論和實(shí)踐基礎(chǔ),因此檔案領(lǐng)域的大數(shù)據(jù)在系統(tǒng)性、完整性和準(zhǔn)確性方面將更具價(jià)值優(yōu)勢(shì)。3.檔案大數(shù)據(jù)的有效利用將高于其他數(shù)據(jù)。檔案工作長(zhǎng)久以來(lái)的最根本目的就是為了提供利用,大眾對(duì)檔案已經(jīng)形成一種利用習(xí)慣。而檔案的價(jià)值高于普通數(shù)據(jù),使得檔案大數(shù)據(jù)的利用價(jià)值也將高于普通數(shù)據(jù)。檔案涉及的行業(yè)領(lǐng)域十分廣泛,從政府公文到公司賬目,從建筑圖紙到獲獎(jiǎng)證書(shū),從專利證明到照片視頻,檔案數(shù)據(jù)的利用延伸到了工作生活的多個(gè)方面,這也是其他數(shù)據(jù)所無(wú)法比擬的。
海量的數(shù)據(jù)充斥世界,如何將這些信息迅速轉(zhuǎn)化為可利用的信息資源,無(wú)異于掌握了一把能打開(kāi)另一個(gè)世界的鑰匙,越來(lái)越多的政府、企業(yè),正逐步意識(shí)到這隱藏在數(shù)據(jù)山脈中的金礦。檔案管理需要從簡(jiǎn)單的數(shù)據(jù)收集、整理、存儲(chǔ),轉(zhuǎn)變?yōu)闄n案信息資源的有機(jī)整合、加工,從而形成高價(jià)值的可利用信息資源。
(一)擴(kuò)展檔案范圍,記錄即檔案
大數(shù)據(jù)時(shí)代,記錄即檔案,檔案不應(yīng)該再局限于事件結(jié)束后經(jīng)過(guò)整理歸檔的文件,信息化環(huán)境下,很多記錄一旦形成,就應(yīng)該成為可供利用的檔案。
(二)從數(shù)據(jù)庫(kù)到大數(shù)據(jù)的飛躍
大數(shù)據(jù)的出現(xiàn)勢(shì)必會(huì)顛覆以往數(shù)據(jù)管理的模式,傳統(tǒng)數(shù)據(jù)庫(kù)的處理規(guī)模較小,大數(shù)據(jù)難以通過(guò)數(shù)據(jù)庫(kù)來(lái)進(jìn)行處理;大數(shù)據(jù)環(huán)境下的檔案類(lèi)型將日新月異,傳統(tǒng)數(shù)據(jù)庫(kù)中的檔案類(lèi)型單一,往往集中于某幾類(lèi)檔案;數(shù)據(jù)庫(kù)中的檔案僅僅作為檔案本身而存在,大數(shù)據(jù)則是一種可以被利用的資源,與其他資源的可聯(lián)性較強(qiáng);傳統(tǒng)數(shù)據(jù)庫(kù)的擴(kuò)展性較差,而大數(shù)據(jù)則需要能夠適應(yīng)數(shù)據(jù)增加速度的新數(shù)據(jù)庫(kù)。建立能夠適應(yīng)檔案大數(shù)據(jù)的新數(shù)據(jù)庫(kù),是企業(yè)檔案信息資源整合的前提。
(三)數(shù)據(jù)挖掘和數(shù)據(jù)挖掘的應(yīng)用
數(shù)據(jù)挖掘是在探討用以解析大數(shù)據(jù)的方法。大數(shù)據(jù)時(shí)代的檔案信息冗雜、價(jià)值高低不一,利用起來(lái)尤其不便,許多低價(jià)值甚至沒(méi)有價(jià)值的檔案與重要價(jià)值的檔案摻雜在一起,難以從中分辨,這就需要數(shù)據(jù)挖掘,去粗取精、去冗分類(lèi),從中提取高價(jià)值的檔案,整合低價(jià)值的檔案,最終獲得更高的效益。檔案的價(jià)值不再僅僅局限于表面,大數(shù)據(jù)的關(guān)鍵在于其潛在價(jià)值,檔案工作不僅僅局限于收集保存,還需要挖掘數(shù)據(jù)的潛在價(jià)值,激活隱性信息。數(shù)據(jù)的重要價(jià)值在于其使用,而不再是數(shù)據(jù)本身。檔案也不再是越多越好,有量又有質(zhì)才是今后的發(fā)展趨勢(shì)。只要擁有良好的數(shù)字資源基礎(chǔ),計(jì)算機(jī)快速處理海量的不同類(lèi)型信息的能力就能夠高效地挖掘出檔案信息資源的潛在價(jià)值。
(四)注重檔案數(shù)據(jù)的前端控制
除了擴(kuò)大收集范圍、建立新型數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘以外,還要做好檔案數(shù)據(jù)的前端控制,以確保檔案管理工作的規(guī)范,從源頭上做好檔案信息資源整合的準(zhǔn)備。企業(yè)的辦公系統(tǒng)、財(cái)務(wù)系統(tǒng)、合同管理系統(tǒng)、PDM系統(tǒng)等,以及各項(xiàng)業(yè)務(wù)流程,都應(yīng)該將檔案管理工作融入其中,做好文件的前端控制。
(五)應(yīng)該將大數(shù)據(jù)融入到數(shù)字檔案館建設(shè)中去
目前多數(shù)企業(yè)都在進(jìn)行或完成數(shù)字檔案館建設(shè),大數(shù)據(jù)以及大數(shù)據(jù)技術(shù)都應(yīng)該有選擇地與數(shù)字檔案館建設(shè)相結(jié)合,為下一步建設(shè)智慧型檔案館做好基礎(chǔ)。
三、企業(yè)檔案信息資源的利用
(一)海量數(shù)據(jù)的查詢能力是檔案利用
首先需要解決的問(wèn)題隨著信息技術(shù)的進(jìn)步、數(shù)據(jù)庫(kù)技術(shù)的發(fā)展,計(jì)算機(jī)輔助檔案管理使檔案管理變得更為快捷和方便。但是在大數(shù)據(jù)時(shí)代,檔案數(shù)量急劇增長(zhǎng),傳統(tǒng)檔案數(shù)據(jù)庫(kù)的性能難以支撐其快速增長(zhǎng)的數(shù)量。在進(jìn)行檔案查詢時(shí),往往需要的信息會(huì)被埋沒(méi)在大量不需要的數(shù)據(jù)中,并且檢索性能急劇下降,甚至無(wú)法響應(yīng)。因此,如何在大量的檔案中快速而準(zhǔn)確地找到所需的信息,是檔案提供利用要解決的首要問(wèn)題。其中,基于音視頻的檢索、基于語(yǔ)義的檢索和檔案智能輔助分類(lèi)都是檔案大數(shù)據(jù)目前急需的檢索技術(shù)。
(二)信息載體、信息技術(shù)、檔案設(shè)備等的先進(jìn)性和智能性直接決定檔案信息資源的利用效果
大數(shù)據(jù)時(shí)代的來(lái)臨,各種新媒介新載體新領(lǐng)域的檔案不斷涌現(xiàn),同時(shí)技術(shù)更新?lián)Q代越來(lái)越頻繁,不僅使整個(gè)社會(huì)走向智能化,檔案工作也需要走向智能化,用智能化的技術(shù)手段為用戶提供定制的利用服務(wù),提高收集、存儲(chǔ)、管理、分析和分享大量數(shù)據(jù)最先進(jìn)的核心技術(shù)水平,并根據(jù)不同的用戶需求,提供不同的利用途徑和數(shù)據(jù)信息,以達(dá)到最滿意的利用效果。
(三)提高檔案部門(mén)在信息資源利用中的指導(dǎo)作用,提升檔案部門(mén)的研究能力
檔案部門(mén)需要轉(zhuǎn)變過(guò)去的服務(wù)方式,主動(dòng)去了解本單位用戶的需求,根據(jù)不同需求,對(duì)海量的檔案信息資源進(jìn)行分析、歸納和整理,找到數(shù)據(jù)之間的關(guān)聯(lián),進(jìn)行相關(guān)性分析,注重質(zhì)量,加強(qiáng)特色開(kāi)發(fā),從而提高檔案的利用質(zhì)量和利用水平,讓數(shù)據(jù)的價(jià)值得到良好的體現(xiàn)。
(四)通過(guò)宣傳提高檔案信息資源各種利用形式的知名度
時(shí)下,多數(shù)用戶對(duì)檔案信息資源的利用方式都比較單一,對(duì)于最新最先進(jìn)的利用手段掌握得比較滯后,檔案部門(mén)對(duì)檔案利用手段和利用形式的宣傳不夠到位,讓很多最先進(jìn)的技術(shù)手段形同虛設(shè)。因此,在企業(yè)中提高檔案信息資源利用形式,才能讓檔案的利用工作真真正正地發(fā)揮作用。不言而喻,大數(shù)據(jù)時(shí)代以高調(diào)而不可逆的姿態(tài)降臨,與檔案領(lǐng)域擦出絢爛的火花,既有沖撞又有助益,更有利于促進(jìn)檔案事業(yè)快速發(fā)展。是大數(shù)據(jù)為檔案界帶來(lái)了前所未有的發(fā)展機(jī)遇,檔案信息資源的整合與利用為大數(shù)據(jù)展示了廣闊的發(fā)展空間,我想這就是本文試論的最滿意的結(jié)論。
作者:麥迪 閆潤(rùn)中 齊宏遠(yuǎn) 單位:中國(guó)航空工業(yè)集團(tuán)公司 西安航空計(jì)算技術(shù)研究所
數(shù)據(jù)安全論文 數(shù)據(jù)報(bào)告 數(shù)據(jù)采集論文 數(shù)據(jù)挖掘總結(jié) 數(shù)據(jù)采集 數(shù)據(jù)安全 數(shù)據(jù)統(tǒng)計(jì)論文 數(shù)據(jù)通信論文 數(shù)據(jù)分析設(shè)計(jì) 數(shù)據(jù)庫(kù)論文 紀(jì)律教育問(wèn)題 新時(shí)代教育價(jià)值觀