前言:本站為你精心整理了第七次人口普查下大數(shù)據(jù)發(fā)展研究范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
摘要:當下基礎數(shù)據(jù)信息散亂,無數(shù)據(jù)儲存載體,導致不同數(shù)據(jù)統(tǒng)計要求下重復操作,造成社會資源浪費。同時,由于基礎數(shù)據(jù)信息無意識、無奈對外泄露,或者廉價賣出形成管理隱患。加強基礎數(shù)據(jù)載體建設,促使數(shù)據(jù)信息資產(chǎn)化。輔助以大數(shù)據(jù)資產(chǎn)評估、定價、監(jiān)管,在交易平臺上以規(guī)范的交易流程進行大數(shù)據(jù)資產(chǎn)商品化流通,勢必推動整個大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展。
關鍵詞:人口普查;載體建設;大數(shù)據(jù);產(chǎn)業(yè)發(fā)展
實事求是、改革創(chuàng)新、科學設計、精心組織、周密部署、依法實施,以確保第七次全國人口普查數(shù)據(jù)真實準確,更加全面客觀地反映我國人口發(fā)展狀況。這項工作涉及面廣、工作量大、時間緊、任務重,其具體實施離不開統(tǒng)計技術和統(tǒng)計手段的部署,更離不開大數(shù)據(jù)的應用。若基礎數(shù)據(jù)載體建設完善、更新及時、輸出便捷,不僅使人口普查這項工作節(jié)省人力、物力、財力,更有利于地方政府管理機能、政策決策,也有利于大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展。
一、基礎數(shù)據(jù)和數(shù)據(jù)載體的現(xiàn)狀
目前,部分數(shù)據(jù)信息的取得較為廉價,大多數(shù)人和機構也都沒有意識數(shù)據(jù)信息是一項有價值的資產(chǎn)。即便是覺得某些數(shù)據(jù)信息有一定價值,也因為沒有這些信息數(shù)據(jù)的存儲載體而流失或不被重視。大數(shù)據(jù)在大數(shù)據(jù)企業(yè)已經(jīng)是一項不折不扣的資產(chǎn),那么,資產(chǎn)的“外購”或“自制”均應會支付或者耗費一定的貨幣或者經(jīng)濟利益。例如:幾十元、上百元人民幣就能夠從非正規(guī)渠道取得數(shù)以萬計的姓名、性別、地址、電話等信息,甚至是企業(yè)名稱、開戶銀行、工商登記等信息。與其對應的是個人和一些組織無意識或者無奈地對外泄露這些信息,例如:各式各樣的注冊、驗證、登錄時信息填報;戶口本、身份證、營業(yè)執(zhí)照復印件滿天飛。
二、從大量數(shù)字到數(shù)據(jù)信息的積累
數(shù)字不是數(shù)據(jù),數(shù)據(jù)也不是大量數(shù)字,大量數(shù)據(jù)也尚不能界定為大數(shù)據(jù)。例如:2010年我國老齡化人口占比12%,約1.5億老齡化人口,到2030年我國老齡化人口程度將超出日本成為全球最高。這句話告訴我們一條完整的我國老齡化人口信息。12%的比例是一個社區(qū)、一個城市、一個省份到整個國家一個一個數(shù)字統(tǒng)計而來,1.5億的龐大數(shù)字如果不能放在整句話中,也就沒有意義,僅僅是一個數(shù)值。即使是上面一整句話也只能是一條信息。那么,如果我們把構成1.5億數(shù)字的每一條信息積累下來,輸入不同行政級別和不同大小的數(shù)據(jù)處理載體,便是很好的大數(shù)據(jù)“原材料”。然而,我們在普查這些數(shù)據(jù)信息過程中,特別是前幾次人口普查我們的基層組織并沒有系統(tǒng)地留存。第一,我們沒有留存的意識;第二,我們沒有留存的“倉庫”;第三,即便是留存了,也因為散亂而沒有價值。
三、從數(shù)據(jù)信息到結構化數(shù)據(jù)的整理
數(shù)據(jù)信息本身是散亂的、扁平化的、非結構性的,例如:我們在人口普查時,從派出所戶籍中心導出的區(qū)域內戶口信息,本身數(shù)字龐大,又包含了姓名、性別、年齡、身份證號碼、住址等輔助信息,可以稱之為數(shù)據(jù),甚至在某種程度上可以稱之為大數(shù)據(jù)。但是這些數(shù)據(jù)信息如果用于人口年齡層次;流動情況,亦或就業(yè)率計算;是否需要放開二胎、三胎;理解居民收入等,其利用價值仍然有限。其原因是戶籍資料是非結構性的數(shù)據(jù)信息。要么不包括調查的內容;要么沒有進行結構化數(shù)據(jù)處理。如果將非結構化數(shù)據(jù)依據(jù)不同的統(tǒng)計目標,鏈接相關聯(lián)的數(shù)據(jù)信息,從多維度進行整合分析處理,使其達到結構化。再借助互聯(lián)網(wǎng)嫁接到人工智能終端,便是我們傳統(tǒng)意義上的大數(shù)據(jù)。
四、信息載體建設與大數(shù)據(jù)產(chǎn)業(yè)發(fā)展
若實現(xiàn)基礎數(shù)據(jù)共享,所有的基礎數(shù)據(jù)信息要有各自的載體,也就是數(shù)據(jù)儲存設備,哪怕僅僅是一份調查報告,使基礎數(shù)據(jù)信息成果化。然后就具備了將成果化的數(shù)據(jù)信息推向商業(yè)化通道的條件,進而初步形成大數(shù)據(jù)產(chǎn)業(yè)鏈。就第七次人口普查來說,我們需要普查的信息如果能夠將不同級政府、部門、機構、組織已經(jīng)掌握的基礎信息“拿來主義”,完全能夠滿足普查需要,可能就不需要全國范圍“入戶”這一項繁重、復雜、的工作,僅需要部分住戶核查即可。每一位個人、每一個單位都將其掌握的基礎數(shù)據(jù)信息進行載體存儲,載體形式可以是一份調查報告、一張EXSLE表格、一套數(shù)據(jù)集成,亦或數(shù)據(jù)處理系統(tǒng)。然后依托當?shù)氐拇髷?shù)據(jù)企業(yè)或者大數(shù)據(jù)產(chǎn)業(yè)局室,讓這些載體內的成果“產(chǎn)品化”。輔助以大數(shù)據(jù)資產(chǎn)評估、定價、監(jiān)管,在交易平臺上以規(guī)范的交易流程進行大數(shù)據(jù)資產(chǎn)商品化流通。那么,整個社會就對數(shù)據(jù)化信息從意識形態(tài)上發(fā)生改變;盡管基礎數(shù)據(jù)信息的取得不再廉價,但是取得的數(shù)據(jù)更加規(guī)范、更有可利用價值,勢必推動整個大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展。
參考文獻:
[1]陳宗智,常欣.大數(shù)據(jù)資產(chǎn)走進大數(shù)據(jù)企業(yè)會計報表的研究[J].經(jīng)濟師,2016(09)
作者:陳宗智 孔環(huán) 單位:山東科技大學