前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇聚類分析論文范文,相信會(huì)為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
1.1城郊農(nóng)戶此種類型的農(nóng)戶主要是對(duì)其生活、農(nóng)業(yè)種植、畜禽養(yǎng)殖、鄉(xiāng)村旅游進(jìn)行污染區(qū)分。①污染源區(qū)分:農(nóng)家樂是目前鄉(xiāng)村旅游的重要形式,其污染源包括污水、人類尿便等,鄉(xiāng)村旅游污染和旅游人數(shù)之間有著直接的關(guān)系。所以,這一類污染的產(chǎn)污單元可以看做是每一位鄉(xiāng)村游客。②污染強(qiáng)度的劃分:生活污水(包括垃圾、人類尿)排放強(qiáng)度=每戶游客污水日排放量/每戶游客數(shù)。
1.2種養(yǎng)結(jié)合戶此種類型農(nóng)戶的污染源劃分主要是根據(jù)農(nóng)戶種植污染、畜禽養(yǎng)殖污染、農(nóng)戶生活污染等進(jìn)行劃分。其中,畜禽養(yǎng)殖污染源的劃分同典型養(yǎng)殖戶;農(nóng)戶生活、農(nóng)戶農(nóng)業(yè)種植污染源識(shí)別同典型種植戶。
2農(nóng)村環(huán)境污染物排放的核算
2.1農(nóng)村環(huán)境污染物具體排放量的計(jì)算研究得知,各污染源污染實(shí)物的排放量多少是和流失系數(shù)、產(chǎn)污系數(shù)等密切相關(guān)的。而農(nóng)村環(huán)境污染具有極其明顯的地域性,所以我們計(jì)算中需要的參數(shù)值必須通過對(duì)某一地區(qū)內(nèi)各種相關(guān)聯(lián)的因素進(jìn)行測(cè)定和綜合分析才能得出。目前,得出這些參數(shù)的方法一般有兩種,一是通過特定地區(qū)的污染發(fā)生學(xué)實(shí)驗(yàn)研究來得出,二是通過相關(guān)的文獻(xiàn)進(jìn)行篩選、調(diào)研。
2.2農(nóng)村環(huán)境污染敏感性的調(diào)研這里提到的敏感性主要是指調(diào)研區(qū)域地表水環(huán)境對(duì)農(nóng)村各種社會(huì)經(jīng)濟(jì)活動(dòng)的反應(yīng)的敏感程度??梢苑从钞a(chǎn)生地表水水體富營(yíng)養(yǎng)化的概率的大小,敏感性分為5級(jí),即不敏感、輕度敏感、中度敏感、高度敏感、極敏感。根據(jù)相關(guān)的調(diào)查,對(duì)農(nóng)村環(huán)境污染的敏感性評(píng)價(jià)可以采用污染物(COD、TN、TP)的排放濃度結(jié)合水質(zhì)評(píng)價(jià)模型進(jìn)行評(píng)定。具體可有以下3種方法。①單向水質(zhì)指數(shù)法。在確定各基本單元的基本指數(shù)后,用污染物(COD、TN、TP)的水質(zhì)指數(shù)作為變量,進(jìn)行全面的聚類分析,然后根據(jù)分析結(jié)果,劃分敏感級(jí)別。②加權(quán)指數(shù)法。運(yùn)用加權(quán)指數(shù)法可以反映出污染物(COD、TN、TP)在不同地區(qū)對(duì)環(huán)境污染的影響。首先要確定影響農(nóng)村環(huán)境污染敏感性發(fā)熱污染物(COD、TN、TP)的排放濃度,然后再依據(jù)加權(quán)指數(shù)法計(jì)算出各基本敏感單元的敏感性數(shù)值。③內(nèi)梅羅綜合指數(shù)法。如果單項(xiàng)水質(zhì)指數(shù)的數(shù)值變化很大,為了更加有效的突出各個(gè)高值的影響,就可以采用內(nèi)梅羅平均值法。同樣,在確定了各基本單元的內(nèi)梅羅指數(shù)后,以其指數(shù)為變量。進(jìn)行綜合的聚類分析,然后根據(jù)分析結(jié)果劃分敏感性等級(jí)。
3污染程度的區(qū)分
首先確定環(huán)境污染中的主要污染物、總污染負(fù)荷,然后與區(qū)域相結(jié)合確定重點(diǎn)污染區(qū)域,進(jìn)而確定其污染程度。
3.1水質(zhì)系數(shù)和排放濃度要想全面的反映出區(qū)域污染的狀況,要從排污總量和排污濃度兩方面上來進(jìn)行考慮,水質(zhì)系數(shù)反映評(píng)價(jià)標(biāo)準(zhǔn)和污染物濃度之間的關(guān)系,其中:污染物水質(zhì)指數(shù)=該污染物排放濃度/該地環(huán)境質(zhì)量標(biāo)準(zhǔn)
3.2聚類分析進(jìn)行聚類分析要運(yùn)用SPSS軟件,采用Q型聚類,通過對(duì)農(nóng)村環(huán)境污染源等標(biāo)污染的負(fù)荷率進(jìn)行綜合的聚類分析,然后來區(qū)分不同區(qū)域的主要污染類型,比如種植污染型、養(yǎng)殖污染型、綜合污染型、生活污染型等。
4結(jié)語(yǔ)
關(guān)鍵詞:聚類分析 人口區(qū)劃 數(shù)據(jù)挖掘
中圖分類號(hào):C92 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-3973(2013)005-184-03
1 前言
隨著中國(guó)信息化進(jìn)程的加速,各行各業(yè)每天都產(chǎn)生大量的數(shù)據(jù),如何充分利用這些數(shù)據(jù),更好地為人類生產(chǎn)和生活更好地服務(wù)?數(shù)據(jù)挖掘是一種不錯(cuò)的方法,數(shù)據(jù)挖掘又稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),是指從數(shù)據(jù)庫(kù)的大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價(jià)值的信息的非平凡過程。知識(shí)發(fā)現(xiàn)過程由以下三個(gè)階段組成:(1)數(shù)據(jù)準(zhǔn)備;(2)數(shù)據(jù)挖掘;(3)結(jié)果表達(dá)和解釋。
聚類分析(Cluster Analysis)是一種數(shù)據(jù)挖掘方法,是根據(jù)“物以類聚”的道理,對(duì)樣品或指標(biāo)進(jìn)行分類的一種多元統(tǒng)計(jì)分析方法,它們討論的對(duì)象是大量的樣品或數(shù)據(jù),要求能合理按各自的特性來進(jìn)行合理的分類,沒有任何模式可供參考或依循,即是在沒有先驗(yàn)知識(shí)的情況下進(jìn)行的。目前在文獻(xiàn)中存在大量的聚類算法,算法的選擇取決于數(shù)據(jù)的類型、聚類的目的和應(yīng)用。大體上聚類分析主要的算法可以分為:(1)劃分方法;(2)層次的方法;(3)基于密度的方法;(4)基于網(wǎng)格的方法;(5)基于模型的方法。如果聚類分析被用作描述或者探查的工具,可以對(duì)同樣的數(shù)據(jù)嘗試多種算法,以發(fā)現(xiàn)數(shù)據(jù)可能揭示的結(jié)果。聚類方法廣泛應(yīng)用于各行各業(yè)。
人口是基礎(chǔ)數(shù)據(jù),是制定各項(xiàng)政策的依據(jù)。人口區(qū)劃根據(jù)自然、經(jīng)濟(jì)、人口特征及相應(yīng)的指標(biāo)體系,對(duì)全國(guó)人口分布狀況分區(qū)劃片,并提出各區(qū)人口發(fā)展合理目標(biāo)及相應(yīng)的人口政策和措施,為全國(guó)和分區(qū)人口發(fā)展規(guī)劃提供科學(xué)依據(jù),并為國(guó)民經(jīng)濟(jì)計(jì)劃和經(jīng)濟(jì)區(qū)劃服務(wù)。20世紀(jì)80年代初,中國(guó)學(xué)者胡煥庸根據(jù)自然地理特征、人口密度、人口自然增長(zhǎng)、人口遷移、耕地、糧食產(chǎn)量、勞動(dòng)力等指標(biāo),將中國(guó)劃分為人口區(qū),即:黃河下游區(qū),遼吉黑區(qū),長(zhǎng)江中下游區(qū),東南沿海區(qū),晉陜甘寧區(qū),川黔滇區(qū),蒙新區(qū),青藏區(qū)。隨著中國(guó)經(jīng)濟(jì)的迅猛發(fā)展人口分布呈現(xiàn)出許多新的特征,為了適應(yīng)新的趨勢(shì),有必要重新定位和再研究。
2 數(shù)據(jù)與方法
2.1 數(shù)據(jù)來源與指標(biāo)選擇
本研究的數(shù)據(jù)采用2011年全國(guó)31個(gè)省及直轄市的統(tǒng)計(jì)數(shù)據(jù),人口數(shù)據(jù)來源于《中國(guó)人口統(tǒng)計(jì)年鑒》,各省人均可支配收入來源于經(jīng)濟(jì)信息網(wǎng)。因研究的是各省的人口及經(jīng)濟(jì)指標(biāo)聚類,研究區(qū)域很大,信息粒度較大,因此選擇了有代表性的綜合性人口數(shù)據(jù)指標(biāo),人口(總量)、人口密度、人口自然增長(zhǎng)率、第六次人口普查數(shù)據(jù)、人均可支配收入、人均GDP、遷移數(shù)據(jù)。其中人口自然增長(zhǎng)率為(人口出生率-人口死亡率)/人口均值*1000%,遷移數(shù)據(jù)=第六次人口普查數(shù)據(jù)-人口(常住人口)。各省及直轄市的基礎(chǔ)數(shù)據(jù)如表1所示。
2.2 聚類分析原理
3.2 二維聚類
以人均GDP和人口自然增長(zhǎng)率進(jìn)行聚類,數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后,得到的結(jié)果有五類,如表5如示。
從以上聚類結(jié)果看,第一類是沿海地區(qū),經(jīng)濟(jì)較為發(fā)達(dá),人口增長(zhǎng)正常;而第二類內(nèi)陸地區(qū),人均GDP較低,人口自然增長(zhǎng)優(yōu)率較為正常;第三類為東北三省,人均GDP中等,人口增長(zhǎng)率低;第四類為人均GDP高,為三個(gè)直轄市;第五類為人均GDP低,而且人口增長(zhǎng)快的區(qū)域。
3.3 多維聚類
多維聚類時(shí),采用K均值法進(jìn)行聚類,得到的聚類結(jié)果如表6。
根據(jù)多維數(shù)據(jù)聚類,共分為六類,其中第一類屬于人口少,但較為富裕的北京和上海,而第六類為天津,自成一類,主要是流動(dòng)人口及可支配收入較第一類差一些;第四類為經(jīng)濟(jì)發(fā)達(dá)的廣東、江蘇和浙江;第二類為經(jīng)濟(jì)較好,人均收入中等,流動(dòng)人口較少的地區(qū);第五類為經(jīng)濟(jì)欠發(fā)達(dá),人口保持較高增長(zhǎng)率的省份;第三類則是大部分的內(nèi)陸地區(qū)。
4 結(jié)論與討論
本文通過采用聚類分析的手段分析全國(guó)31個(gè)省市人口的發(fā)展規(guī)律,揭示了不同省市在人口發(fā)展之間的相似性和差異性,研究得出合理聚類結(jié)果,為政府和各職能部門在制定人口及各項(xiàng)地方性經(jīng)濟(jì)發(fā)展政策提供依據(jù)。
聚類分析結(jié)果表明,一維、二維和多維聚類分析方法有各自的典型特征有用途。一維聚類分析簡(jiǎn)潔地表明各省人口自然分布規(guī)律,可為國(guó)家對(duì)不同各省份的人口政策提供科學(xué)依據(jù);二維聚類分析直接反應(yīng)了不同省份人口與經(jīng)濟(jì)等指標(biāo)的相互關(guān)系,如論文中對(duì)人均GDP和人口自然增長(zhǎng)率的二維聚類分析,分類結(jié)果合理的體現(xiàn)了當(dāng)前我國(guó)各省經(jīng)濟(jì)發(fā)展與人口特征。多維聚類分析方法適用于對(duì)各省綜合分類,論文中采用了與人口有關(guān)的5個(gè)指標(biāo)進(jìn)行的多維聚類分析,分類結(jié)果有較強(qiáng)的綜合性,與當(dāng)前各省公眾認(rèn)識(shí)的綜合分類一致。
解決了傳統(tǒng)的經(jīng)驗(yàn)分類方法導(dǎo)致的客觀性缺乏等問題。為人口的分類管理實(shí)踐提供了理論依據(jù)和技術(shù)手段。
(本論文為院級(jí)大學(xué)生實(shí)踐創(chuàng)新訓(xùn)練計(jì)劃項(xiàng)目2011XYCXXL14資助項(xiàng)目)
參考文獻(xiàn):
[1] Jiawei Han,Micheline Kambe.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2012.
[2] 陳志泊.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖[M].北京:清華大學(xué)出版社,2009.
[3] 陸學(xué)藝.可持續(xù)發(fā)展實(shí)驗(yàn)區(qū)發(fā)展歷程回顧與建議[J].中國(guó)人口資源與環(huán)境,2007,17(3):1-2.
[4] 張文彤,董偉.SPSS統(tǒng)計(jì)分析高級(jí)教程[M].北京:高等教育出版社,2004:236-237.
[關(guān)鍵詞]專利引證 技術(shù)熱點(diǎn) 耦合 聚類分析
[分類號(hào)]G353.1
1 引言
新技術(shù)的產(chǎn)生可以導(dǎo)致一系列相關(guān)的新產(chǎn)品問世,對(duì)人們的生活、企業(yè)的發(fā)展乃至社會(huì)經(jīng)濟(jì)產(chǎn)生巨大的推動(dòng)作用。在某一新技術(shù)尚未完全成熟之際,必定會(huì)有很多企業(yè)圍繞這一技術(shù)不斷進(jìn)行改進(jìn)和完善,并申請(qǐng)相關(guān)專利技術(shù)進(jìn)行保護(hù)。因此,未來主流市場(chǎng)中的主流技術(shù)在專利文獻(xiàn)中有量的征兆,可以通過對(duì)專利數(shù)據(jù)的定量分析來進(jìn)行技術(shù)熱點(diǎn)的監(jiān)測(cè)。
當(dāng)前利用專利文獻(xiàn)進(jìn)行技術(shù)熱點(diǎn)監(jiān)測(cè)的方法主要有兩種:①通過對(duì)具有技術(shù)含義的專利著錄項(xiàng),如專利IPC分類號(hào)的數(shù)量變化來監(jiān)測(cè)技術(shù)熱點(diǎn);②利用文本挖掘技術(shù),從專利文獻(xiàn)中抽取技術(shù)關(guān)鍵詞進(jìn)行詞頻統(tǒng)計(jì)、聚類分析來監(jiān)測(cè)技術(shù)熱點(diǎn)。在學(xué)術(shù)領(lǐng)域,學(xué)者們基于專利分類號(hào)對(duì)某個(gè)時(shí)間點(diǎn)或時(shí)間段的技術(shù)熱點(diǎn)進(jìn)行了探索。袁冰等指出,通過分析專利涉及的所有IPC分類號(hào),以及這些IPC分類號(hào)下分別包括的專利數(shù)量,就能夠獲知整個(gè)區(qū)域的技術(shù)構(gòu)成情況以及該區(qū)域內(nèi)市場(chǎng)經(jīng)營(yíng)主體關(guān)注的技術(shù)熱點(diǎn)。王燕玲認(rèn)為,將不同主體的1PC分類按時(shí)間分布并加以比較,可發(fā)現(xiàn)不同主體的IPC變化過程,是一個(gè)從創(chuàng)新主體角度研究技術(shù)領(lǐng)域熱點(diǎn)變化的主要方法。左鳳茹對(duì)水電行業(yè)中世界著名企業(yè)的專利申請(qǐng)量按IPC分類號(hào)進(jìn)行統(tǒng)計(jì)后,指出目前水電沒備的研究熱點(diǎn)。欒春娟等認(rèn)為,經(jīng)過德溫特技術(shù)人員標(biāo)引的“德溫特指南代碼”(Derwent Manual Codes),對(duì)研究專利的技術(shù)領(lǐng)域分布更具指導(dǎo)意義,她們利用德溫特指南代碼,陸續(xù)對(duì)基因工程、3G技術(shù)、生物技術(shù)、電動(dòng)汽車領(lǐng)域進(jìn)行了技術(shù)熱點(diǎn)分析。在技術(shù)實(shí)踐領(lǐng)域,主流的專利分析軟件如Thomson Data Analyzer(TDA)、Aureka、HIT-恒庫(kù)等正是基于上述原理,實(shí)現(xiàn)了從批量專利文獻(xiàn)中抽取專利分類號(hào)或技術(shù)特征詞匯進(jìn)行統(tǒng)計(jì)、聚類分析的功能,并用可視化的方式展示分析結(jié)果,生成相應(yīng)的專利地圖,進(jìn)行技術(shù)熱點(diǎn)監(jiān)測(cè)。以Aureka為例,它提供了ThemeSeape地形圖功能,以分析的專利樣本為基礎(chǔ),對(duì)其中相關(guān)詞匯的詞頻應(yīng)用聚類分析生成主題(詞匯)地形圖,以此來描述專利技術(shù)熱點(diǎn)的分布情況。
但是,由于IPC的分類原則是將同一技術(shù)主題歸在同一分類位置,使之具有相同的分類號(hào),即側(cè)重于對(duì)單一技術(shù)主題進(jìn)行分類,而且IPC將專利要求的技術(shù)主題作為一個(gè)整體來分類,而不是對(duì)其各個(gè)組成部分分別進(jìn)行分類,因此分類不徹底,也造成分類不夠細(xì),某個(gè)分類號(hào)下存在大量文獻(xiàn)。這樣一來,基于IPC分類號(hào)的技術(shù)熱點(diǎn)難免存在偏差,且比較宏觀,難以反映企業(yè)關(guān)注的微觀技術(shù)熱點(diǎn)變化,更難以揭示技術(shù)日新月異的變化和發(fā)展。而利用模式匹配、規(guī)則基礎(chǔ)和自然語(yǔ)言處理技術(shù)直接從專利文本中抽取詞和詞組進(jìn)行統(tǒng)計(jì)或聚類分析,雖然相對(duì)比較精確和具體,但也存在著一些相關(guān)陛較高的詞組或短語(yǔ),因?yàn)槌霈F(xiàn)過于頻繁而容易被軟件分析系統(tǒng)自動(dòng)剔除,造成分析的誤差。因此,如何提高基于專利文獻(xiàn)技術(shù)熱點(diǎn)監(jiān)測(cè)的準(zhǔn)確性,如何利用專利引文所承載的技術(shù)關(guān)聯(lián)信息進(jìn)行獲取和關(guān)聯(lián)挖掘,如何對(duì)已有的宏觀技術(shù)熱點(diǎn)和微觀技術(shù)熱點(diǎn)監(jiān)測(cè)進(jìn)行補(bǔ)充,是本文研究的主要問題。
2 基于專利引證的技術(shù)熱點(diǎn)監(jiān)測(cè)方法
2.1 專利引文的技術(shù)情報(bào)價(jià)值
專利對(duì)先有技術(shù)(prior art)和科學(xué)論文的引用是科學(xué)和技術(shù)發(fā)展規(guī)律的表現(xiàn),它體現(xiàn)了科學(xué)和技術(shù)的累積性、連續(xù)性和繼承性,也體現(xiàn)了不同學(xué)科、不同研究層次之間的交叉、滲透。大多數(shù)發(fā)明不是“無中生有”的,一般發(fā)明人在進(jìn)行發(fā)明創(chuàng)造活動(dòng)時(shí),會(huì)參考具有相同發(fā)明目的的先有技術(shù)的發(fā)明創(chuàng)造內(nèi)容和發(fā)明人所熟知的先有技術(shù)。另外,專利審查員審查專利文件時(shí)常會(huì)將被審查的專利與主題相近的先有技術(shù)相比較,這兩種方式導(dǎo)致了專利引文的出現(xiàn)。Arehibugi和Pianta指出,專利引文數(shù)據(jù)廣泛地提供了具體技術(shù)領(lǐng)域某一技術(shù)發(fā)明的相關(guān)技術(shù)信息。
1965年,普賴斯創(chuàng)造性地研究了科學(xué)論文之間的施引與被引證關(guān)系,以及由此形成的所謂“引證網(wǎng)絡(luò)”。專利引證網(wǎng)絡(luò)是將文獻(xiàn)計(jì)量引證網(wǎng)絡(luò)的對(duì)象從科技論文到專利文獻(xiàn)的直接延伸,通過繪制專利引證關(guān)系圖來考察互相引證的專利的關(guān)聯(lián)程度和技術(shù)相互間的影響,尋找最早被引證的專利文獻(xiàn),洞悉專利的繼承性和發(fā)展歷程。專利與其引證論文或引證專利密切相關(guān),反映了相同或相近的技術(shù)創(chuàng)新,這種相關(guān)性是由技術(shù)本身的傳承和發(fā)展而形成的。據(jù)此,利用各種數(shù)學(xué)以及統(tǒng)計(jì)學(xué)的方法對(duì)專利與專利之間的施引和被引現(xiàn)象進(jìn)行比較、歸納、抽象判斷,以探索其數(shù)量特征及內(nèi)在價(jià)值,專利引文分析也具有重要的技術(shù)競(jìng)爭(zhēng)情報(bào)價(jià)值。
2.2 基于專利引證進(jìn)行技術(shù)熱點(diǎn)監(jiān)測(cè)方面的實(shí)踐應(yīng)用
借助專利與專利間的引用與被引用關(guān)系,不僅可以揭示出專利的理論、技術(shù)起源,而且可以對(duì)技術(shù)領(lǐng)域中的技術(shù)前沿和技術(shù)熱點(diǎn)進(jìn)行追蹤。Mogee等利用專利同被引(patent co-cltation)對(duì)2808條Eli Lilly公司的專利數(shù)據(jù)進(jìn)行聚類分析,識(shí)別該公司的核心專利技術(shù)和技術(shù)熱點(diǎn)群組,發(fā)現(xiàn)主要的技術(shù)熱點(diǎn)(teehnolo-gy fronts)。孫濤濤等基于專利耦合關(guān)系,指出同時(shí)引用相同基礎(chǔ)技術(shù)專利簇的另一個(gè)專利簇(base tech-nology)可以構(gòu)成技術(shù)熱點(diǎn)。尹麗春等將文獻(xiàn)計(jì)量學(xué)中的共被引方法應(yīng)用到專利文獻(xiàn)的研究中,對(duì)在我國(guó)申請(qǐng)的數(shù)字信息傳輸領(lǐng)域中的專利技術(shù)前沿問題進(jìn)行探討。
目前市場(chǎng)上各種專業(yè)的商業(yè)化專利分析軟件(如法國(guó)IMCS的Matheo Analyzer、美國(guó)湯森路透旗下的Aureka、Innovation和Delphion、中國(guó)恒和頓的HIT-恒庫(kù)等)幾乎都有繪制引證網(wǎng)絡(luò)圖的功能,利于追溯目標(biāo)技術(shù)的起源和發(fā)展。但是這些軟件工具無法利用專利文獻(xiàn)中的同被引或耦合技術(shù),借助可視化關(guān)系揭示技術(shù)前沿或者技術(shù)熱點(diǎn)。
2.3 基于專利引證的技術(shù)熱點(diǎn)監(jiān)測(cè)方法設(shè)計(jì)
研究首先通過基于“關(guān)鍵詞+專利引文”的檢索策略,從專利數(shù)據(jù)庫(kù)中檢索、下載研究主題范圍內(nèi)的原始專利數(shù)據(jù),構(gòu)建本地專利專題數(shù)據(jù)庫(kù);其次,按照分析需要對(duì)本地原始專利數(shù)據(jù)進(jìn)行拙取,將專利號(hào)、題名、發(fā)明人等專利著錄項(xiàng)從專利文獻(xiàn)中抽取出來,完成數(shù)據(jù)預(yù)處理;再次,分別利用專利耦合聚類和具體概念詞聚類,實(shí)現(xiàn)由淺至深、由粗到細(xì)的技術(shù)熱點(diǎn)監(jiān)測(cè)。具體實(shí)施流程如圖l所示:
值得注意的是,為了構(gòu)建準(zhǔn)確、有效的專題數(shù)據(jù)集-進(jìn)行分析,專利數(shù)據(jù)檢索至關(guān)重要。在專利數(shù)據(jù)采集的過程中,首先采用關(guān)鍵詞試檢,從試檢結(jié)果中尋找相
應(yīng)表達(dá)的同義或近義詞,擴(kuò)充、調(diào)整檢索策略,力求保證關(guān)鍵詞的全面性與準(zhǔn)確性,構(gòu)建初始專利數(shù)據(jù)集。然后對(duì)初始專利數(shù)據(jù)集中的專利進(jìn)行被引頻次排序,遴選25-50個(gè)高被引專利作為種子專利,并請(qǐng)領(lǐng)域?qū)<覍?duì)種子專利進(jìn)行判讀。如果專家認(rèn)為研究領(lǐng)域的種子專利不準(zhǔn)確,則需要重新回到第一步,調(diào)整檢索策略進(jìn)行數(shù)據(jù)檢索。
此外,在利用專利耦合進(jìn)行技術(shù)監(jiān)測(cè)的過程中,要注意設(shè)定合適的專利耦合閾值,閾值過大或過小都會(huì)影響耦合矩陣的構(gòu)建,從而影響耦合技術(shù)熱點(diǎn)的聚類。同時(shí),那些低于耦合閾值的專利內(nèi)容相對(duì)分散,較難形成熱點(diǎn),應(yīng)該予以舍棄。
2.3.1 基于專利引證的技術(shù)領(lǐng)域數(shù)據(jù)集構(gòu)建 利用專利引文和專利引文索引能識(shí)別那些用其他方式不能識(shí)別的專利之間的關(guān)系,而且這些關(guān)系往往可以使相關(guān)信息的檢索變得迅速。正如Garfield E所言,除了專利引文和專利引文索引,現(xiàn)在尚無一種更加有效的工具可以確定某一專利所透露的技術(shù)是如何被改動(dòng)、完善和利用的。馬海群指出,引用檢索作為傳統(tǒng)專利情報(bào)檢索方式(如分類或主題檢索)的重要補(bǔ)充,可以有效地提高專利檢索的查準(zhǔn)率和查全率。借助專利與專利間的引用與被引用關(guān)系,本文提出“關(guān)鍵詞+專利引文”的技術(shù)領(lǐng)域?qū)@墨I(xiàn)數(shù)據(jù)集構(gòu)建方法,獲得同一批技術(shù)專利技術(shù)起源的所有相關(guān)專利數(shù)據(jù),提升檢索效率、增強(qiáng)資料的搜集性及準(zhǔn)確性,具體步驟如下:①與領(lǐng)域?qū)<矣懻?,確定相關(guān)檢索技術(shù)關(guān)鍵詞,確定檢索式進(jìn)行關(guān)鍵詞檢索;②根據(jù)初檢結(jié)果,構(gòu)建與專題技術(shù)相關(guān)的初始專利數(shù)據(jù)集;③遴選TOP25-TOP50高被引專利作為該技術(shù)領(lǐng)域的種子專利;④檢索引證種子專利的專利(citing patent)及其被引專利(cited patent),構(gòu)建專題技術(shù)數(shù)據(jù)集。
通過上述步驟,構(gòu)建待分析的技術(shù)專題數(shù)據(jù)集,其專利引證關(guān)系如圖2所示:
2.3.2 技術(shù)熱點(diǎn)監(jiān)測(cè)方法文獻(xiàn)中的間接關(guān)聯(lián)包括文獻(xiàn)耦合和同被引兩種,都能用來確定研究熱點(diǎn)(re-search fronts)。正如Persson和Morris。所言,耦合論文可以反映“研究熱點(diǎn)”的知識(shí)結(jié)構(gòu),同被引論文則提供了一種知識(shí)基礎(chǔ)(intellectual base)的知識(shí)結(jié)構(gòu)。Glanzel指出論文從發(fā)表到被引用期問有一個(gè)明顯的時(shí)滯,用同被引來映射學(xué)科結(jié)構(gòu)存在時(shí)差,而耦合分析則可以實(shí)時(shí)地反映學(xué)科最新的動(dòng)態(tài)變化。Van denBesselaar P等也指出,耦合測(cè)度的是源文獻(xiàn)之間的關(guān)系,同被引測(cè)度的是被引文獻(xiàn)之間的關(guān)系。前者是基于有意識(shí)的行為,即著者有意地將兩篇文獻(xiàn)聯(lián)系起來,而后者僅是兩篇文獻(xiàn)出現(xiàn)之后的偶然關(guān)聯(lián)。因此,文獻(xiàn)耦合更適于最新研究主題的揭示。
為了在基于IPC分類號(hào)的宏觀技術(shù)熱點(diǎn)和基于詞的微觀技術(shù)熱點(diǎn)中找到一個(gè)較好的平衡點(diǎn),本文首先利用專利之間的耦合關(guān)系獲得耦合專利簇,形成中觀層面上的技術(shù)熱點(diǎn)?技術(shù)熱點(diǎn)交由領(lǐng)域?qū)<易R(shí)別,為其命名。其次,引入時(shí)間軸的概念,對(duì)耦合聚類實(shí)現(xiàn)的技術(shù)熱點(diǎn)發(fā)展趨勢(shì)進(jìn)行分析,幫助技術(shù)決策者了解每個(gè)技術(shù)熱點(diǎn)隨時(shí)間的發(fā)展變化情況。再次,利用自然語(yǔ)言處理技術(shù),從技術(shù)熱點(diǎn)的專利文本中抽取詞和詞組進(jìn)行統(tǒng)汁和聚類分析,獲得以概念詞為表征的技術(shù)熱點(diǎn),輔助技術(shù)決策。
3 實(shí)證研究
3.1 數(shù)據(jù)集的構(gòu)建
本文采川基于專利引證的方法構(gòu)建技術(shù)領(lǐng)域?qū)n}數(shù)據(jù)集。研究以DVD領(lǐng)域激光頭技術(shù)為例,經(jīng)與領(lǐng)域?qū)<矣懻?,將optical head、pickup和pick up確定為檢索關(guān)鍵詞,從美國(guó)專利商標(biāo)局(USPTO)文摘庫(kù)中檢索1995-2004年1O年間的專利數(shù)據(jù),檢索出1934個(gè)專利構(gòu)建DVD激光頭技術(shù)領(lǐng)域初始專利數(shù)據(jù)集。從巾遴選TOP25高被引專利作為該技術(shù)領(lǐng)域的種子專利。從USPT0數(shù)據(jù)庫(kù)中檢索出種子專利的729個(gè)施引專利(citing patent),去重后得到515個(gè)。上述515個(gè)專利又引用了3397個(gè)(去重后)被引專利(cited patent)。分別將上述數(shù)據(jù)下載到本地,構(gòu)建專題數(shù)據(jù)庫(kù),作為本次研究的分析對(duì)象。
3.2 基于專利耦合的技術(shù)熱點(diǎn)分析
研究首先將515個(gè)專利和3397個(gè)被引專利的專利號(hào)(patent number)、題名(title)、授權(quán)日期(issuedate)、專利權(quán)人(assignee)、技術(shù)分類號(hào)(IPC)從數(shù)據(jù)集中抽取出來,為后續(xù)分析做準(zhǔn)備。然后將研究的耦合閾值確定為4,對(duì)原始數(shù)據(jù)集中的515個(gè)專利進(jìn)行篩選,舍棄專利耦合強(qiáng)度少于4的那部分專利,得到272個(gè)專利作進(jìn)一步的分析。
其次,根據(jù)專利之間的引證關(guān)系,生成專利初始引證矩陣。這是個(gè)典型的二值矩陣,即矩陣中所有的元素取值均為0或者1,如果兩個(gè)專利之間存在著引證關(guān)系,即取值為1;如果兩個(gè)專利之間不存在引證關(guān)系,即取值為0。本例中的研究對(duì)象有272個(gè)專利,需要生成272×272的矩陣,由于文章篇幅限制,略去原始的272×272矩陣。專利初始引證矩陣是一個(gè)不對(duì)稱矩陣,根據(jù)初始引證矩陣轉(zhuǎn)換成對(duì)稱的專利耦合矩陣。
再次,采用層次聚類法對(duì)專利單元樣本進(jìn)行聚類分析。聚類的過程是:先將n維專利耦合矩陣轉(zhuǎn)換成n維的相似矩陣,然后根據(jù)一定的聚類算法把分析對(duì)象分成類群。在選擇相似性(similarity)測(cè)度方法時(shí),本文采用了Dice相關(guān)系數(shù)來對(duì)耦合距陣進(jìn)行標(biāo)準(zhǔn)化處理,采用離差平方和法(ward’s method)計(jì)算類間距離。上述步驟用Matlab提供的statistics toolbox工具,選擇層次聚類方法實(shí)現(xiàn),將耦合強(qiáng)度大于4的專利聚成了10個(gè)小類的專利簇,得到10個(gè)技術(shù)熱點(diǎn),并通過領(lǐng)域?qū)<規(guī)椭?,給每個(gè)技術(shù)子主題命名。
最后,繪制各技術(shù)熱點(diǎn)的發(fā)展演變圖,考察技術(shù)熱點(diǎn)在10年間的發(fā)展變化。從DVD激光頭技術(shù)各個(gè)子技術(shù)主題在10年間(1995-2004年)的發(fā)展趨勢(shì)來看,大部分子技術(shù)主題在1997-2002年處于上升階段,隨后縮量發(fā)展,從一個(gè)側(cè)面說明激光頭技術(shù)整體而言已經(jīng)相對(duì)成熟,自2003年始發(fā)明創(chuàng)新逐漸減少。其中,生命力最為旺盛的是技術(shù)熱點(diǎn)4――光記錄設(shè)備,從1997年至2004年不斷有新技術(shù)發(fā)明問世。DVD激光頭技術(shù)10個(gè)熱點(diǎn)的發(fā)展演變?nèi)鐖D3所示:
3.3 基于詞聚類的技術(shù)熱點(diǎn)分析
為了考察光記錄設(shè)備這一技術(shù)熱點(diǎn)的具體情況,隨后將光記錄設(shè)備的87條專利數(shù)據(jù)導(dǎo)入Patentics專利檢索分析平臺(tái),進(jìn)行概念聚類分析,得到10組概念索引詞,表征光記錄設(shè)備的詳細(xì)技術(shù)熱點(diǎn),見表1。
其中,關(guān)于物鏡的專利占了該技術(shù)熱點(diǎn)的1/4,其次為光度頭和激光束。在這些子技術(shù)熱點(diǎn)中,日立、松下電工、富士施樂、日本電氣等日本企業(yè)在光度頭中表現(xiàn)突出,日立、富士施樂、希捷等企業(yè)在激光束中有較大的技術(shù)優(yōu)勢(shì)。
4 研究結(jié)論
基于專利引證的技術(shù)熱點(diǎn)監(jiān)測(cè)方法在技術(shù)領(lǐng)域數(shù)據(jù)集的構(gòu)建和熱點(diǎn)監(jiān)測(cè)過程中,有針對(duì)性地對(duì)專利引文所承載的技術(shù)關(guān)聯(lián)信息進(jìn)行獲取和關(guān)聯(lián)挖掘,使得數(shù)據(jù)分析的目標(biāo)更加明確,通過專利耦合尋找微觀技術(shù)熱點(diǎn)群獲得的技術(shù)熱點(diǎn)更為凝練、精確。此外,在凝練的微觀技術(shù)熱點(diǎn)群中利用技術(shù)特征詞匯進(jìn)行聚類監(jiān)測(cè),詞或短語(yǔ)的專指度更高,能有效避免出現(xiàn)詞或短語(yǔ)的高峰區(qū)域內(nèi)個(gè)別專利不屬于此技術(shù)領(lǐng)域的分析誤差現(xiàn)象。因此,無論在理論上還是實(shí)際操作中,基于技術(shù)特征詞匯的技術(shù)熱點(diǎn)監(jiān)測(cè)更具有效性和可靠性,是對(duì)以往單純基于IPC分類號(hào)或基于詞處理技術(shù)獲得技術(shù)熱點(diǎn)的有效補(bǔ)充和參考。
關(guān)鍵詞:聚類分析;數(shù)據(jù)挖掘
中圖分類號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2008)12-20ppp-0c
Cluster Anlaysis Methods of Data Mining
HUANG Li-wen
(School of Science, Quanzhou Normal University, Quanzhou 362000, China)
Abstract: Cluster analysis is one of the important methods of multivariate statistical analysis, and this method has a wide range of applications in many fields. In this paper, the classification of the cluster is introduced briefly, and then gives some common methods of cluster analysis and the advantages and disadvantages of these methods,and these clustering method were compared and anslyzed so that people can chose suitable clustering methods according to the actual issues.
Key words: Cluster Analysis; Data Mining?
1 引言
聚類分析是數(shù)據(jù)挖掘中的重要方法之一,它把一個(gè)沒有類別標(biāo)記的樣本集按某種準(zhǔn)則劃分成若干個(gè)子類,使相似的樣品盡可能歸為一類,而不相似的樣品盡量劃分到不同的類中。目前,該方法已經(jīng)被廣泛地應(yīng)用于生物、氣候?qū)W、經(jīng)濟(jì)學(xué)和遙感等許多領(lǐng)域,其目的在于區(qū)別不同事物并認(rèn)識(shí)事物間的相似性。因此,聚類分析的研究具有重要的意義。
本文主要介紹常用的一些聚類方法,并從聚類的可伸縮性、類的形狀識(shí)別、抗“噪聲”能力、處理高維能力和算法效率五個(gè)方面對(duì)其進(jìn)行比較分析,以便人們根據(jù)實(shí)際的問題選擇合適的聚類方法。
2 聚類的分類
聚類分析給人們提供了豐富多彩的分類方法,這些方法大致可歸納為以下幾種[1,2,3,4]:劃分方法、層次方法、基于密度的聚類方法、基于網(wǎng)格的聚類方法和基于模型的聚類方法。
2.1 劃分法(partitionging methods)
給定一個(gè)含有n個(gè)對(duì)象(或元組)的數(shù)據(jù)庫(kù),采用一個(gè)劃分方法構(gòu)建數(shù)據(jù)的k個(gè)劃分,每個(gè)劃分表示一個(gè)聚簇,且k≤n。在聚類的過程中,需預(yù)先給定劃分的數(shù)目k,并初始化k個(gè)劃分,然后采用迭代的方法進(jìn)行改進(jìn)劃分,使得在同一類中的對(duì)象之間盡可能地相似,而不同類的中的對(duì)象之間盡可能地相異。這種聚類方法適用于中小數(shù)據(jù)集,對(duì)大規(guī)模的數(shù)據(jù)集進(jìn)行聚類時(shí)需要作進(jìn)一步的改進(jìn)。
2.2 層次法(hietarchical methods)
層次法對(duì)給定數(shù)據(jù)對(duì)象集合按層次進(jìn)行分解,分解的結(jié)果形成一顆以數(shù)據(jù)子集為節(jié)點(diǎn)的聚類樹,它表明類與類之間的相互關(guān)系。根據(jù)層次分解是自低向上還是自頂向下,可分為凝聚聚類法和分解聚類法:凝聚聚類法的主要思想是將每個(gè)對(duì)象作為一個(gè)單獨(dú)的一個(gè)類,然后相繼地合并相近的對(duì)象和類,直到所有的類合并為一個(gè),或者符合預(yù)先給定的終止條件;分裂聚類法的主要思想是將所有的對(duì)象置于一個(gè)簇中,在迭代的每一步中,一個(gè)簇被分裂為更小的簇,直到最終每個(gè)對(duì)象在單獨(dú)的一個(gè)簇中,或者符合預(yù)先給定的終止條件。在層次聚類法中,當(dāng)數(shù)據(jù)對(duì)象集很大,且劃分的類別數(shù)較少時(shí),其速度較快,但是,該方法常常有這樣的缺點(diǎn):一個(gè)步驟(合并或分裂)完成,它就不能被取消,也就是說,開始錯(cuò)分的對(duì)象,以后無法再改變,從而使錯(cuò)分的對(duì)象不斷增加,影響聚類的精度,此外,其抗“噪聲”的能力也較弱,但是若把層次聚類和其他的聚類技術(shù)集成,形成多階段聚類,聚類的效果有很大的提高。
2.3 基于密度的方法(density-based methods)
該方法的主要思想是只要臨近區(qū)域的密度(對(duì)象或數(shù)據(jù)點(diǎn)的數(shù)目)超過某個(gè)閾值,就繼續(xù)聚類。也就是說,對(duì)于給定的每個(gè)數(shù)據(jù)點(diǎn),在一個(gè)給定范圍的區(qū)域中必須至少包含某個(gè)數(shù)目的點(diǎn)。這樣的方法就可以用來濾處"噪聲"孤立點(diǎn)數(shù)據(jù),發(fā)現(xiàn)任意形狀的簇。
2.4 基于網(wǎng)格的方法(grid-based methods)
這種方法是把對(duì)象空間量化為有限數(shù)目的單元,形成一個(gè)網(wǎng)格結(jié)構(gòu)。所有的聚類操作都在這個(gè)網(wǎng)格結(jié)構(gòu)上進(jìn)行。用這種方法進(jìn)行聚類處理速度很快,其處理時(shí)間獨(dú)立于數(shù)據(jù)對(duì)象的數(shù)目,只與量化空間中每一維的單元數(shù)目有關(guān)。
2.5 基于模型的方法(model-based method)
基于模型的方法為每個(gè)簇假定一個(gè)模型,尋找數(shù)據(jù)對(duì)給定模型的最佳擬合。該方法經(jīng)?;谶@樣的假設(shè):數(shù)據(jù)是根據(jù)潛在的概率分布生成的。該方法主要有兩類:統(tǒng)計(jì)學(xué)方法和神經(jīng)網(wǎng)絡(luò)方法。
3 常用的聚類算法
目前,已經(jīng)提出的聚類算法很多,常用的聚類算法主要有以下幾種:系統(tǒng)聚類法、動(dòng)態(tài)聚類法、CLARANS、CURE、DBSCAN、STING和模糊聚類法(FCM)。
3.1 系統(tǒng)聚類法
系統(tǒng)聚類法[5]是將n個(gè)樣品看成n類,即一類包含一個(gè)樣品;然后將性質(zhì)最接近的兩類合并成一個(gè)新類,這樣就得到n-1類,再?gòu)倪@n-1類中找出性質(zhì)最接近的兩類加以合并,成了n-2類;如此下去,最后所有的樣品均成一類;將上述類的合并過程畫成一張圖(這圖常稱為聚類圖),這樣便可決定分多少類,每類各有什么樣品。
系統(tǒng)聚類法的計(jì)算簡(jiǎn)單,而且其聚類結(jié)果給出一個(gè)譜系圖,因此,可以根據(jù)該圖選擇所需要的聚類結(jié)果。但是,它也有不足之處,其主要表現(xiàn)在以下幾個(gè)方面:1)當(dāng)樣品數(shù)量很多時(shí),而且只需要?jiǎng)澐譃檩^少的類別時(shí),這種聚類方法的重復(fù)計(jì)算量很大;2)當(dāng)某一樣品劃歸某一個(gè)類后,其屬性不變,若分類方法的選擇不當(dāng),對(duì)聚類的精度影響很大;3)對(duì)大數(shù)據(jù)量進(jìn)行處理時(shí),計(jì)算機(jī)內(nèi)存開銷很大,有時(shí),計(jì)算機(jī)受此限制而無法進(jìn)行聚類分析,而且其速度很慢;4)抗干擾的能力很弱。
3.2 動(dòng)態(tài)聚類算法
動(dòng)態(tài)聚類法[5]就是在開始時(shí)先建立一批初始中心,而讓待分的各個(gè)樣品依據(jù)某種判別準(zhǔn)則向初始中心凝聚,然后再逐步修改調(diào)整中心,重新分類;并根據(jù)各類離散性統(tǒng)計(jì)量(如均方差)和兩類間可分離性的統(tǒng)計(jì)量(如類間標(biāo)準(zhǔn)化距離、J-M距離等)再進(jìn)行合并和分裂。此后在修改調(diào)整中心,這樣不斷繼續(xù)下去,直到分類比較合適為止。
動(dòng)態(tài)聚類法使用隨機(jī)方式選擇 作為初始聚類中心,按照算法的迭代執(zhí)行,整個(gè)算法的結(jié)束條件是類的重心(或凝聚點(diǎn))不再改變,它的計(jì)算復(fù)雜性是O(nkt),其中,n為樣本數(shù)量,k為聚類數(shù),t為迭代次數(shù)。與系統(tǒng)聚類法相比,動(dòng)態(tài)聚類法明顯的優(yōu)勢(shì)是運(yùn)算量小,能用于處理龐大的樣本數(shù)據(jù),也為實(shí)時(shí)處理提供了一定的可能性,但其也存在一些缺點(diǎn),主要表現(xiàn)在以下幾個(gè)方面:(1)動(dòng)態(tài)聚類法要求用戶必須事先給出聚類的數(shù)目,選擇初始劃分的最佳方向、更新分區(qū)和停止準(zhǔn)則,且其結(jié)果與數(shù)據(jù)輸入順序有關(guān),不同的初始值可能會(huì)導(dǎo)致不同的結(jié)果;(2)對(duì)于噪聲和孤立點(diǎn)敏感,很容易受例外情況的影響,適用于發(fā)現(xiàn)球狀類,但不適合發(fā)現(xiàn)非凸面狀的簇,不適合大小差別較大的簇;(3)一個(gè)對(duì)象只能屬于一個(gè)類中,不能多維揭示其多重屬性。
3.3 CLARANS算法
CLARANS[2,6,9]也叫隨機(jī)搜索聚類算法,是一種分割聚類方法。該算法是基于CLARA算法的改進(jìn),與CLARA算法不同的是:CLARA算法在每個(gè)階段都選取一個(gè)固定樣本,而CLARANS在搜索的每一步都帶一定的隨機(jī)性選取一個(gè)樣本,在替換了一個(gè)中心點(diǎn)后得到的聚類結(jié)果被稱為當(dāng)前聚類結(jié)果的鄰居,搜索的鄰居點(diǎn)數(shù)目被用戶定義的一個(gè)參數(shù)加以限制。如果找到一個(gè)比它更好的鄰居,則把中心點(diǎn)移到該鄰居節(jié)點(diǎn)上,否則把該點(diǎn)作為局部最小量,然后再隨機(jī)選擇一個(gè)點(diǎn)來尋找另一個(gè)局部最小量。
該算法能夠探測(cè)孤立點(diǎn),并適用于大型數(shù)據(jù)庫(kù),但其計(jì)算復(fù)雜度復(fù)雜度較高,大約為O(n2);此外,該算法對(duì)數(shù)據(jù)輸入的順序敏感,適用于凸形或球形數(shù)據(jù)。
3.4 CURE算法
CURE[6,7,8]算法是一種使用代表點(diǎn)的聚類算法。該方法首先把每個(gè)數(shù)據(jù)點(diǎn)看成一簇,然后再以一個(gè)特定的收縮因子向中心“收縮”,即合并兩個(gè)距離最近的代表點(diǎn)的簇,直至達(dá)到預(yù)先給定的聚類個(gè)數(shù)為止。它回避了用所有點(diǎn)或單個(gè)質(zhì)心來表示一個(gè)簇的傳統(tǒng)方法,將一個(gè)簇用多個(gè)代表點(diǎn)來表示,使CURE可以適應(yīng)非球形的幾何形狀。另外,收縮因子降底了噪音對(duì)聚類的影響,從而使CURE對(duì)孤立點(diǎn)的處理更加健壯,而且能識(shí)別非球形和大小變化比較大的簇。
該算法采用隨機(jī)抽樣與分割相結(jié)合的方法來提高聚類效率,對(duì)于大型數(shù)據(jù)庫(kù),它也具有良好的伸縮性,運(yùn)行速度很快,而且有較好的聚類效果,其計(jì)算復(fù)雜度為O(n)。
3.5 DBSCAN算法
DBSCAN算法[6,7,8,9]是一種基于高密度連接區(qū)域密度的聚類算法。該方法將密度足夠高的區(qū)域劃分為簇,并可以在帶有“噪聲”的空間數(shù)據(jù)庫(kù)中發(fā)現(xiàn)任意形狀的聚類。其主要的思想是通過檢查數(shù)據(jù)庫(kù)中每個(gè)點(diǎn)的ε-鄰域來尋找聚類。如果第一個(gè)點(diǎn)p的ε-鄰域包含多于MinPts個(gè)點(diǎn),則創(chuàng)建一個(gè)以P作為核心對(duì)象的新簇,否則先把它暫時(shí)標(biāo)為噪聲點(diǎn),跳到下一個(gè)點(diǎn),并判斷它是否為核心點(diǎn)。然后反復(fù)地尋找從這些核心點(diǎn)直接密度可達(dá)的對(duì)象,當(dāng)沒有新的點(diǎn)可以被添加到任何簇時(shí),該過程結(jié)束。
該算法可以數(shù)據(jù)集中的所有簇和噪聲,但其不對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理而直接進(jìn)行聚類操作,當(dāng)數(shù)據(jù)集很大時(shí),占用內(nèi)存很大,而且I/O消耗也很大,如果采用空間索引,其計(jì)算復(fù)雜度為O(nlogn),否則,其計(jì)算復(fù)雜度為O(n2)。
3.6 STING算法
STING算法[2,3,8]是一種基于風(fēng)格的多分辨率聚類技術(shù),它將空間區(qū)域劃分為矩形單元。針對(duì)不同級(jí)別的分辨率,通常存在多個(gè)級(jí)別的矩形單元,這些單元形成了一個(gè)層次結(jié)構(gòu),高層的每個(gè)單元被劃分為多個(gè)低一層的單元,高層單元的統(tǒng)計(jì)參數(shù)可以很容易地從低層單元計(jì)算得到,而統(tǒng)計(jì)信息的查詢則采用自頂向下的基于網(wǎng)格的方法。這些參數(shù)包括:屬性無關(guān)的參數(shù)count;屬性相關(guān)的參數(shù)m(平均值)、s(標(biāo)準(zhǔn)偏差)、min(最小值)、max(最大值)以及該單元中屬性值遵循的分布(distribution)類型。該算法預(yù)先計(jì)算和存儲(chǔ)每個(gè)單元的統(tǒng)計(jì)信息,它不依賴于查詢的匯總信息。
該算法主要優(yōu)點(diǎn)是效率高,有利于并行處理和增量更新;它通過掃描數(shù)據(jù)庫(kù)一次來計(jì)算單元的統(tǒng)計(jì)信息,因而其計(jì)算復(fù)雜度為O(n)。在層次結(jié)構(gòu)建立后,其查詢處理的計(jì)算復(fù)雜度為O(m),其中m為最低層網(wǎng)格單元的數(shù)目。其缺點(diǎn)是聚類質(zhì)量取決于網(wǎng)格結(jié)構(gòu)最低層的粒度,粒度的大小會(huì)明顯影響處理代價(jià),特別是當(dāng)數(shù)據(jù)集的維數(shù)較高時(shí),由于生成網(wǎng)格層次及每一層的單元數(shù)較多,算法的效率會(huì)降低。
3.7 模糊聚類算法(FCM)
傳統(tǒng)的聚類分析是一種硬劃分,它把每個(gè)待識(shí)別的對(duì)象嚴(yán)格地劃分到某類中,具有“非此即彼”的性質(zhì);而在實(shí)際中,大多數(shù)對(duì)象并沒有嚴(yán)格的屬性,它們?cè)谛詰B(tài)和類屬方面存在著中介性,具有“亦此亦彼”的性質(zhì);鑒于此,人們開始用模糊的方法來處理這類問題,從而產(chǎn)生了模糊聚類的方法,也就是說,模糊聚類法[5]是將模糊數(shù)學(xué)的思想觀點(diǎn)用到聚類分析中產(chǎn)生的方法,其關(guān)鍵是隸屬函數(shù)的確定。該方法多用于定性變量的分類。其主要算法如下:
(1)選擇一個(gè)初始模糊分類方案,將n個(gè)樣本分成k個(gè)模糊類,得到一個(gè)模糊隸屬度矩陣U={uij,i=1,2,…,n;j=1,2,…,k},其中uij表示樣本Xi對(duì)模糊集Cj的隸屬度,uij∈[0,1];
(2)利用矩陣 計(jì)算模糊評(píng)判函數(shù)的值,模糊評(píng)判函數(shù)通常是一個(gè)與對(duì)應(yīng)的分類相聯(lián)系的加權(quán)平方誤差和
是第k個(gè)模糊集的中心,重新分配樣本到各模糊集以減少評(píng)判函數(shù)的值并重新計(jì)算U;
(3)重復(fù)(2),直到矩陣U不再有較大的變動(dòng)。
模糊聚類解決了一些混合對(duì)象的歸類問題,同時(shí),當(dāng)樣本數(shù)較少的時(shí)候,應(yīng)用該方法的優(yōu)越性也比較明顯,另外,其抗干擾的能力也較強(qiáng);但是,它對(duì)一些隱含類的提取能力還有待于進(jìn)一步的改進(jìn),除此之外,預(yù)定的分類數(shù)目一般也是人為決定的,同動(dòng)態(tài)聚類一樣,就可能出現(xiàn)人為預(yù)定的分類數(shù)與實(shí)際存在的類數(shù)不相符這種情況,從而影響分類的結(jié)果。
4 聚類的性能比較
基于上述的分析,現(xiàn)從可伸縮性、類的形狀識(shí)別、抗噪聲能力、處理高維能力和算法效率五個(gè)方面對(duì)常用聚類算法的性能進(jìn)行了比較,結(jié)果如下表。通過這些比較,可以給聚類算法研究和應(yīng)用的選擇提供參考。
5 結(jié)束語(yǔ)
目前,已經(jīng)提出的聚類算法很多,每種方法都有其優(yōu)缺點(diǎn)和不同的適用領(lǐng)域,可以根據(jù)上述的分析,選擇適合特定問題的聚類方法;但是,在實(shí)際應(yīng)用中,由于數(shù)據(jù)的復(fù)雜性,往往用某種聚類算法進(jìn)行聚類劃分得到的效果不佳,可能要綜合多種聚類方法才能得到較好的聚類效果。因此,在將來的研究中,需要做好對(duì)現(xiàn)有聚類算法的改進(jìn)和融合,以便得到更好的聚類方法。
參考文獻(xiàn):
[1] 孫孝萍.基于聚類分析的數(shù)據(jù)挖掘算法研究[D].碩士學(xué)位論文,2002.4.
[2] 覃擁軍,劉先鋒.數(shù)據(jù)挖掘中的聚類研究[J].科技咨詢導(dǎo)報(bào),2007(16):28-30.
[3] 梁志榮.數(shù)據(jù)挖掘中聚類分析的技術(shù)方法[J]. 電腦開發(fā)與應(yīng)用,2007,20(6):37-39.
[4] 谷淑化,呂維先,馬于濤.關(guān)于數(shù)據(jù)挖掘中聚類分析算法的比較[J].現(xiàn)代計(jì)算機(jī),2005(3):26-29.
[5] 黃利文.基于幾何概率的聚類分析[D]. 碩士學(xué)位論文,2006(1).
[6] 張紅云,劉向東,段曉東等.數(shù)據(jù)挖掘中聚類算法比較[J].計(jì)算機(jī)應(yīng)用與軟件,2003(2):5-6.
[7] 王勁波,翁偉,許華榮.數(shù)據(jù)挖掘中基于密度的聚類分析方法[J].統(tǒng)計(jì)與決策,2005(10):139-141.
[8] 劉泉鳳,陸蓓. 數(shù)據(jù)挖掘中聚類算法的比較研究[J].浙江水利水電??茖W(xué)校學(xué)報(bào),2005,17(2):55-58.
[9] 丁學(xué)鈞,楊克儉,李虹等.數(shù)據(jù)挖掘中聚類算法的比較研究[J].河北建筑工程學(xué)院學(xué)報(bào),2004,22(3):125-127.
收稿日期:2008-02-17
Space軟件對(duì)項(xiàng)目管理碩士學(xué)位論文數(shù)據(jù)進(jìn)行科學(xué)計(jì)量,在較為深入地了解我國(guó)項(xiàng)目管理發(fā)
展現(xiàn)狀的基礎(chǔ)上,通過關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)和聚類分析,探究我國(guó)項(xiàng)目管理理論現(xiàn)有研究熱點(diǎn)領(lǐng)
域和新興領(lǐng)域的研究主題,并對(duì)我國(guó)項(xiàng)目管理理論研究特點(diǎn)進(jìn)行總結(jié),以推動(dòng)我國(guó)項(xiàng)目管理
理論的進(jìn)一步發(fā)展與完善?
〔關(guān)鍵詞〕項(xiàng)目管理;碩士學(xué)位論
文;科學(xué)計(jì)量;信息可視化
DOI:10.3969/j
.issn.1008-0821.2014.01.024
〔中圖分類號(hào)〕F062.4 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)
〕1008-0821(2014)01-0110-05
Analysis of the Topics of Ch
ina Project Management Theory Research
——Based on the View of Scientometric Analysis of Master Degree
Thesis
Zhu Fangwei1 Song Haoyang1 Hou Jianhua2
(1.Faculty of Management and Economics,Dalian University of Technology,Dali
an 116024;
2.Humanities Department,Dalian University,Dalian 116024,China)HT〗
〔Abstract〕”BZ〗Use CiteSpace software to analyze the Master degree thesis of project ma
nagement in China in Scientometrics method.Based on an in-depth understanding of
the development of project management in China,this paper explored the themes o
f the existing hot and emerging field project management theory through keywords
co-occurrence network and cluster analysis.Then summarized the features of Chin
as project management researching and proposed some advises about the future d
evelopment of project management theory to promote the further development and i
mprovement of Chinas project management theory.
〔Key words〕project manageme
nt;master dissertation;scientometrics;information visualization
我國(guó)項(xiàng)目管理理論的學(xué)習(xí)與研究始于20世紀(jì)60年代?1960年,華羅庚最早將項(xiàng)目管理的
主要方法之一網(wǎng)絡(luò)計(jì)劃技術(shù)引進(jìn)國(guó)內(nèi),并命名為“統(tǒng)籌法”,自此拉開了我國(guó)項(xiàng)目管理研究
與應(yīng)用的序幕?1965年6月,《人民日?qǐng)?bào)》發(fā)表了華羅庚的《統(tǒng)籌方法平話》,進(jìn)一步促進(jìn)
了網(wǎng)絡(luò)計(jì)劃技術(shù)在我國(guó)的推廣與應(yīng)用[1]?這一時(shí)期,我國(guó)的項(xiàng)目管理主要處于理
論方法學(xué)習(xí)與推廣階段?
20世紀(jì)80年代末,現(xiàn)代項(xiàng)目管理理論在國(guó)內(nèi)工程實(shí)踐領(lǐng)域得到廣泛的應(yīng)用?其中,利用世界
銀行貸款所建設(shè)的云南魯布格水電站飲水導(dǎo)流工程,首次采用了國(guó)際招標(biāo)和項(xiàng)目管理方法,
并取得了很好的效果[2]?隨后,一些大型工程建設(shè)項(xiàng)目如二灘水電站?三峽水利
樞紐建設(shè)相繼采用了項(xiàng)目管理的方法和模式?
進(jìn)入90年代后,相關(guān)研究者開始著手我國(guó)項(xiàng)目管理理論體系的構(gòu)建工作,并于1991年成立了
我國(guó)第一個(gè)項(xiàng)目管理專業(yè)學(xué)術(shù)性組織,中國(guó)項(xiàng)目管理研究委員會(huì)?截至2000年,委員會(huì)總共
開過3次學(xué)術(shù)年會(huì)和兩次國(guó)際研討會(huì)[3]?由該委員會(huì)組織構(gòu)建的《中國(guó)項(xiàng)目管理
知識(shí)體系》?內(nèi)部發(fā)行的《項(xiàng)目管理》刊物以及《國(guó)際項(xiàng)目管理專業(yè)資質(zhì)認(rèn)證標(biāo)準(zhǔn)》,對(duì)我
國(guó)項(xiàng)目管理理論的研究和人才的培養(yǎng)起到了積極的促進(jìn)作用?
近年來,我國(guó)項(xiàng)目管理理論研究和人才培養(yǎng)得到了快速的發(fā)展和廣泛的應(yīng)用,而國(guó)內(nèi)高等院
校和機(jī)構(gòu)則成了理論研究與人才培養(yǎng)的主力軍?20世紀(jì)90年代開始,相關(guān)高校開始設(shè)立項(xiàng)目
管理專業(yè),將其作為管理科學(xué)與工程一級(jí)學(xué)科下的自主設(shè)置二級(jí)學(xué)科,培養(yǎng)碩士?博士等各
層次專業(yè)人才?截至2012年,全國(guó)具有項(xiàng)目管理專業(yè)學(xué)位授予權(quán)的院校和機(jī)構(gòu)共有133所,
其中,具有博士學(xué)位授予權(quán)的院校和機(jī)構(gòu)有97所?高層次人才的培養(yǎng)大大推動(dòng)了我國(guó)項(xiàng)目管
理理論研究的發(fā)展,學(xué)位論文的研究成果在很大程度上體現(xiàn)了我國(guó)學(xué)者對(duì)項(xiàng)目管理前沿探索
的最新成就[4]?
目前,已有一些學(xué)者通過對(duì)我國(guó)項(xiàng)目管理的發(fā)展過程?特點(diǎn)以及未來的發(fā)展趨勢(shì)進(jìn)行不同程
度的研究分析,以期指導(dǎo)該領(lǐng)域未來的發(fā)展[5-7]?但多數(shù)研究都是從個(gè)人的視
角出發(fā),帶有較強(qiáng)的主觀性?相比之下,陸紹凱統(tǒng)計(jì)了《國(guó)際項(xiàng)目管理學(xué)報(bào)》和中國(guó)優(yōu)秀博
碩士論文數(shù)據(jù)庫(kù)中有關(guān)項(xiàng)目管理的研究性論文,分析了從1999-2003年間我國(guó)項(xiàng)目管理研究
主題和應(yīng)用行業(yè)領(lǐng)域情況,具有一定程度的客觀性?
本文使用CiteSpace軟件對(duì)項(xiàng)目管理碩士學(xué)位論文數(shù)據(jù)進(jìn)行科學(xué)計(jì)量與可視化分析,并繪制
可視化網(wǎng)絡(luò)圖譜,在保證客觀性和有效性的基礎(chǔ)上,對(duì)項(xiàng)目管理理論研究熱點(diǎn)領(lǐng)域和新興領(lǐng)
域及其主要主題進(jìn)行分析?較為客觀地反映了我國(guó)項(xiàng)目管理理論研究現(xiàn)狀及發(fā)展趨勢(shì),借此
為未來項(xiàng)目管理理論研究提供一定的指導(dǎo)?
1 我國(guó)項(xiàng)目管理學(xué)位論文的基本情況
在中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù)(CDFD)?全國(guó)高校學(xué)位論文文摘數(shù)據(jù)庫(kù)(CALIS)?中國(guó)
國(guó)家圖書館和萬(wàn)方學(xué)位論文等數(shù)據(jù)庫(kù)中,以“學(xué)科專業(yè)名稱=項(xiàng)目管理”?“時(shí)間=不限~
2012年”為條件進(jìn)行數(shù)據(jù)檢索,經(jīng)去重處理后共獲得博士論文37篇,碩士論文7 344篇
?
盡管存在數(shù)據(jù)庫(kù)數(shù)據(jù)不全的情況,但現(xiàn)有數(shù)據(jù)能夠代表項(xiàng)目管理研究學(xué)位論文整體數(shù)量分布
情況和研究方向?其中,項(xiàng)目管理專業(yè)博士學(xué)位論文數(shù)量較少,說明該專業(yè)博士人才的培養(yǎng)
工作尚處于起步階段,碩士學(xué)位論文對(duì)項(xiàng)目管理理論研究起到主要的推動(dòng)作用?
從各年論文數(shù)量的分布狀況看,2005年的論文數(shù)量最少,2006-2009年間論文數(shù)量出現(xiàn)驟增
,于2009年達(dá)到最大量,隨后幾年論文數(shù)量出現(xiàn)小幅下降,具體數(shù)據(jù)如圖1所示?由此,可
以判斷,自2005年開始項(xiàng)目管理碩士研究生培養(yǎng)及理論研究得到快速發(fā)展,整體呈現(xiàn)上升態(tài)
勢(shì)?
按各院校論文總數(shù)對(duì)學(xué)位論文的產(chǎn)出單位進(jìn)行統(tǒng)計(jì)排序,排名前20的高產(chǎn)院校論文數(shù)量共占
文獻(xiàn)數(shù)據(jù)總量的90.1%,具體數(shù)據(jù)如圖2所示?結(jié)合各院校背景和發(fā)展實(shí)際來看,論文產(chǎn)量
較高的院校通常開設(shè)了項(xiàng)目管理工程碩士學(xué)位,如北京郵電大學(xué)的項(xiàng)目管理教育
中心和中國(guó)海洋大學(xué)的在職研究生培養(yǎng),這在一定程度上也反映了對(duì)專業(yè)項(xiàng)目管理人才的旺
盛需求?但需要注意的是項(xiàng)目管理碩士學(xué)位論文的數(shù)量并不能完全代表理論研究水平,學(xué)術(shù)
型項(xiàng)目管理碩士學(xué)位論文對(duì)于項(xiàng)目管理理論的發(fā)展與完善有著重要的作用?此外,在20所院
校中理工科院校占14所,其論文數(shù)量占20所院??偭康?5.9%,說明項(xiàng)目管理雖然屬于管理
科學(xué),但與IT?科技?建筑等理工科項(xiàng)目實(shí)踐聯(lián)系緊密?
2 研究分析
學(xué)術(shù)論文中的關(guān)鍵詞,對(duì)于揭示論文主題有著重要的作用[8]?因此,本文以項(xiàng)目
管理專業(yè)碩士學(xué)位論文的關(guān)鍵詞為對(duì)象,使用CiteSpace軟件進(jìn)行關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)和聚類分
析,在探究項(xiàng)目管理理論研究主要領(lǐng)域及其主要研究主題的基礎(chǔ)上,揭示我國(guó)項(xiàng)目管理理論
研究現(xiàn)狀及發(fā)展趨勢(shì)?
2.1 熱點(diǎn)領(lǐng)域概況分析
運(yùn)用CiteSpace軟件構(gòu)建項(xiàng)目管理碩士學(xué)位論文的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜,共現(xiàn)頻次在100以上
的關(guān)鍵詞共有15個(gè)?其中“項(xiàng)目管理”的共現(xiàn)頻次雖然最高(1 431次),但對(duì)于揭示
本專業(yè)的研究主題作用較小,因此以下主要對(duì)其余14個(gè)關(guān)鍵詞進(jìn)行分析,具體頻次如圖3所示?
14個(gè)關(guān)鍵詞共現(xiàn)頻次合計(jì)2 540次,占除“項(xiàng)目管理”以外關(guān)鍵詞總共現(xiàn)頻次(6 298
次)的40.33%,表明這14個(gè)關(guān)鍵詞所反映的研究領(lǐng)域可代表當(dāng)前項(xiàng)目管理碩士學(xué)位論文
的主要熱點(diǎn)領(lǐng)域?對(duì)14個(gè)關(guān)鍵詞的研究主題及其相關(guān)性進(jìn)行分析發(fā)現(xiàn),在“項(xiàng)目管理”領(lǐng)域
中主要包括“項(xiàng)目質(zhì)量管理”?“項(xiàng)目進(jìn)度管理”?“項(xiàng)目成本管理”?“可行性研究”和
“項(xiàng)目風(fēng)險(xiǎn)管理”5個(gè)關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)群組,即5個(gè)熱點(diǎn)領(lǐng)域?其中,“項(xiàng)目風(fēng)險(xiǎn)管理”群組
的共現(xiàn)頻次及所含關(guān)鍵詞節(jié)點(diǎn)數(shù)量最多,這表明項(xiàng)目風(fēng)險(xiǎn)管理的相關(guān)研究受到了研究者的極
大關(guān)注?
在選定的閾值下,關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖及熱點(diǎn)領(lǐng)域分布,如圖4所示?對(duì)關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)各節(jié)
點(diǎn)的中心度指標(biāo)進(jìn)行分析,中心度數(shù)值在0.07以上的關(guān)鍵詞包括:“成本控制(0.1)”
?“可行性分析(0.09)”?“房地產(chǎn)項(xiàng)目(0.09)”?“項(xiàng)目管理(0.07)”?“風(fēng)
險(xiǎn)分析(0.07)”和“經(jīng)濟(jì)評(píng)價(jià)(0.07)”?結(jié)合各群組間網(wǎng)絡(luò)關(guān)系分析發(fā)現(xiàn),6個(gè)高中
心度共現(xiàn)關(guān)鍵詞相互聯(lián)結(jié),形成以“風(fēng)險(xiǎn)分析——可行性分析——經(jīng)濟(jì)評(píng)價(jià)——房地產(chǎn)項(xiàng)目
——成本控制——項(xiàng)目管理”依次排序的連接鏈,將“項(xiàng)目風(fēng)險(xiǎn)管理”?“可行性研究”?
“項(xiàng)目成本管理”和“項(xiàng)目管理”4個(gè)群組聯(lián)系在一起?而“項(xiàng)目質(zhì)量管理”和“項(xiàng)目進(jìn)度
管理”群組分別通過“可行性研究”和“項(xiàng)目成本管理”兩群組與其他群組聯(lián)結(jié)?這表明不
同熱點(diǎn)領(lǐng)域間存在著不同程度的聯(lián)系,而項(xiàng)目管理專業(yè)碩士學(xué)位論文的研究主題通常涵蓋了
項(xiàng)目管理中某幾個(gè)領(lǐng)域的問題,具有一定程度的綜合性?
2.2 項(xiàng)目管理研究主題分析
依據(jù)各共現(xiàn)節(jié)點(diǎn)研究主題的相關(guān)性,通過CiteSpace軟件構(gòu)建關(guān)鍵詞聚類,以TF*IDF算法抽
取每個(gè)聚類的主題標(biāo)識(shí)詞[9]?對(duì)各熱點(diǎn)主題進(jìn)行初步分析整理,得到可反映論文
研究主題的聚類17個(gè)?其中,9個(gè)聚類的熱點(diǎn)主題包含于5個(gè)熱點(diǎn)領(lǐng)域中,另有8個(gè)聚類屬于
近年來新興的研究主題,反映了項(xiàng)目管理理論研究的新興領(lǐng)域,具體數(shù)據(jù)如表1所示?
2.2.1 熱點(diǎn)領(lǐng)域主題分析
關(guān)鍵詞聚類分析再次證實(shí)了關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)分析的結(jié)果,即“項(xiàng)目風(fēng)險(xiǎn)管理”?“項(xiàng)目質(zhì)量
管理”?“項(xiàng)目成本管理”?“項(xiàng)目進(jìn)度管理”和“可行性研究”是項(xiàng)目管理碩士學(xué)位論文
熱點(diǎn)研究領(lǐng)域?結(jié)合高頻共現(xiàn)關(guān)鍵詞和聚類結(jié)果,探究五個(gè)熱點(diǎn)領(lǐng)域的熱點(diǎn)主題,具體內(nèi)容
如表1所示?
表1 基于聚類分析的熱點(diǎn)和新興領(lǐng)域及
①有關(guān)“項(xiàng)目風(fēng)險(xiǎn)管理”的高頻共現(xiàn)關(guān)鍵詞包括“風(fēng)險(xiǎn)分析”?“風(fēng)險(xiǎn)識(shí)別”?“風(fēng)險(xiǎn)
”以及“層次分析法”,共現(xiàn)頻次共計(jì)548次,這說明對(duì)風(fēng)險(xiǎn)的有效識(shí)別和分析成了項(xiàng)目風(fēng)
險(xiǎn)管理的熱點(diǎn)主題?同時(shí),聚類結(jié)果顯示國(guó)際項(xiàng)目成為風(fēng)險(xiǎn)管理新的研究對(duì)象,這體現(xiàn)了項(xiàng)
目管理的國(guó)際化趨勢(shì)[10]?在經(jīng)濟(jì)全球化的推動(dòng)下,我國(guó)境內(nèi)開展的國(guó)際項(xiàng)目逐
漸增加?這些國(guó)際項(xiàng)目通常面臨著更加復(fù)雜的環(huán)境,需要的技術(shù)更加多樣化,更多地采用國(guó)
際化標(biāo)準(zhǔn)和規(guī)范?項(xiàng)目實(shí)施者不僅要應(yīng)對(duì)較為傳統(tǒng)的項(xiàng)目風(fēng)險(xiǎn),還要考慮許多新的風(fēng)險(xiǎn)因素
,如政治?環(huán)境等,這給項(xiàng)目活動(dòng)的開展造成了更大的困難?因此,對(duì)國(guó)際項(xiàng)目來說,項(xiàng)目
風(fēng)險(xiǎn)的有效識(shí)別?評(píng)估及應(yīng)對(duì)等工作的重要性和必要性更加顯著;
②“質(zhì)量控制”的共現(xiàn)頻次為173次,說明“項(xiàng)目質(zhì)量管理”領(lǐng)域以質(zhì)量的監(jiān)控為研究熱點(diǎn)
?通過聚類分析發(fā)現(xiàn),近年來,項(xiàng)目成果的可持續(xù)發(fā)展逐漸引起人們的重視,盡管項(xiàng)目是一
次性的任務(wù),但項(xiàng)目的交付物通常會(huì)在未來的一定時(shí)間內(nèi)持續(xù)創(chuàng)造經(jīng)濟(jì)價(jià)值?項(xiàng)目成果質(zhì)量
的可持續(xù)性對(duì)于之后的運(yùn)營(yíng)管理?成本控制?環(huán)境保護(hù)等方面都有著重要影響,尤其是在自
然資源開發(fā)與利用和生態(tài)發(fā)展的項(xiàng)目中,可持續(xù)性成為影響項(xiàng)目能否開展的關(guān)鍵因素?因此
,不僅要強(qiáng)調(diào)項(xiàng)目實(shí)施過程中的質(zhì)量監(jiān)控,更要關(guān)注項(xiàng)目的后評(píng)價(jià)問題?通過建立項(xiàng)目后評(píng)
價(jià)體系和方法,來衡量項(xiàng)目成果的可持續(xù)性,在確保項(xiàng)目成果質(zhì)量的基礎(chǔ)上,實(shí)現(xiàn)項(xiàng)目的可
持續(xù)發(fā)展,成為項(xiàng)目質(zhì)量管理的一個(gè)熱點(diǎn)主題;
③高頻共現(xiàn)關(guān)鍵詞統(tǒng)計(jì)顯示,項(xiàng)目進(jìn)度的監(jiān)控問題受到“項(xiàng)目進(jìn)度管理”領(lǐng)域的重視?聚類
分析則發(fā)現(xiàn),近年來建筑工程類項(xiàng)目的進(jìn)度控制成為該領(lǐng)域的研究熱點(diǎn)?這一現(xiàn)象與我國(guó)經(jīng)
濟(jì)發(fā)展有著緊密的聯(lián)系?2008年的世界金融危機(jī)后,為促進(jìn)我國(guó)經(jīng)濟(jì)的穩(wěn)步發(fā)展,政府加大
了國(guó)內(nèi)基礎(chǔ)建設(shè)投資,各地紛紛籌備并實(shí)施大中型建筑工程類項(xiàng)目?而在建筑工程類項(xiàng)目實(shí)
踐中,由于項(xiàng)目管理水平?施工條件,資源需求,設(shè)計(jì)變更,物資供應(yīng)以及相關(guān)方協(xié)調(diào)等因
素的影響,普遍存在著進(jìn)度失控問題[11],這對(duì)項(xiàng)目成本?質(zhì)量?收益等方面都
產(chǎn)生了不利影響?因此,建立并完善建筑工程項(xiàng)目進(jìn)度控制的理論?工具和方法有著重要的
實(shí)踐意義;
④“項(xiàng)目成本管理”領(lǐng)域以“成本控制”(共現(xiàn)頻次182)為熱點(diǎn),尤其是有關(guān)項(xiàng)目成本控
制方法的改進(jìn)與完善問題?在項(xiàng)目實(shí)踐過程中,傳統(tǒng)的成本控制方法面對(duì)復(fù)雜性不斷提高的
項(xiàng)目及環(huán)境,自身的局限性不斷暴露?單純的以目標(biāo)利潤(rùn)為導(dǎo)向,強(qiáng)調(diào)目標(biāo)成本,往往無法
有效滿足項(xiàng)目的多方面需求?為了彌補(bǔ)傳統(tǒng)控制方法的不足,“項(xiàng)目成本管理”領(lǐng)域引入了
“價(jià)值工程”理念?價(jià)值工程能夠綜合考慮功能與經(jīng)濟(jì)要求,在保證達(dá)成項(xiàng)目必要目標(biāo)的同
時(shí),實(shí)現(xiàn)成本的降低?如何將價(jià)值工程的理念和方法有效的應(yīng)用于項(xiàng)目成本管理,以最低的
成本達(dá)成項(xiàng)目的必要目標(biāo),實(shí)現(xiàn)成本降低與功能最佳的統(tǒng)一,成為該領(lǐng)域的熱點(diǎn)問題;
⑤“可行性研究”領(lǐng)域以清潔能源項(xiàng)目的“可行性分析”,尤其是“經(jīng)濟(jì)評(píng)價(jià)”為主要研究
主題?隨著我國(guó)經(jīng)濟(jì)的快速發(fā)展,傳統(tǒng)以煤炭為主要來源的能源結(jié)構(gòu)不僅無法滿足快速增長(zhǎng)
的需求,更不利于環(huán)境的保護(hù)與有效利用?為了改變能源結(jié)構(gòu)?改善環(huán)境狀態(tài),清潔能源項(xiàng)
目在國(guó)家政策的扶持下得到快速發(fā)展?而此類項(xiàng)目通常具有規(guī)模和資金需求量大,建設(shè)周期
和投資回收期長(zhǎng)等特征,在項(xiàng)目投產(chǎn)后能否獲得足夠的利潤(rùn)以保證項(xiàng)目成果的持續(xù)運(yùn)營(yíng)成為
該類項(xiàng)目可行性研究的重要議題?
2.2.2 新興領(lǐng)域主題分析
關(guān)鍵詞聚類分析表明,近年來項(xiàng)目管理理論研究中出現(xiàn)了4個(gè)新興領(lǐng)域,即“項(xiàng)目團(tuán)隊(duì)管理
”?“項(xiàng)目知識(shí)管理”?“多項(xiàng)目管理”和“項(xiàng)目管理模式”?由于這些理論的研究處于起
步階段,相關(guān)文獻(xiàn)數(shù)量少,所以在關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜中未能形成大的群組或領(lǐng)域,但新興
領(lǐng)域?qū)ξ覈?guó)項(xiàng)目管理理論發(fā)展與完善有著積極的促進(jìn)作用?
①為應(yīng)對(duì)競(jìng)爭(zhēng)日益激烈的市場(chǎng)環(huán)境,現(xiàn)代企業(yè)廣泛采用團(tuán)隊(duì)運(yùn)作方式來靈活應(yīng)對(duì)內(nèi)外部變化
?項(xiàng)目活動(dòng)的復(fù)雜性要求團(tuán)隊(duì)成員能夠彼此協(xié)作,共同完成任務(wù)?而項(xiàng)目團(tuán)隊(duì)成員通常是來
自不同領(lǐng)域的專業(yè)人員,具有成就動(dòng)機(jī)強(qiáng)?自主性和創(chuàng)造性高?工作難以監(jiān)控和評(píng)價(jià)等特征
,這給項(xiàng)目團(tuán)隊(duì)的組建及管理帶來了新的挑戰(zhàn),有關(guān)團(tuán)隊(duì)建設(shè)?成員管理等“項(xiàng)目團(tuán)隊(duì)管理
”問題受到了研究者的關(guān)注;
②“項(xiàng)目知識(shí)管理”是在項(xiàng)目管理與知識(shí)管理相互交叉融合的過程中產(chǎn)生的?在項(xiàng)目活動(dòng)的
展開過程中,不僅需要輸入專業(yè)性的知識(shí)以支持項(xiàng)目,同時(shí)還會(huì)創(chuàng)造出大量新知識(shí),這些知
識(shí)成為團(tuán)隊(duì)競(jìng)爭(zhēng)優(yōu)勢(shì)的重要來源?然而,在項(xiàng)目知識(shí)管理實(shí)踐中還存在著大量問題,如對(duì)于
知識(shí)的積累轉(zhuǎn)化重視不足?知識(shí)在項(xiàng)目團(tuán)隊(duì)中沒有進(jìn)行完整的傳遞等[12],這阻
礙了員工工作效率的提升,同時(shí)也增加了知識(shí)流失的風(fēng)險(xiǎn)?因此,培養(yǎng)項(xiàng)目團(tuán)隊(duì)學(xué)習(xí)?創(chuàng)新
和傳播知識(shí)的能力?構(gòu)建知識(shí)管理系統(tǒng),促進(jìn)知識(shí)交流與共享等相關(guān)主題成為該領(lǐng)域的主要
研究?jī)?nèi)容;
③“多項(xiàng)目管理”領(lǐng)域主要涉及企業(yè)的項(xiàng)目群和項(xiàng)目組合管理?在企業(yè)實(shí)踐中,往往需要同
時(shí)開展多個(gè)項(xiàng)目?由于財(cái)力?人力等資源的有限性,為了滿足各項(xiàng)目不同的需求,需要對(duì)各
種資源進(jìn)行合理的安排與利用?通過多個(gè)項(xiàng)目間資源的合理分配和有效協(xié)調(diào),不僅能達(dá)成各
項(xiàng)目自身的目標(biāo),還有助于企業(yè)整體績(jī)效的最優(yōu)?因此,多個(gè)項(xiàng)目間的協(xié)調(diào)問題成為該領(lǐng)域
的主要研究主題;
④“項(xiàng)目管理模式”領(lǐng)域主要探討項(xiàng)目管理模式的應(yīng)用與優(yōu)化問題?傳統(tǒng)的項(xiàng)目管理模式,
如設(shè)計(jì)——招標(biāo)——建造?建造——運(yùn)營(yíng)——移交?項(xiàng)目承包和設(shè)計(jì)——采購(gòu)——建造等,
通常被應(yīng)用于大型復(fù)雜的工程建設(shè)項(xiàng)目,以期應(yīng)對(duì)此類項(xiàng)目建設(shè)周期長(zhǎng),資金需求量大,風(fēng)
險(xiǎn)高等不利因素?但在實(shí)踐應(yīng)用的過程中,傳統(tǒng)項(xiàng)目管理模式也暴露出自身的不足,如缺乏
敏捷性?過分強(qiáng)調(diào)技術(shù)性?對(duì)項(xiàng)目過程的割裂等?為了實(shí)現(xiàn)項(xiàng)目管理模式的優(yōu)化,“動(dòng)態(tài)聯(lián)
盟”的思想被引入項(xiàng)目管理領(lǐng)域?企業(yè)間的動(dòng)態(tài)聯(lián)盟可以充分利用聯(lián)盟各方的核心競(jìng)爭(zhēng)優(yōu)勢(shì)
,共同應(yīng)對(duì)環(huán)境變化,提升競(jìng)爭(zhēng)力,抵御風(fēng)險(xiǎn),實(shí)現(xiàn)資源的共享?因此,動(dòng)態(tài)聯(lián)盟項(xiàng)目管理
模式的構(gòu)建?管理與應(yīng)用成為該領(lǐng)域的新興主題?
3 研究結(jié)論
通過對(duì)項(xiàng)目管理碩士學(xué)位論文數(shù)據(jù)的計(jì)量與可視化分析,本文探究了我國(guó)項(xiàng)目管理理論研究
的熱點(diǎn)和新興領(lǐng)域現(xiàn)狀,對(duì)目前我國(guó)項(xiàng)目管理理論研究的特征總結(jié)如下?
3.1 選題方向較為多元,研究?jī)?nèi)容豐富
關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)分析顯示,項(xiàng)目管理專業(yè)碩士學(xué)位論文主要以5個(gè)項(xiàng)目管理問題為熱點(diǎn)研究
領(lǐng)域,并通過融入新的視角和理念來促進(jìn)各熱點(diǎn)領(lǐng)域發(fā)展與完善?從風(fēng)險(xiǎn)管理的國(guó)際化趨勢(shì)
,到質(zhì)量管理的可持續(xù)發(fā)展,再到價(jià)值工程理念的引入,以及進(jìn)度管理和可行性研究對(duì)象的
轉(zhuǎn)變,都表明了5個(gè)熱點(diǎn)領(lǐng)域研究主題的豐富與多樣性?
3.2 新興領(lǐng)域初步形成,有待進(jìn)一步深入研究
通過關(guān)鍵詞聚類分析發(fā)現(xiàn)主要形成了4個(gè)新興領(lǐng)域?其中,在與其他研究領(lǐng)域的交叉融合過
程中,形成了“項(xiàng)目知識(shí)管理”;“項(xiàng)目團(tuán)隊(duì)管理”則體現(xiàn)了項(xiàng)目管理從硬因素轉(zhuǎn)向?qū)浺?/p>
素的關(guān)注[13];傳統(tǒng)的單一項(xiàng)目管理擴(kuò)展到多個(gè)項(xiàng)目之間的協(xié)調(diào)管理,項(xiàng)目管理
模式中也引入了新的理念?但總體來看,這些新興主題的研究還處于起步階段,相關(guān)理論成
果較少且缺少系統(tǒng)性,需要進(jìn)一步的完善與發(fā)展?
3.3 與實(shí)踐的緊密結(jié)合是項(xiàng)目管理理論研究的重要特征
國(guó)際項(xiàng)目的風(fēng)險(xiǎn)管理?建筑工程項(xiàng)目的質(zhì)量監(jiān)控以及清潔能源項(xiàng)目的可行性研究等,都表明
項(xiàng)目管理專業(yè)碩士學(xué)位論文的選題及研究?jī)?nèi)容緊跟時(shí)展,具有很強(qiáng)的實(shí)踐性?
參考文獻(xiàn)
[1]蔚林巍.項(xiàng)目管理的最新進(jìn)展[J].管理工程學(xué)報(bào),2000,(3):65-69
.
[2]駱,馬紅霞.項(xiàng)目管理發(fā)展綜述[J].現(xiàn)代管理科學(xué),2005,(5):28-29.
[3]李波.項(xiàng)目管理理論綜述與前沿問題研究[J].經(jīng)濟(jì)研究導(dǎo)刊,2012,(31):212-21
4.
[4]陸紹凱.項(xiàng)目管理的研究前沿[J].技術(shù)經(jīng)濟(jì)與管理研究,2005,(1):36-38.
[5]程鐵信,霍吉棟,劉源張.項(xiàng)目管理發(fā)展評(píng)述[J].管理評(píng)論,2004,(2):59-62.
[6]應(yīng)尚軍,王炎.項(xiàng)目管理的研究現(xiàn)狀與研究前景[J].科技進(jìn)步與對(duì)策,2005,(11)
:131-133.
[7]劉莉.論現(xiàn)代項(xiàng)目管理的四大轉(zhuǎn)變[J].深圳大學(xué)學(xué)報(bào):人文社會(huì)科學(xué)版,2003,(1
).
[8]朱彩萍.學(xué)術(shù)論文中關(guān)鍵詞的規(guī)范[J].圖書與情報(bào),2005,(4):51-53.
[9]Chen C,Ibekwe SanJuan F,Hou J.The structure and dynamics of cocitation clu
sters:A multiple-perspective cocitation analysis[J].Journal of the American S
ociety for Information Science and Technology,2010,61(7):1386-1409.
[10]劉鳳樓.我國(guó)的項(xiàng)目管理及其發(fā)展展望[J].商場(chǎng)現(xiàn)代化,2006,(5):59-60.
[11]倪祥如.新海發(fā)電公司2×330MW擴(kuò)建工程進(jìn)度控制研究[D].南京:南京理工大學(xué),
2011.
[12]朱方偉,王昭.基于流程導(dǎo)向的創(chuàng)意服務(wù)企業(yè)知識(shí)管理個(gè)案研究[J].管理案例研
北大期刊 審核時(shí)間1-3個(gè)月
中國(guó)科學(xué)技術(shù)協(xié)會(huì);中國(guó)自動(dòng)化學(xué)會(huì)