前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇數(shù)學(xué)建模窮舉法范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
關(guān)鍵字:漢字手寫識別;英文手寫識別;聯(lián)機識別;連筆識別;手寫識別
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A DOI:10.3969/j.issn.1003-6970.2013.08.005
本文著錄格式:[1]黃弋石,梁艷.手寫識別建模數(shù)學(xué)方法研究[J].軟件,2013,34(8):13-15
0 引言
我們成功的解決了漢字與英文手寫識別的建模。[1-7]本文,將最有特色得到數(shù)學(xué)算法加以公布。在國內(nèi)一定是首創(chuàng),在國內(nèi)外還沒有查到類似報道。
識別算法,在常見的網(wǎng)格背景中運算。點陣大小為WIDTH×HEIGTH = 80×80。因為網(wǎng)格的精度很低,手寫筆的觸點精度與之對應(yīng),因此,不存在筆畫細(xì)化的難題。所以我們不使用高分辨率的圖形處理慣例,而只用低分辨率對應(yīng)的數(shù)學(xué)算法。
網(wǎng)格背景使得漢字可以依照二值數(shù)字點陣來描述,其中,“1”表示筆畫,“0”表示空白背景。這個方法極其巧妙,甚至不需要高深的數(shù)學(xué)才能與復(fù)雜的數(shù)學(xué)公式,就可以輕松的解決手寫筆算法問題。從工作量上計算,也是極其少量的。
1 中英文字的基本定義
這里從我們對中英文手寫識別研究中挑出,一組有代表性的基本定義,[1][2]來演示本文算法。我們的算法,只要能區(qū)分這一組定義,就可以理解,它也能適用于其它文字中的類似的基本定義??梢酝评淼玫剑怯行У倪m合任何手寫識別的基本算法,比如藏文等中國少數(shù)民族文字。
(1) 豎、橫與斜。手寫的豎與橫,都有一定的搖擺幅度。斜介于豎橫之間。
(2) 角與圓角。接近與V與U,在手寫特征下的區(qū)別是有拐點與無拐點。
(3) 圈與近圈。也就是,封閉的圓與接近封閉的圓。這個定義在楷書中用不上,只適用行書、草書以及下文所提的連筆識別。
(4) 短劃與點。與豎與橫的區(qū)別是方向性不強,在方格中,通過邊比特征可以區(qū)分。
(5) 交叉與連續(xù)。交叉,是指基本定義的筆畫相交叉,分T型交叉,和X型交叉,也可簡化為一種交叉。連續(xù),是指,基本定義的筆畫從起點到終點(或筆畫的兩端)是連續(xù)的且無分叉,可平滑,也可轉(zhuǎn)折。
(6) 相對位置與方向?;径x的字元之間的關(guān)系,有上、下、左、右、上左、上右、下左、下右。比如一個斜線可以分為,左斜、右斜、下斜、上斜、(左上斜、左下斜、右上斜、右下斜)。
2 算法的定義
使用窮舉法,在九方格中列出一個點與周圍點的二十七種拓?fù)溥壿嬯P(guān)系,算法見圖1到圖7。然后使用這二十七種拓?fù)潢P(guān)系,去描述并識別上面的那組基本定義,就可以輕松識別手寫漢字。
3 算法應(yīng)用例舉
我們從研究挑出楷書系列拆解分類,字就是由該組單位構(gòu)成。如圖8。[1][2]這樣,可以來對算法做一演示。我們成功的用本文算法區(qū)分筆畫。顯然,用來區(qū)分筆畫時使用的數(shù)學(xué)方法非常簡單,沒有任何復(fù)雜的公式。
4 算法的廣泛使用性
我們,通過研究,歸納得到32到87個特異結(jié)構(gòu),來描述行書。這些特異結(jié)構(gòu)都互為獨立。[1][2]這里列出其中的部分筆畫,見圖9。我們利用本文算法,同樣能夠解決問題。草書的定義與分類類似于英文在線連筆識別的方法,也可以順利解決。
5 結(jié)論
我們成功的解決了中英手寫識別,可以預(yù)見,這一套理論可以輕易的移植到別的任何一個文字。本法繞開了傳統(tǒng)數(shù)學(xué)中的線條的常規(guī)概念。使用最簡單的拓?fù)鋷缀螌W(xué)方法,系統(tǒng)化的建模應(yīng)用,解決了復(fù)雜的二維計算機圖形學(xué)的難題。這套建模方法的意義,是,對所有種類的手寫文字可以機動靈活的移植,將復(fù)雜的手寫識別,簡化到使用最簡單的數(shù)學(xué)語言描述。希望廣大同仁,廣泛應(yīng)用于各種民族的手寫文字識別之中。
參考文獻(xiàn)
[1] 黃弋石,梁艷.英文手寫聯(lián)機識別的基礎(chǔ)模型[J]. 軟件,2012,33(7):141-145.
[2] 黃弋石,梁艷,陸崢嶸.漢字聯(lián)機手寫建模方法[J]. 軟件,2013,34(5):67-70.
[3] 梁艷, 黃弋石. 英文連筆手寫圖形輸入方法研究[J]. 科學(xué)研究月刊,2005,1(5):18,26.
[4] 黃弋石, 梁艷. 手寫文字識別的體分類模糊數(shù)學(xué)模型[OL]. 中國科技論文在線(http://), 2005年6月.
[5] Huang Yishi, Liang Yan. A Modeling Project of Chinese's Handwriting Character Online Recognition [OL]. 中國科技論文在線(http://), 2013年7月.
關(guān)鍵詞:運籌學(xué);應(yīng)急物流;選址―定位
中圖分類號:F250 文獻(xiàn)標(biāo)識碼:A
Abstract: Because the efficient of emergency logistics can reduce the harms caused by emergency, it has caused wide public concerns among theorists. This paper provides an overview of Chinese emergency logistics study from many aspects: basic theory, the construction of system and the related models on the base reviewing the liberations in recent years, also it indicated that the modeling sense in operation research plays a decisive role in the research of emergency logistics.
Key words: operation research; emergency logistics; location-routing
近年來,我國各地突發(fā)事件頻發(fā),其中自然災(zāi)害的發(fā)生的占比非常高,如2010年8月甘肅舟曲發(fā)生特大山洪泥石流、2014年7月云南發(fā)生洪澇泥石流災(zāi)害、2013年3月墨竹工卡縣發(fā)生山體滑坡災(zāi)害、2013年7月甘肅岷縣漳縣發(fā)生6.6級地震災(zāi)害、2014年新疆于田發(fā)生7.3級地震災(zāi)害、2015年9月江西福建等地發(fā)生洪澇風(fēng)雹災(zāi)害、2015年8月陜西山陽發(fā)生滑坡災(zāi)害等。這些自然災(zāi)害的發(fā)生嚴(yán)重威脅人類的生命和財產(chǎn)安全,以及社會的經(jīng)濟發(fā)展甚至?xí)绊懞椭C社會的構(gòu)建,在突發(fā)事件發(fā)生后,如何盡快地將賑災(zāi)物資送至災(zāi)區(qū)以減少災(zāi)害損失是應(yīng)急物流問題研究的主要內(nèi)容,即應(yīng)急物流LRP問題的研究。應(yīng)急救援部門必須以最小的成本、最快的時間、合理地選擇物資存儲點將存儲物資科學(xué)地安排車輛對受災(zāi)點進(jìn)行物資的配送服務(wù)以減少傷亡,提高受災(zāi)地區(qū)民眾的抗災(zāi)信心。
當(dāng)前國內(nèi)外學(xué)者對一般LRP問題的研究比較具體深入,比如Min等[1](1998)、Nagy等[2](2007)、陳久梅等[3](2014)都做過一般LRP問題的優(yōu)化研究,當(dāng)前應(yīng)急物流的優(yōu)化問題已經(jīng)引起了眾多學(xué)者的關(guān)注,但是對于應(yīng)急物流的LRP研究(定位―路徑)還相對較少?,F(xiàn)有文獻(xiàn)主要有兩種研究范式:一種是單獨研究其中一個問題,即單獨研究應(yīng)急物流中心選址問題或單獨研究應(yīng)急資源調(diào)度問題;另外一種是將這兩個問題集成起來進(jìn)行研究。然而應(yīng)急物流中物流中心點的選擇和運輸路徑安排是直接影響應(yīng)急物流系統(tǒng)效率的兩個關(guān)鍵問題,兩者之間相互依賴和影響,有必要結(jié)合應(yīng)急物流的突發(fā)性、不確定性、緊急性等特點,從整體系統(tǒng)優(yōu)化的角度,將這兩方面結(jié)合起來進(jìn)行研究,故近年來,大部分對于應(yīng)急物流問題的研究均是對選址―配送這兩個問題集成起來進(jìn)行研究。根據(jù)現(xiàn)有的研究,應(yīng)急物流LRP問題基本可以按照信息是否確定分為以下兩類:確定信息下的應(yīng)急救援問題研究和不確定信息下的應(yīng)急救援問題研究。
1 確定信息下的應(yīng)急物流LRP研究
確定性的應(yīng)急物流LRP問題,通常考慮的問題中信息基本都是確定的,即不存在任何風(fēng)險因素,并且受災(zāi)點的需求是確定的。針對確定性的應(yīng)急物流LRP問題的研究,張玲[4](2008)考慮到由于災(zāi)區(qū)范圍比較廣泛進(jìn)而災(zāi)區(qū)存在不同的級別,針對該實際情況,通過對災(zāi)區(qū)進(jìn)行分組,并運用場景分析的發(fā)放,考慮其資源的布局和選址問題,引入多類0-1變量來表述該優(yōu)化問題,構(gòu)建了基于多級別的資源布局多目標(biāo)規(guī)劃模型。黃向榮等[5](2009)在考慮食品物流的相關(guān)特點和突發(fā)事件的突發(fā)性、緊急性以及弱經(jīng)濟性等特性的基礎(chǔ)上,構(gòu)建了食品的應(yīng)急物資分發(fā)中心選址決策的評價體系,并且結(jié)合蟻群算法(ACA)和徑向基神經(jīng)網(wǎng)絡(luò)(RBFNN)構(gòu)建了應(yīng)急物流物資分發(fā)點選址決策模型。曾敏剛等[6](2009)針對應(yīng)急服務(wù)應(yīng)急物資分發(fā)點定位以及物資配送路徑這兩個子問題,引入多個0-1決策變量去表述該優(yōu)化問題,建立了以最小化總成本為目標(biāo)的選址―定位模型。葛春景等[7](2011)研究了應(yīng)急設(shè)施選址中的多重覆蓋問題,并以在滿足需求點的多次覆蓋需求和多需求點同時需求的條件下覆蓋的人口期望最大為目標(biāo),建立了確定性的應(yīng)急物流優(yōu)化模型,通過改進(jìn)的遺傳算法對該模型進(jìn)行求解。鄭斌、馬祖軍等[8](2013)針對兩級應(yīng)急物流系統(tǒng)中的中轉(zhuǎn)站選址和上下級進(jìn)行聯(lián)運調(diào)度的集成優(yōu)化問題,建立雙層規(guī)劃模型,并根據(jù)該模型的特點設(shè)計了一種混合遺傳算法。
通過以上文獻(xiàn)梳理可知,在運用運籌學(xué)建立應(yīng)急物流LRP模型過程中,通常引入0-1決策變量去解決應(yīng)急物資分發(fā)點選址問題和車輛物資配送問題,引入三類決策變量,第一類0-1決策變量是表示應(yīng)急物資分發(fā)點是否開設(shè),通常1表示該應(yīng)急物資分發(fā)點開設(shè),0則表示不開設(shè),當(dāng)該決策變量為1時,才分配運輸車輛從該應(yīng)急物資分發(fā)點出發(fā)進(jìn)行物資配送服務(wù),并且從同一個應(yīng)急點出發(fā)車輛的物資運輸量需小于應(yīng)急點的物資存儲量;第二類0-1決策變量是用來表示某運輸車輛服務(wù)哪個受災(zāi)點的問題,1表示運輸車輛服務(wù)該受災(zāi)點,0則表示運輸車輛不服務(wù)該受災(zāi)點;第三類決策變量則表示某運輸車輛是否從該應(yīng)急物資分發(fā)點出發(fā),1表示這運輸車輛從該應(yīng)急物資分發(fā)點出發(fā),0則表示這個運輸車輛不從該應(yīng)急物資分發(fā)點出發(fā)。這三類0-1變量的引入合理地表述了應(yīng)急物流系統(tǒng)的優(yōu)化問題,目標(biāo)函數(shù)通常為應(yīng)急物流系統(tǒng)總成本最小以及運輸車輛到達(dá)所有受災(zāi)點的總時間最小,建立的模型均為0-1線性規(guī)劃模型。運籌學(xué)中0-1規(guī)劃主要用于求解互斥的計劃問題、約束條件互斥問題、固定費用問題和分派問題等方面,而應(yīng)急物流的優(yōu)化問題從運籌學(xué)的角度就是一種分派問題,因此運籌學(xué)能夠在應(yīng)急物流優(yōu)化問題中大放光彩。目前,0-1應(yīng)急物流規(guī)劃問題通常有三種解法,即窮舉法、變換法和隱枚舉法。解0-1型整數(shù)規(guī)劃最容易想到的方法,和一般整數(shù)線性規(guī)劃的情形一樣,就是窮舉法,即檢查變量取值為0或1的每一種決策組合,比較目標(biāo)函數(shù)值的大小,從而選出目標(biāo)值最小的那一組決策組合就是應(yīng)急物流優(yōu)化問題的最優(yōu)解。然而由于應(yīng)急物流優(yōu)化問題中涉及的變量較多,所有決策組合就非常多,可能解集將成指數(shù)劇增加,此時用這種方法效率就比較低下,因此通常運用隱枚舉法進(jìn)行求解,“隱”的含義是指在檢驗可能解的可行性和非劣性過程中,根據(jù)目標(biāo)函數(shù)的特性增加一個以前一非劣解目標(biāo)值的附加約束的過濾條件,以此達(dá)到減少問題求解過程的運算次數(shù)的目的。方法的核心思想均為檢查變量取值為0或1的策略組合,通過目標(biāo)函數(shù)值比較從而得出最優(yōu)解。
2 不確定信息下的應(yīng)急物流LRP研究
針對不確定性的應(yīng)急物流LRP研究,通??紤]的問題中信息基本都是不確定的,并且在救災(zāi)期間存在一定的風(fēng)險,比如應(yīng)急設(shè)施點失靈風(fēng)險、路徑中斷風(fēng)險、路徑復(fù)雜度等,同時往往受災(zāi)點的需求是不確定的。
何珊珊等[9](2013)針對在突發(fā)事件發(fā)生的緊急救援期,受災(zāi)點的需求很難確定,基于此建立了受災(zāi)點配送總時間最短和系統(tǒng)總成本最小的選址―路徑問題的數(shù)學(xué)模型,并通過算例驗證了多目標(biāo)魯棒優(yōu)化模型能夠體現(xiàn)受災(zāi)點對各類物資需求不確定條件下選址―配送方案的最優(yōu)性與魯棒性的均衡。孫華麗等[10](2013)針對需求隨機變化的應(yīng)急物流定位―路徑問題,將救援過程劃分為兩個階段,將受災(zāi)點的物資需求表示為一個區(qū)間數(shù),以物資送達(dá)時間最短和系統(tǒng)總成本最小為目標(biāo),構(gòu)建了多物資、多運輸車輛、多目標(biāo)的定位―路徑模型。張玲等[11](2014)也將救災(zāi)過程分為了兩個階段,考慮到突發(fā)災(zāi)害初期災(zāi)情相關(guān)參數(shù)概率分布信息很難精確獲得,建立了基于情景的最小最大后悔值準(zhǔn)則的魯棒優(yōu)化模型,求解模型時,利用有限情景集表示第二階段的不確定數(shù)據(jù),并將模型化為與其等價的混合整數(shù)模型,利用情景松弛的迭代算法進(jìn)行求解。商麗媛等[12](2013)考慮不同情景下應(yīng)急物流需求的不確定性,將不確定需求用區(qū)間灰數(shù)表示,構(gòu)建了多情景下不確定需求的應(yīng)急物流配送中心選址模型,并設(shè)計了免疫量子粒子群算法進(jìn)行求解。針對由于自然災(zāi)害帶來的路網(wǎng)風(fēng)險的應(yīng)急物流LRP問題,閻俊愛、郭藝源[13](2016)考慮到路網(wǎng)情況實時變化的復(fù)雜性下,構(gòu)建了應(yīng)急物流LRP動態(tài)模型,以車輛配送時間最小為目標(biāo),并通過設(shè)計的遺傳算法實現(xiàn)了基于動態(tài)路網(wǎng)實時調(diào)整的問題求解。陳鋼鐵、黎青松等[14](2016)考慮到路網(wǎng)存在災(zāi)后受損的風(fēng)險,故引入多種運輸方式,基于此構(gòu)建了震后多式聯(lián)運的應(yīng)急物資配送路徑優(yōu)化模型,并設(shè)計了啟發(fā)式算法對該應(yīng)急物流模型進(jìn)行了求解。
以上不確定信息下的應(yīng)急物流LRP優(yōu)化問題研究中,均運用了運籌學(xué)不確定規(guī)劃的思想建立了應(yīng)急物流LRP模型,在應(yīng)急物資分發(fā)點選址問題以及路徑配送與否方面,同樣引入三類0-1決策變量來表示應(yīng)急物資分發(fā)點建立與否,車輛是否從某個應(yīng)急物資分發(fā)點出發(fā)以及車輛是否服務(wù)某個受災(zāi)點。除此以外,引入兩類整數(shù)決策變量,一類為運輸車輛配送至某個受災(zāi)點的物資量,一類為某個受災(zāi)點的物資未滿足量,在約束中,這兩個量的和大于該受災(zāi)點的物資需求量,同時針對未滿足量盡量最小化的目標(biāo),將在目標(biāo)函數(shù)中賦予未滿足量一個很大的懲罰數(shù)。在模型求解中,運用了隨機規(guī)劃的思想去處理一些風(fēng)險因素,在處理受災(zāi)點物資需求的不確定方面,則運用三角模糊數(shù)的理論或魯棒優(yōu)化的思想去處理不確定性,在模型求解過程中,最終均通過一定的方法把不確定模型轉(zhuǎn)化為確定的混合整數(shù)模型去進(jìn)行求解。
運籌學(xué)的核心思想即為從現(xiàn)實生活場合抽出本質(zhì)的要素來構(gòu)造數(shù)學(xué)模型,探索求解的結(jié)構(gòu),從可行方案中尋求系統(tǒng)的最優(yōu)解作為決策者最好的選擇。通過以上文獻(xiàn)的梳理,可以看出運籌學(xué)在應(yīng)急物流系統(tǒng)定位―路徑優(yōu)化問題中已經(jīng)成為核心工具之一,而應(yīng)急物流系統(tǒng)定位―路徑優(yōu)化問題作為當(dāng)前的熱點問題之一,它的研究仍然處于初步階段,許多領(lǐng)域還缺乏系統(tǒng)性和深入性的研究,需要進(jìn)一步加強研究。
參考文獻(xiàn):
[1] Min H, Jayaraman V, Srivastava R. Combined location-routing problems: a synthesis and future research directions[J]. European Journal of Operational Research, 1998,
108(1):1-15.
[2] Nagy G, Salhi S. Location-routing: issues, models and methods[J]. European Journal of Operational Research, 2007,177(2):649-672.
[3] 陳久梅,邱晗光. 兩級定位―路徑問題模型及變鄰域粒子群算法[J]. 運籌與管理,2014(6):38-44.
[4] 張玲,黃鈞,朱建明. 應(yīng)對大規(guī)模突發(fā)事件的資源布局模型與算法[J]. 系統(tǒng)工程,2008,26(9):26-31.
[5] 黃向榮,謝如鶴. 基于蟻群算法與RBF神經(jīng)網(wǎng)絡(luò)模型的突發(fā)應(yīng)急配送決策[J]. 決策參考,2009(15):56-58.
[6] 曾敏剛,崔增收,余高輝. 基于應(yīng)急物流的減災(zāi)系統(tǒng)LRP研究[J]. 中國管理科學(xué),2010,18(2):75-80.
[7] 葛春景,王霞,關(guān)賢軍. 重大突發(fā)事件應(yīng)急設(shè)施多重覆蓋選址模型及算法[J]. 運籌與管理,2011,20(5):50-56.
[8] 鄭斌,馬祖軍,李雙琳. 基于雙層規(guī)劃的應(yīng)急物流系統(tǒng)選址―聯(lián)運問題[J]. 系統(tǒng)科學(xué)與數(shù)學(xué),2013,33(9):1046
-1060.
[9] 何珊珊,朱文海,任晴晴. 不確定需求下應(yīng)急物流系統(tǒng)多目標(biāo)魯棒優(yōu)化模型[J]. 遼寧工程技術(shù)大學(xué)學(xué)報,2013,32(7):998-1003.
[10] 孫華麗,周戰(zhàn)杰,薛耀鋒. 考慮路徑風(fēng)險的不確定需求應(yīng)急物流定位―路徑問題[J]. 上海交通大學(xué)學(xué)報,2013(6):962-966.
[11] 張玲,陳濤,黃鈞. 基于最小最大后悔值的應(yīng)急救災(zāi)網(wǎng)絡(luò)構(gòu)建魯棒優(yōu)化模型與算法[J]. 中國管理科學(xué),2014(7):131-139.
[12] 商麗媛,譚清美. 不確定應(yīng)急物流中心選址模型及算法研究[J]. 計算機應(yīng)用研究,2013,30(12):3603-3605.
【關(guān)鍵詞】故障預(yù)測 準(zhǔn)確度 智能預(yù)測算法 支持向量機
1 引言
故障預(yù)測是比故障診斷更高級的維修保障形式,它以當(dāng)前設(shè)備為起點,對設(shè)備將來可能出現(xiàn)的故障狀態(tài)或故障時間進(jìn)行預(yù)測并預(yù)先消除故障,這對于減少工作量和維護(hù)費用具有重要的意義。而如何提高故障預(yù)測準(zhǔn)確度就成為故障預(yù)測技術(shù)向前發(fā)展的關(guān)鍵問題。
提高故障預(yù)測準(zhǔn)確的方法有很多,從故障預(yù)測整個流程來說,就可以從數(shù)據(jù)的準(zhǔn)確度、數(shù)據(jù)的預(yù)處理、故障特征提取方法的改進(jìn)以及智能預(yù)測算法的選擇這四個方面來進(jìn)行提高。這四個方面中,預(yù)測方法的優(yōu)劣對故障預(yù)測效果的提升具有重要的作用。因此,本文主要從智能預(yù)測算法方面進(jìn)行分析和研究,介紹了一些常見的智能預(yù)測算法及其應(yīng)用情況,并重點介紹了比較有前景的支持向量機算法的一些基本問題和改進(jìn)的方向。
2 常見的智能預(yù)測算法及其應(yīng)用
2.1 專家系統(tǒng)及其應(yīng)用
專家系統(tǒng)主要用于那些沒有精確數(shù)學(xué)模型或很難建立數(shù)學(xué)模型的復(fù)雜系統(tǒng),特別在菲線性領(lǐng)域被認(rèn)為是一種很有前景的方法。李茂林、張晶等在充分分析某自行火炮的電氣系統(tǒng)的失效模式與故障機理的基礎(chǔ)上,開發(fā)了電氣系統(tǒng)故障綜合診斷專家系統(tǒng),提高了保障人員解決復(fù)雜電氣系統(tǒng)問題的能力。但專家系統(tǒng)的開發(fā)需要大量原始積累,其標(biāo)準(zhǔn)沒有一個統(tǒng)一的規(guī)范,這可能導(dǎo)致在綜合各個專家知識時存在偏差和失誤。專家系統(tǒng)的應(yīng)用較早,在近幾年這方面的成果不多。
2.2 神經(jīng)網(wǎng)絡(luò)及其應(yīng)用
神經(jīng)網(wǎng)絡(luò)主要以兩種方式實現(xiàn)預(yù)測功能:一是以神經(jīng)網(wǎng)絡(luò)作為函數(shù)逼近器,對設(shè)備工況及其參數(shù)進(jìn)行擬合預(yù)測;二是考慮輸入輸出間的動態(tài)關(guān)系,用帶饋連接的動態(tài)神經(jīng)網(wǎng)絡(luò)對國產(chǎn)或工況參數(shù)建立動態(tài)模型進(jìn)行故障預(yù)測。神經(jīng)網(wǎng)絡(luò)具有較強的非線性映射能力,能逼近任意非線性函數(shù)。在故障預(yù)測方面得到了廣泛的應(yīng)用,利用遞歸神經(jīng)網(wǎng)絡(luò)對半導(dǎo)體蝕刻設(shè)備進(jìn)行了故障預(yù)測,預(yù)測結(jié)果的準(zhǔn)確度達(dá)到了90%。利用RBF的非線性建模能力,在某魚雷保障設(shè)備的關(guān)鍵點建立網(wǎng)絡(luò)預(yù)測模型,得到了較好的預(yù)測效果。但神經(jīng)網(wǎng)絡(luò)同樣也有一些缺點,如網(wǎng)絡(luò)結(jié)構(gòu)大多需要靠經(jīng)驗確定;容易出現(xiàn)過學(xué)習(xí)和易限于局部最小點;訓(xùn)練樣本需求量大等。
2.3 支持向量機及其應(yīng)用
支持向量機(SVM)是根據(jù)統(tǒng)計學(xué)理論提出的一種機器學(xué)習(xí)算法。它具有強小樣本學(xué)習(xí)能力和強泛化能力,可以很好的克服局部極小點、維數(shù)災(zāi)難等過學(xué)習(xí)問題。現(xiàn)在的設(shè)備越來越復(fù)雜,導(dǎo)致樣本的獲取變得更加困難,和神經(jīng)網(wǎng)絡(luò)相比,支持向量機的小樣本學(xué)習(xí)能力就顯得更加突出。由于支持向量機具有上述的優(yōu)點,其相應(yīng)的算法和改進(jìn)的算法得到了廣泛的應(yīng)用。田干等將支持向量機和最小二乘支持向量機都運用到液體火箭發(fā)動機參數(shù)預(yù)測問題,預(yù)測精度都很高,通過對比兩種方法的預(yù)測結(jié)果,發(fā)現(xiàn)前者的預(yù)測結(jié)果好于后者,但后者的訓(xùn)練時間遠(yuǎn)遠(yuǎn)小于前者。利用支持向量回歸機分為兩個步驟對軸承的剩余壽命(URL)進(jìn)行預(yù)測,預(yù)測結(jié)果和軸承的實際剩余壽命基本一致,具有很好的預(yù)測效果。
3 支持向量機預(yù)測算法基本問題及改進(jìn)方向
3.1 支持向量機預(yù)測的主要問題
支持向量機在使用的過程中主要,對其性能有重要影響的參數(shù)包括懲罰參數(shù)C,核函數(shù)及核參數(shù)的選取。C用于控制模型復(fù)雜度和逼近誤差的折中,C越大則對數(shù)據(jù)的擬合程度越高,學(xué)習(xí)機器的復(fù)雜度就越高,容易出現(xiàn)“過學(xué)習(xí)”的現(xiàn)象。而C取值過小,則對經(jīng)驗誤差的懲罰小,學(xué)習(xí)機器的復(fù)雜度低,就會出現(xiàn)“欠學(xué)習(xí)”的現(xiàn)象。當(dāng)C的取值大到一定程度時,SVM模型的復(fù)雜度將超過空間復(fù)雜度的最大范圍,那么當(dāng)C繼續(xù)增大時將幾乎不在對SVM的性能產(chǎn)生影響。針對上面支持向量機預(yù)測的主要問題,很多學(xué)者也進(jìn)行了深入細(xì)致的研究,很多模型參數(shù)選取的方法被提出,并應(yīng)用到實例中,并且都提高了預(yù)測的準(zhǔn)確度。主要有窮舉法、交叉驗證法、梯度下降法、網(wǎng)格搜索法、遺傳算法優(yōu)化、粒子群算法優(yōu)化(PSO)。上述方法中,窮舉法、交叉驗證法因其操作簡單被廣泛應(yīng)用,但是對于參數(shù)較多的情況來說,它們都有著計算量大,速度慢,效果不好等缺點。梯度下降法比前兩種方法在速度上有了很大改善,對其初始點要求較高,而且是一種線性搜索法,因此極易陷入局部最優(yōu)。網(wǎng)格算法的優(yōu)點在于可以并行處理,而其缺點為計算量巨大。遺傳算法具有魯棒性強不容易陷入局部最優(yōu),但是其操作比較復(fù)雜。粒子群算法則存在易于陷入局部最優(yōu)導(dǎo)致的收斂精度低和不易收斂等缺點。
3.2 支持向量機預(yù)測方法的改進(jìn)
前面也提到了支持向量機預(yù)測精度提高面臨的主要問題,針對這些問題本身,可以得到其改進(jìn)的一些方向。主要可以分為四個方面:一是對現(xiàn)有模型參數(shù)選擇方法的改進(jìn);二是針對現(xiàn)有模型參數(shù)選擇方法的缺點,將其進(jìn)行組合;是針對具體問題建立新的核函數(shù)或者將現(xiàn)有的核函數(shù)進(jìn)行組合;三四是制定一套通用性比較好的標(biāo)準(zhǔn)化的模型參數(shù)確定方法。
現(xiàn)有模型參數(shù)的選擇方法中,都有相應(yīng)的缺點,克服其缺點,提出相應(yīng)的改進(jìn)方法。這對于提高模型的預(yù)測準(zhǔn)確度定會有所幫助。由于參數(shù)的選擇范圍較大,在多個參數(shù)中進(jìn)行盲目搜索最優(yōu)參數(shù)的時間代價較大,且很難得到最優(yōu)參數(shù)。為此,田海雷等提出一種基于改進(jìn)人工魚群算法(AFSA)的支持向量機(SVM)預(yù)測算法。對AFSA進(jìn)行改進(jìn),并使用改進(jìn)算法優(yōu)化 SVM。實驗結(jié)果表明,與遺傳算法、粒子群優(yōu)化算法和基本 AFSA 優(yōu)化的支持向量機相比,預(yù)測精度得到了很大的提高;李文元等將粒子群算法和最小二乘支持向量機算法相結(jié)合,采用PSO算法優(yōu)化LS-SVM的參數(shù),克服了人為參數(shù)選擇的盲目性,在全局優(yōu)化與收斂速度方面具有較大優(yōu)勢。經(jīng)PSO算法優(yōu)化后的LS-SVM應(yīng)用到通信設(shè)備的故障預(yù)測中,預(yù)測精度和運算速度都得到了提高,具有較好的有效性和可行性。
組合模型參數(shù)選擇方法,充分發(fā)揮每種方法的優(yōu)點,克服其不足。這對提高模型的預(yù)測準(zhǔn)確度肯定也會有很大的提高。如AFS-ABC算法,用于組合優(yōu)化LS-SVM的參數(shù)。該算法將魚群算法AFS簡化模型中人工魚的尋優(yōu)更新方法引入到蜂群算法中,以互補優(yōu)勢、互克不足,以某航空電子系統(tǒng)電源模塊的故障預(yù)測為例驗證了AFS-ABC算法較好地改善了LS-SVM的預(yù)測精度。
針對不同問題,選擇不同的核函數(shù)對于預(yù)測結(jié)果肯定會有所不同,可以根據(jù)實際的需求,建立新的滿足核函數(shù)要求的核函數(shù)。通過查閱數(shù)據(jù)庫,組合核函數(shù)或建立新的核函數(shù)進(jìn)行設(shè)備故障預(yù)測的相關(guān)文獻(xiàn)很少,但在故障診斷方面已經(jīng)得到了相關(guān)的應(yīng)用。從故障診斷到故障預(yù)測是一個連續(xù)的過程,在故障診斷方面的應(yīng)用也預(yù)示著在故障預(yù)測方面也會有所突破。
4 結(jié)束語
本文主要介紹了幾種常見的智能預(yù)測算法及其應(yīng)用情況,重點介紹了支持向量機預(yù)測算法的一些基本問題,針對其預(yù)測算法的基本問題,提出了一些改進(jìn)的方向。支持向量機作為智能預(yù)測算法中的一種,具有明顯的優(yōu)勢,因此,對其理論上進(jìn)行分析,應(yīng)用上加以拓展,這對于提高設(shè)備的預(yù)測準(zhǔn)確度具有重要的作用??偟膩碚f,在提高預(yù)測準(zhǔn)確度方面,支持向量機是一種比較有前景的智能預(yù)測算法。
參考文獻(xiàn)
[1]Liu C S,Hu S S,Intelligent Nonlinear Fault Diagnosis based on State Estimator[J].Control and Decision,2005,20(05):557-561.
能力是指主體能勝任某項任務(wù)的主觀條件。在數(shù)學(xué)學(xué)習(xí)中,學(xué)生的數(shù)學(xué)能力與他們的知識基礎(chǔ)和心理特征有關(guān)。技能是指依據(jù)一定的規(guī)則和程序去完成專門任務(wù)(解決特定的問題)的能力。顯然,技能和能力都與知識密不可分;但學(xué)生在任務(wù)(問題)面前如何對知識和運用這些知識的途徑進(jìn)行選擇,使得完成任務(wù)(解決問題)達(dá)到多快好省,則是一項超越知識本身的心理活動。因此,把知識、技能和能力三者并列起來是合理的;但也應(yīng)看清楚,這三者的順序是由低到高,在教育、教學(xué)的意義下是后者更重于前者。
一、歷史的回顧
我國的中學(xué)數(shù)學(xué)教學(xué)大綱,對于數(shù)學(xué)思想和數(shù)學(xué)方法的重要性的認(rèn)識也有一個從低到高的過程。
由國家教育委員會基礎(chǔ)教育司編訂、1996年5月第1版的《全日制普通高級中學(xué)數(shù)學(xué)教學(xué)大綱(供試驗用)》,在第2頁“教學(xué)目的”中也規(guī)定:“高中數(shù)學(xué)的基礎(chǔ)知識是指:高中數(shù)學(xué)中的概念、性質(zhì)、法則、公式、公理、定理以及由其內(nèi)容反映出來的數(shù)學(xué)思想和方法?!痹诮缍ā八季S能力”一詞的四個主要層面時,指出第三層面是“會合乎邏輯地、準(zhǔn)確地闡述自己的思想和觀點”;第四層面是“能運用數(shù)學(xué)概念、思想和方法,辨明數(shù)學(xué)關(guān)系,形成良好的思維品質(zhì)”。這份大綱維持了數(shù)學(xué)的“內(nèi)容、思想、方法和語言已成為現(xiàn)代文化的重要組成部分”的提法(第1頁);并指出數(shù)學(xué)規(guī)律“包括公理、性質(zhì)、法則、公式、定理及其聯(lián)系,數(shù)學(xué)思想、方法和語言”(第24頁);堅持在對解題進(jìn)行指導(dǎo)時,應(yīng)該“對解題的思想方法作必要的概括”(第25頁)。這是建國以來對數(shù)學(xué)思想和數(shù)學(xué)方法關(guān)注最多的一份中學(xué)數(shù)學(xué)教學(xué)大綱,充分體現(xiàn)了數(shù)學(xué)教育工作者對于數(shù)學(xué)課程發(fā)展的一些共識。
二、數(shù)學(xué)思想方法
(一)思想、科學(xué)思想和數(shù)學(xué)思想
思想是客觀存在反映在人的意識中經(jīng)過思維活動而產(chǎn)生的結(jié)果。它是從大量的思維活動中獲得的產(chǎn)物,經(jīng)過反復(fù)提煉和實踐,如果一再被證明為正確,就可以反復(fù)被應(yīng)用到新的思維活動中,并產(chǎn)生出新的結(jié)果。本文所指的思想,都是那些顛撲不破、屢試不爽的思維產(chǎn)物。因此,對于學(xué)習(xí)者來說,思想就成為他們進(jìn)行思維活動的細(xì)胞和基礎(chǔ);思想和下面述及的方法都是他們的思維活動的載體。每門科學(xué)都逐漸形成了它自己的思想,而科學(xué)法則概括出各門科學(xué)共同遵循和運用的一些科學(xué)思想。
所謂數(shù)學(xué)思想,是指現(xiàn)實世界的空間形式和數(shù)量關(guān)系反映到人的意識之中,經(jīng)過思維活動而產(chǎn)生的結(jié)果,它是對數(shù)學(xué)事實與數(shù)學(xué)理論的本質(zhì)認(rèn)識。首先,數(shù)學(xué)思想比一般說的數(shù)學(xué)概念具有更高的抽象和概括水平,后者比前者更具體、更豐富,而前者比后者更本質(zhì)、更深刻。其次,數(shù)學(xué)思想、數(shù)學(xué)觀點、數(shù)學(xué)方法三者密不可分:如果人們站在某個位置、從某個角度并運用數(shù)學(xué)去觀察和思考問題,那么數(shù)學(xué)思想也就成了一種觀點。而對于數(shù)學(xué)方法來說,思想是其相應(yīng)的方法的精神實質(zhì)和理論基礎(chǔ),方法則是實施有關(guān)思想的技術(shù)手段。中學(xué)數(shù)學(xué)中出現(xiàn)的數(shù)學(xué)觀點(例如方程觀點、函數(shù)觀點、統(tǒng)計觀點、向量觀點、幾何變換觀點等)和各種數(shù)學(xué)方法,都體現(xiàn)著一定的數(shù)學(xué)思想。
數(shù)學(xué)思想是一類科學(xué)思想,但科學(xué)思想未必就單單是數(shù)學(xué)思想。例如,分類思想是各門科學(xué)都要運用的思想(比方語文分為文學(xué)、語言和寫作,外語分為聽、說、讀、寫和譯,物理學(xué)分為力學(xué)、熱學(xué)、聲學(xué)、電學(xué)、光學(xué)和原子核物理學(xué),化學(xué)分為無機化學(xué)和有機化學(xué),生物學(xué)分為植物學(xué)、動物學(xué)和人類學(xué)等;中學(xué)生見到的最漂亮的分類應(yīng)該是在學(xué)習(xí)哺乳綱動物時所出現(xiàn)的門(亞門)、綱(亞綱)、目(亞目)、屬、科、種的分類表,它不是單由數(shù)學(xué)給予的。只有將分類思想應(yīng)用于空間形式和數(shù)量關(guān)系時,才能成為數(shù)學(xué)思想。如果用一個詞語“邏輯劃分”作為標(biāo)準(zhǔn),那么,當(dāng)該邏輯劃分與數(shù)理有關(guān)時(可稱之為“數(shù)理邏輯劃分”),可以說是運用數(shù)學(xué)思想;當(dāng)該邏輯劃分與數(shù)理無直接關(guān)系時(例如把社會中的各行各業(yè)分為工、農(nóng)、兵、學(xué)、商等),不應(yīng)該說是運用數(shù)學(xué)思想。同樣地,當(dāng)且僅當(dāng)哲學(xué)思想(例如一分為二的思想、量質(zhì)互變的思想和肯定否定的思想)在數(shù)學(xué)中予以大量運用并且被“數(shù)學(xué)化”了時,它們也可以稱之為數(shù)學(xué)思想。
(二)數(shù)學(xué)思想中的基本數(shù)學(xué)思想
在數(shù)學(xué)思想中,有一類思想是體現(xiàn)或應(yīng)該體現(xiàn)于基礎(chǔ)數(shù)學(xué)中的具有奠基性和總結(jié)性的思維成果,這些思想可以稱之為基本數(shù)學(xué)思想?;緮?shù)學(xué)思想含有傳統(tǒng)數(shù)學(xué)思想的精華和近現(xiàn)代數(shù)學(xué)思想的基本特征,并且也是歷史地形成和發(fā)展著的。
中學(xué)數(shù)學(xué)教科書中處處滲透著基本數(shù)學(xué)思想。如果能使它落實到學(xué)生學(xué)習(xí)和運用數(shù)學(xué)的思維活動上,它就能在發(fā)展學(xué)生的數(shù)學(xué)能力方面發(fā)揮出一種方法論的功能。
(三)思路、思緒和思考
我們在中學(xué)數(shù)學(xué)教育、教學(xué)中,還經(jīng)常使用著“思路”和“思緒”這兩個詞語。一般說來,“思路”是指思維活動的線索,可視為以串聯(lián)、并聯(lián)或網(wǎng)絡(luò)形狀出現(xiàn)的思想和方法的載體,而“思緒”是指思想的頭緒?!八悸贰焙汀八季w”實際上是同義詞,并且它們都是名詞。
那么,另一個詞語“思考”又是什么意思呢?“思考”就是進(jìn)行比較深刻、周到的思維活動。作為動詞,它反映了主體把思想、方法、串聯(lián)、并聯(lián)或用網(wǎng)絡(luò)組織起來以解決問題的思維過程。由此可見,“思考”所產(chǎn)生的有效途徑就是“思路”或“思緒”;“思路”或“思緒”是“思考”的結(jié)果,是思想、方法的某種選擇和組織,且明顯帶有程序性。對思路及其所含思想、方法的選擇和組織的水平,反映了學(xué)習(xí)者能力的差異。
(四)方法和數(shù)學(xué)方法
所謂方法,是指人們?yōu)榱诉_(dá)到某種目的而采取的手段、途徑和行為方式中所包含的可操作的規(guī)則或模式。人們通過長期的實踐,發(fā)現(xiàn)了許多運用數(shù)學(xué)思想的手段、門路或程序。同一手段、門路或程序被重復(fù)運用了多次,并且都達(dá)到了預(yù)期的目的,便成為數(shù)學(xué)方法。數(shù)學(xué)方法是以數(shù)學(xué)為工具進(jìn)行科學(xué)研究的方法,即用數(shù)學(xué)語言表達(dá)事物的狀態(tài)、關(guān)系和過程,經(jīng)過推導(dǎo)、運算和分析,以形成解釋、判斷和預(yù)言的方法。
數(shù)學(xué)方法具有以下三個基本特征:一是高度的抽象性和概括性;二是精確性,即邏輯的嚴(yán)密性及結(jié)論的確定性;三是應(yīng)用的普遍性和可操作性。
數(shù)學(xué)方法在科學(xué)技術(shù)研究中具有舉足輕重的地位和作用:一是提供簡潔精確的形式化語言,二是提供數(shù)量分析及計算的方法,三是提供邏輯推理的工具?,F(xiàn)代科學(xué)技術(shù)特別是電腦的發(fā)展,與數(shù)學(xué)方法的地位和作用的強化正好是相輔相成。
宏觀的數(shù)學(xué)方法包括:模型方法,變換方法,對稱方法,無窮小方法,公理化方法,結(jié)構(gòu)方法,實驗方法。微觀的且在中學(xué)數(shù)學(xué)中常用的基本數(shù)學(xué)方法大致可以分為以下三類:
(1)邏輯學(xué)中的方法。例如分析法(包括逆證法)、綜合法、反證法、歸納法、窮舉法(要求分類討論)等。這些方法既要遵從邏輯學(xué)中的基本規(guī)律和法則,又因運用于數(shù)學(xué)之中而具有數(shù)學(xué)的特色。
(2)數(shù)學(xué)中的一般方法。例如建模法、消元法、降次法、代入法、圖象法(也稱坐標(biāo)法。代數(shù)中常用圖象法,解析幾何中常用坐標(biāo)法)、向量法、比較法(數(shù)學(xué)中主要是指比較大小,這與邏輯學(xué)中的多方位比較不同)、放縮法、同一法、數(shù)學(xué)歸納法(這與邏輯學(xué)中的不完全歸納法不同)等。這些方法極為重要,應(yīng)用也很廣泛。
(3)數(shù)學(xué)中的特殊方法。例如配方法、待定系數(shù)法、加減法、公式法、換元法(也稱之為中間變量法)、拆項補項法(含有添加輔助元素實現(xiàn)化歸的數(shù)學(xué)思想)、因式分解諸方法,以及平行移動法、翻折法等。這些方法在解決某些數(shù)學(xué)問題時起著重要作用,不可等閑視之。
(五)方法和招術(shù)
如上所述,方法是解決思想、行為等問題的門路和程序,是思想的產(chǎn)物,是包含或體現(xiàn)著思想的一套程序,它既可操作又可仿效。在選擇并實施方法的前期過程中,反映了學(xué)習(xí)者的能力和技能的高低;而在后期過程中,只反映了學(xué)習(xí)者的技能的差異。
支持向量機(SVM)可以很好地用來解決分類問題,參數(shù)優(yōu)化尤其重要?;旌虾撕瘮?shù)的引入,使得SVM又多了一個可調(diào)參數(shù)。針對該參數(shù)用人工或經(jīng)驗的方法獲取具有局限性,采用動量粒子群(MPSO)對SVM基本參數(shù)、混合可調(diào)核參數(shù)進(jìn)行綜合尋優(yōu),來尋找最佳參數(shù)組合。通過UCI數(shù)據(jù)仿真,對比結(jié)果表明:所提優(yōu)化方法能夠快速有效地提取最佳參數(shù)組合,所得SVM性能明顯提高,分類效果更好。
ス丶詞:
混合核;動量粒子群優(yōu)化;參數(shù)優(yōu)化;分類
ブ型擠擲嗪牛 TP181
文獻(xiàn)標(biāo)志碼:A
英文標(biāo)題
Parameter optimization of mixed kernel SVM based onmomentum particle swarm optimization
び⑽淖髡咼
WANG Jia, XU Weihong
び⑽牡刂(
School of Computer and Communication Engineering, Changsha University of Science and Technology, Changsha Hunan 410114, China
英文摘要
)
Abstract:
Support Vector Machine (SVM) can be used to solve classification problems, and it is very important to optimize its parameters. With the introduction of mixed kernels, SVM has one more adjustable parameter. Because it is hard to obtain the parameter by manual or experience, Momentum Particle Swarm Optimization (MPSO) was used to find the best combination of the basic parameters and mixed adjustable nuclear parameter of SVM. Finally, the simulations of UCI data show that the proposed algorithm provides an effective way to search the best parameters combination, and makes SVM have higher performance and better classification accuracy.
英文關(guān)鍵詞
Key words:
mixed kernel; Momentum Particle Swarm Optimization (MPSO); parameter optimization; classification
0 引言
支持向量機[1](Support Vector Machine, SVM)在解決小樣本、非線性及高維模式識別問題中表現(xiàn)出了許多特有的優(yōu)勢,因而得到極大重視。目前已廣泛應(yīng)用于模式識別、信號處理和生物發(fā)酵軟測量等眾多領(lǐng)域[2-5]。
支持向量機的核心在于核函數(shù),核函數(shù)的構(gòu)造對于支持向量機的性能起著至關(guān)重要的作用。混合核函數(shù)[6-7]是其中的一種構(gòu)造方法,一般由一個局部性核函數(shù)和一個全局性核函數(shù)線性組合而成,權(quán)系數(shù)的確定對混合核函數(shù)性起關(guān)鍵作用。目前,關(guān)于混合核SVM參數(shù)優(yōu)化的方法都是針對懲罰系數(shù)和核參數(shù),而對于混合核函數(shù)中可調(diào)參數(shù)如何選取的文獻(xiàn)卻很少,一般均采用經(jīng)驗值,這無疑使得SVM的參數(shù)優(yōu)化只能達(dá)到局部最優(yōu),而無法達(dá)到全局最優(yōu)。
本文采用一種改進(jìn)的粒子群算法,即動量粒子群(Momentum Particle Swarm Optimization, MPSO)算法對3個參數(shù)進(jìn)行綜合尋優(yōu),該算法不但保持了基本PSO算法的簡單、易實現(xiàn)等優(yōu)點,而且能有效提高算法的收斂速度,在尋優(yōu)的過程中能在較少的進(jìn)化代數(shù)內(nèi)達(dá)到較好的尋優(yōu)效果,并能部分避免算法的后期振蕩,以取得最佳的參數(shù)組合,為混合核SVM參數(shù)優(yōu)化提供了一種新方法。
1 SVM的理論基礎(chǔ)[8]及參數(shù)分析
SVM就是通過核函數(shù)把低維的線性不可分問題映射到高維空間,從而轉(zhuǎn)化為線性可分問題。圖1假設(shè)是已經(jīng)映射好的高維空間,空心的方格和圓圈各代表一類。
圖片
圖1 svm的高維映射
此時有一個新的樣本需要添加,結(jié)果其映射到高維空間后成為圖1中的實心方格,這樣的點無疑給分類問題帶來了一定的偏差,稱這樣的點為離群點,此時就要放低對一些點到分類平面的距離不滿足最初的分類要求,最初的優(yōu)化問題是:
Иmin12ω2オ
Иs.t. yi[(ωxi)+b]≥1
i=1,2,…,l;l是樣本數(shù)オ
Аω2是目標(biāo)函數(shù),希望它越小越好。但由于離群點的出現(xiàn),務(wù)必會使其變大,造成一定的損失。此時的優(yōu)化問題就轉(zhuǎn)化為:
Иmin12ω2+C∑li=1ζiИ
Иs.t.yi[(ωxi)+b]≥1-ζi
i=1,2,…,l;l是樣本數(shù)オ
用Аli=1ζiЮ幢硎舅鶚В將其加入目標(biāo)函數(shù)時,就需要一個懲罰因子CВ此參數(shù)就是SVM中提到的需要優(yōu)化的參數(shù)。懲罰因子CЬ齠了重視離群點帶來損失的程度。當(dāng)Аli=1ζiб歡ㄊ保定的Cг醬螅對目標(biāo)函數(shù)的損失也就越大,此時就暗示著對離群點重視的程度比較大,最極端的情況就是把CФㄎ無限大,這樣只要稍有一個點離群,目標(biāo)函數(shù)值就會變成無限大,使問題無解。因此在對參數(shù)組合進(jìn)行尋優(yōu)時,當(dāng)有幾組組合都可以取得相同的識別率時,一般會取Cе到閑〉哪親椋可以有效避免SVM的過學(xué)習(xí)現(xiàn)象,即訓(xùn)練集分類準(zhǔn)確率很高而測試集分類準(zhǔn)確率很低(分類器的泛化能力降低)。
一般SVM默認(rèn)核函數(shù)為RBF核,該核中核參數(shù)Е錨В9]是眾多參考文獻(xiàn)中SVM需要優(yōu)化的另一個重要參數(shù),它反應(yīng)了支持向量之間的相關(guān)程度。Е錨太小,支持向量間的聯(lián)系就比較松弛;Е錨太大,支持向量間的影響就會過強,模型精度難以滿足要求。當(dāng)Е錨Ш芐∈保懲罰因子CЭ梢韻嚶θ⌒∫壞悖以保證模型的推廣能力。
┑2期
王佳等:基于動量粒子群的混合核SVM參數(shù)優(yōu)化方法
┆撲慊應(yīng)用 ┑31卷
2 MPSO優(yōu)化混合核SVM參數(shù)
2.1 混合核函數(shù)
鑒于局部性核函數(shù)學(xué)習(xí)能力強、泛化性能弱,而全局性核函數(shù)泛化性能強、學(xué)習(xí)能力弱,為了得到學(xué)習(xí)能力與泛化能力都較強的核函數(shù),將這兩類核函數(shù)混合起來。RBF核函數(shù)是一個典型的局部性核函數(shù),使用比較普遍,而多項式核函數(shù)是一個典型的全局性核函數(shù),因此選擇將二者線性組合,構(gòu)造混合核函數(shù)[10]如式(1)所示。
K┆mix=λK┆poly+(1-λ)K┆rbf (1)
其中:λ∈(0,1)
K┆poly=[(x?xi)+1]q
K┆rbf=(-γx-xi2)オ
此混合核函數(shù)滿足Mercer條件,核函數(shù)的混合使需要優(yōu)化的SVM參數(shù)增一。實驗得到的Е霜У鬧狄話閽0.50~0.99,因此可以在此范圍內(nèi)對其尋優(yōu)。
2.2 MPSO算法
PSO算法[11]采用的是速度―位置搜索模型,在每一次迭代中,粒子通過跟蹤2個極值(全局極值gbestв敫鎏寮值pbestВ┖頹耙皇笨痰淖刺,來不斷地更新自己當(dāng)前在解空間中的位置,從而找到問題的最優(yōu)解。其迭代公式如式(2)、(3)所示。
vi(k+1)=ω?vi(k)+c1?rand1(k)?(p┆ibest-xi(k))+c2?rand2(k)?(g┆best-xi(k))(2)オ
xi(k+1)=xi(k)+vi(k+1)В3)
其中:v(k),v(k+1),x(k),x(k+1)Х直鶚橇W擁鼻笆笨獺⑾亂皇笨痰乃俁燃八處位置;rand1(k),rand2(k)是介于0和1之間的隨機數(shù);c1,c2是學(xué)習(xí)因子,一般取為2;Е鬲是慣性權(quán)重。
但基本的PSO算法存在收斂緩慢、后期振蕩等缺陷,因此在基本PSO的基礎(chǔ)上,引入動量項[12],構(gòu)造MPSO算法,從而有效提高算法的收斂速度,同時起到部分避免算法后期振蕩的作用。其改進(jìn)主要是在速度更新公式中的改進(jìn),令ИΔvi(k)=c1?rand1(k)?(p┆ibest-xi(k))+c2?rand2(k)?(g┆best-xi(k))В則更新后的速度公式如式(4)所示。
vi(k+1)=ω?vi(k)+Δvi(k)+αΔvi(k-1)В4)
此時粒子速度的修正量由兩項組成,第一項是基本粒子群算法的速度修正量;第二項為動量項,其與微粒的歷史修正量線性相關(guān),Е聯(lián)為動量因子常數(shù),0≤|α|
2.3 基于MPSO優(yōu)化混合核SVM算法流程
2.3.1 SVM性能指標(biāo)的選取
交叉驗證(Cross Validation,CV)是用來驗證分類器性能的一種統(tǒng)計分析方法。常見的CV方法有HoldOutMethod、kfold Cross Validation(KCV)、LeaveOneOut Cross Validation。
鑒于HoldOutMethod只是將原始數(shù)據(jù)分為兩組,最終驗證集分類準(zhǔn)確率太依賴于原始數(shù)據(jù)的分組,而LeaveOneOut Cross Validation計算成本太高,樣本數(shù)量較多時,實際操作很困難。因此,本文采用KCV的方法,即將原始數(shù)據(jù)分為k組,將每個子集數(shù)據(jù)分別做一次驗證集,其余的K-1組子集作為訓(xùn)練集,這樣得到K個模型,用這K個模型最終的驗證集的分類準(zhǔn)確率的平均值作為此KCV下分類器的性能指標(biāo)。
2.3.2 算法流程
MPSO的適應(yīng)度函數(shù)為KCV下的分類準(zhǔn)確率。
輸入:粒子的維數(shù),粒子的個數(shù)。
輸出:最優(yōu)的SVM參數(shù)(c,γ,λВ楹?。?/p>
流程按如下步驟進(jìn)行:
1)初始化MPSO中的各個參數(shù),并確定SVM各個參數(shù)的解空間,如c1=1.5,c2=1.7,Е鬲=0.9等。
2)在解空間中隨機初始化(c,γ,λВ┑奈恢茫在限定范圍內(nèi)隨機初始化粒子的初始速度,并計算初始的適應(yīng)度。
程序前
for i=1:pso_option.maxgen
程序后
3)程序前
for j=1:pso_option.sizepop
程序后
根據(jù)式(4)進(jìn)行速度更新,式(3)進(jìn)行種群更新:
4)程序前
cmd=[′-v′,num2str(pso_option.v),
′-c′,num2str(pop(j,1)),′-g′,num2str(pop(j,2)),′-a′,
num2str(pop(j,3)) ];
fitness(j) = svmtrain(train_label, train, cmd);
//計算適應(yīng)度值
程序后
5)程序前
//更新每個粒子的新局部最優(yōu)位置
if fitness(j) > local_fitness(j)
local_x(j,:) = pop(j,:);
local_fitness(j) = fitness(j);
end
程序后
6)
程序前
//更新群體最優(yōu)位置:
if fitness(j) > global_fitness
global_x = pop(j,:);
global_fitness = fitness(j);
end
end
程序后
7)程序前
//確定最優(yōu)解:
fit_gen(i) = global_fitness;
當(dāng)使得取最優(yōu)解的//參數(shù)組合不止一組時,選取C值最小的那組
程序后
8)程序前
//輸出最優(yōu)解組合(c,γ,λВ
end
程序后
此算法需要在faruto編寫的Libsvmmat加強工具箱[13]的輔助下實現(xiàn),由于此工具箱默認(rèn)核函數(shù)為RBF類型,因此,在4)中使用的混合核函數(shù)需要在工具箱中按式(1)進(jìn)行修改或添加,文中采用的是在RBF核的基礎(chǔ)上進(jìn)行修改,由return exp(-gamma*(x_square[i]+x_square[j]-2*dot(x[i],x[j])))修改為return (exp(-gamma*(x_square[i]+x_square[j]-2*dot(x[i],x[j])))*(1-a)+ powi(dot(x[i],x[j])+1,1)*a),其中的aТ表可調(diào)參數(shù)Е霜?。?/p>
3 實驗與仿真
該實驗采用的是UCI中的數(shù)據(jù)[14],在Matlab 7.9.0的環(huán)境下編程實現(xiàn)。實驗中的參數(shù)設(shè)置如下:MPSO中,c1=1.5,c2=1.7,最大進(jìn)化代數(shù)設(shè)置為200,種群數(shù)量為20,Е鬲=0.9,m=0.30,SVM中C的范圍為В0.1,100]ВЕ錨У姆段為В酈0.01,1B000]ВЕ霜У姆段為В0.50,0.99],對于K勃CV中的K值,У筆據(jù)量較小時取值為5,數(shù)據(jù)量較大時取值為9,默認(rèn)值為5。表1給出了針對UCI中wine、iris、machine數(shù)據(jù),網(wǎng)格搜索算法與MPSO算法測試所得到的最優(yōu)參數(shù)組合及CV下訓(xùn)練集的準(zhǔn)確率及采用優(yōu)化后參數(shù)組合進(jìn)行實際測試的準(zhǔn)確率,注意在實驗中選用相同的訓(xùn)練集與測試集,k取5。
表格(有表名)
分區(qū)
表1 網(wǎng)格搜索算法與MPSO優(yōu)化參數(shù)組合及分類數(shù)據(jù)相關(guān)信息對比
數(shù)據(jù)集網(wǎng)格搜索算法
(C,γ)A網(wǎng)/A網(wǎng)′
MPSO(C,γ,λ)AM/AM′
wine(2.30,4)0.988/0.988(2.75,1.90,0.65)0.978/0.994
iris(12.13,2.29)1.000/0.962(14.32,2.07,0.88)1.000/0.981
machine(5.66,2)0.918/0.806(4.31,1.00,0.632)0.901/0.852
表1中,A網(wǎng)АA網(wǎng)′Х直鶇表網(wǎng)格搜索算法下得到的CV下的訓(xùn)練集準(zhǔn)確率、實際測試集準(zhǔn)確率;AMАAM′Х直鶇表MPSO算法下得到的CV下的訓(xùn)練集準(zhǔn)確率、實際測試集準(zhǔn)確率。
網(wǎng)格搜索算法實質(zhì)上是一種窮舉法,常用來在小范圍內(nèi)尋找最佳SVM參數(shù)組合。通過表1可知,本文提出的算法在最優(yōu)參數(shù)組合上與網(wǎng)格搜索算法相當(dāng),并且在訓(xùn)練準(zhǔn)確率相同或稍低于網(wǎng)格搜索算法的情況下,在實際測試中仍能得到比其更好的識別率,由此可知,所得的SVM泛化能力有所提高。
啟發(fā)式算法不必遍歷所有參數(shù)點,也能找到全局最優(yōu)解,因而得以廣泛應(yīng)用。表2為本文的MPSO與基本PSO尋優(yōu)參數(shù)組合及進(jìn)化代數(shù)對比情況,此時取C∈[0.1,1B000]?。?~3分別給出了balancescale數(shù)據(jù)在基本PSO、MPSO算法下訓(xùn)練的適應(yīng)度曲線Accuracy圖,圖4為不同分類算法下的分類準(zhǔn)確率對比圖。
表格(有表名)
表2 基本PSO與MPSO下的最優(yōu)參數(shù)組合及進(jìn)化代數(shù)對比
數(shù)據(jù)集基本PSO
(C,γ)進(jìn)化代數(shù)
MPSO(C,γ,λ)進(jìn)化代數(shù)
wine(12.25,4.350)59(7.16,1.790,0.586)15
balance勃scale(29.90,2.620)120(25.50,1.160,0.780)80
sonar(19.30,0.362)70(15.86,0.769,0.980)46
vehicle(75.50,1.180)158(15.60,1.040,0.622)97
diabetes(47.87,0.625)162(10.90,1.070,0.820)62
在第1章的SVM參數(shù)分析時,知道過高的CЩ岬賈鹿學(xué)習(xí)狀態(tài)的發(fā)生。由表2知,MPSO算法能找到優(yōu)于PSO算法的最優(yōu)參數(shù)組合,且進(jìn)化速度明顯快于PSO。由圖2~3對比得知,MPSO算法能夠部分緩解PSO存在的后期振蕩現(xiàn)象。由圖4可知MPSO算法下優(yōu)化參數(shù)后得到SVM的分類準(zhǔn)確率明顯高于PSO下得到的SVM分類準(zhǔn)確率,且高于最近鄰算法(1NN)、C4.5等其他常見分類算法的準(zhǔn)確率。
圖片
圖2 balancescale數(shù)據(jù)在基本PSO下訓(xùn)練的適應(yīng)度曲線Accuracy圖
圖片
圖3 balancescale數(shù)據(jù)在MPSO下訓(xùn)練的適應(yīng)度曲線Accuracy圖
圖片
圖4 測試數(shù)據(jù)不同分類算法下的識別率對比圖
4 結(jié)語
SVM的最優(yōu)參數(shù)組合選取問題一直是影響SVM性能的關(guān)鍵問題,目前關(guān)于其選取仍沒有統(tǒng)一的方法。本文給出的帶有動量項的粒子群算法,對具有混合核的SVM進(jìn)行參數(shù)尋優(yōu),通過UCI數(shù)據(jù)進(jìn)行測試,得出該算法能快速有效地提取出最優(yōu)參數(shù)組合,所得的SVM泛化能力上優(yōu)于RBF核的網(wǎng)格搜索算法,進(jìn)化速度快于PSO,測試所得分類準(zhǔn)確率優(yōu)于其他常見分類算法,為選取最優(yōu)SVM參數(shù)組合提供了一種新方法。
げ慰嘉南:
[1]
邊肇祺,張學(xué)工.模式識別[M].2版.北京:清華大學(xué)出版社, 2000: 296-304.
[2]
劉松.基于SVM信息融合的圖像識別與并行實現(xiàn)[J].計算機工程與應(yīng)用, 2009, 45(33): 168-182.
[3]
MELGANI F, BAZI Y. Classigication of electrocardiogram signals with support vector machines and particle swarm optimization[J]. Information Technology in Biomedicine, 2008, 12(5): 667-677.
[4]
LATRY CH,PANEM C,DEJEAN P.Cloud detection with SVM technique[C]// 2007 IEEE Iternational Geoscience and Remote Sensing Symposium. Washington, DC: IEEE Computer Society, 2007: 448-451.
[5]
常玉清,王福利,王小剛,等.基于支持向量機的生物發(fā)酵過程軟測量建模[J].東北大學(xué)學(xué)報:自然科學(xué)版, 2005, 26(11): 1025-1028.
[6]
張擁華,曾凡仔.基于混合核支持向量機的金融時間序列分析[J].計算機工程與應(yīng)用, 2008, 44(19): 220-222.
[7]
業(yè)巧林,業(yè)寧,張訓(xùn)華.基于極分解下的混合核函數(shù)及改進(jìn)[J].模式識別與人工智能, 2009(3): 366-373.
[8]
鄧乃揚,田英杰.支持向量機:理論、算法與拓展[M].北京:科學(xué)出版社, 2009: 81-111.
[9]
陳林,潘豐.基于量子PSO的SVM參數(shù)選擇及其應(yīng)用[J].自動化與儀表, 2009, 24(1): 5-8.
[10]
張芬,陶亮,孫艷.基于混合核函數(shù)的SVM及其應(yīng)用[J].計算機技術(shù)與發(fā)展, 2006, 16(2): 176-178.
[11]
SALLEH S M,TOKHI M O,JULAI S,et al. PSObased parametric modelling of a thin plate structure[C]// Proceedings of the 2009 Third UKSim European Symposium on Computer Modeling and Simulation. Washington, DC: IEEE Computer Society, 2009: 43-48.
[12]
黃福員.一種改進(jìn)的動量粒子群算法及實驗分析[J].計算機應(yīng)用與軟件, 2009, 26(10): 57-59.
[13]
faruto編寫的Libsvm加強工具箱[EB/OL]. [2010-02-02]. /viewthread.php?tid=65333&extra=&page=1.
數(shù)學(xué)分析論文 數(shù)學(xué)家論文 數(shù)學(xué) 數(shù)學(xué)建模 數(shù)學(xué)初一論文 數(shù)學(xué)物理論文 數(shù)學(xué)簡史論文 數(shù)學(xué)思維論文 數(shù)學(xué)初二論文 數(shù)學(xué)創(chuàng)新教學(xué) 紀(jì)律教育問題 新時代教育價值觀