前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇卷積神經(jīng)網(wǎng)絡(luò)意義范文,相信會(huì)為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
關(guān)鍵詞:深度學(xué)習(xí);行為識(shí)別;神經(jīng)網(wǎng)絡(luò)
1 概述
動(dòng)作行為識(shí)別是計(jì)算機(jī)視覺領(lǐng)域中的一個(gè)研究熱點(diǎn),已經(jīng)廣泛應(yīng)用于智能監(jiān)控、人機(jī)交互、視頻檢索等領(lǐng)域中[1]。動(dòng)作行為識(shí)別技術(shù)是通過對(duì)視頻或者圖像中人體動(dòng)作行為做出有意義的判斷。有效表達(dá)圖像(視頻)中的實(shí)際目標(biāo)和場(chǎng)景內(nèi)容是最基本,最核心的問題。因此,對(duì)于特征的構(gòu)建和選擇得到廣泛關(guān)注,例如STIP、SIFT、MSER等。但是,能通過無監(jiān)督方式讓機(jī)器自動(dòng)從樣本中學(xué)習(xí)到表征樣本的特征,會(huì)讓人們更好地利用計(jì)算機(jī)來實(shí)現(xiàn)人的視覺功能。而深度學(xué)習(xí)作為神經(jīng)網(wǎng)絡(luò)的延伸和發(fā)展,是通過逐層構(gòu)建一個(gè)多層網(wǎng)絡(luò)來使得機(jī)器自動(dòng)學(xué)習(xí)到隱含在數(shù)據(jù)內(nèi)部的關(guān)系,從而讓學(xué)習(xí)到的特征更加準(zhǔn)確性。
文章旨在探討深度學(xué)習(xí)與機(jī)器學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò))之間的關(guān)系,并且介紹深度學(xué)習(xí)的由來、概念和原理;同時(shí)介紹目前深度學(xué)習(xí)在計(jì)算機(jī)視覺中的應(yīng)用。最后提出深度學(xué)習(xí)目前發(fā)展所面臨的問題,以及對(duì)未來的展望。
2 深度學(xué)習(xí)
2.1 深度學(xué)習(xí)概述
深度學(xué)習(xí)源于人工神經(jīng)網(wǎng)絡(luò)的研究,是機(jī)器學(xué)習(xí)的拓展。深度學(xué)習(xí)是經(jīng)過組合低層特征來形成更加抽象的屬性類別和特征,從中發(fā)現(xiàn)原始數(shù)據(jù)的特征表征[2]?,F(xiàn)在用于動(dòng)作行為識(shí)別的技術(shù)是通過“動(dòng)作表征”+“動(dòng)作分類器”的框架來進(jìn)行行為識(shí)別的。其中“動(dòng)作表征”是人們手動(dòng)設(shè)計(jì)特征獲取到的,也就是在目前識(shí)別框架內(nèi)存在一個(gè)對(duì)動(dòng)作圖像(視頻)的預(yù)處理過程。
深度學(xué)習(xí)和淺層學(xué)習(xí)相對(duì)。目前許多學(xué)習(xí)算法是淺層網(wǎng)絡(luò)學(xué)習(xí)方法,具有一定的局限性,例如在樣本有限的狀況下,表示復(fù)雜函數(shù)的能力有限制,且對(duì)復(fù)雜分類問題的泛化能力也會(huì)受到一定約束[3]。而深度學(xué)習(xí)通過學(xué)習(xí)深層非線性網(wǎng)絡(luò)結(jié)構(gòu),達(dá)到復(fù)雜函數(shù)逼近,又能在樣本少的情況下學(xué)習(xí)原始數(shù)據(jù)的特征。BP算法作為傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的典型算法,雖然訓(xùn)練多層網(wǎng)絡(luò),但僅含幾層網(wǎng)絡(luò),訓(xùn)練方法很不理想[3]。因?yàn)槠漭斎牒洼敵鲩g非線性映射讓網(wǎng)絡(luò)誤差函數(shù)形成含多個(gè)極小點(diǎn)的非線性空間,因而經(jīng)常收斂到局部最小,且隨著網(wǎng)絡(luò)層數(shù)的增加,容易過擬合。而深度學(xué)習(xí)可以獲得分布式表示,通過逐層學(xué)習(xí)算法來得到原始輸入數(shù)據(jù)的主要變量。通過深度學(xué)習(xí)的非監(jiān)督訓(xùn)練完成,同時(shí)利用生成性訓(xùn)練避免因函數(shù)表達(dá)能力過強(qiáng)而出現(xiàn)過擬合情況。
2.2 深度學(xué)習(xí)原理
傳統(tǒng)機(jī)器學(xué)習(xí)僅含單層非線性變換的淺層網(wǎng)絡(luò)結(jié)構(gòu),而且淺層模型單一。這對(duì)于深度網(wǎng)絡(luò)來說易造成陷入最優(yōu)或產(chǎn)生梯度分散等問題。因此,Hinton等人在基于深度置信網(wǎng)(DBNs)的情況下提出非監(jiān)督貪婪逐層訓(xùn)練算法,隨后提出了多層次自動(dòng)編碼器深層結(jié)構(gòu),這給解決深層網(wǎng)絡(luò)結(jié)構(gòu)相關(guān)的優(yōu)化難題帶來了希望。此外Lecun等人提出的卷積神經(jīng)網(wǎng)絡(luò)是第一個(gè)多層次結(jié)構(gòu)的學(xué)習(xí)算法。同時(shí)深度學(xué)習(xí)還出現(xiàn)了許多結(jié)構(gòu):多層感知機(jī)、去噪自動(dòng)編碼器、稀疏編碼等。
卷積神經(jīng)網(wǎng)絡(luò)是第一個(gè)真正采用多層次網(wǎng)絡(luò)結(jié)構(gòu),具有魯棒性的深度學(xué)習(xí)算法,通過探究數(shù)據(jù)在空間上的相關(guān)性,減少訓(xùn)練參數(shù)的數(shù)量。而且卷積神經(jīng)網(wǎng)絡(luò)(CNN)適應(yīng)性強(qiáng),善于發(fā)現(xiàn)數(shù)據(jù)的局部特征。它的權(quán)重共享結(jié)構(gòu)降低了網(wǎng)絡(luò)模型的復(fù)雜度,減少了權(quán)值的數(shù)量,使得卷積神經(jīng)網(wǎng)絡(luò)在模式識(shí)別中取得了很好的結(jié)果。
自動(dòng)編碼器的核心關(guān)鍵是將原始圖像(視頻)輸入信號(hào)進(jìn)行編碼,使用編碼后的信號(hào)來重建原始信號(hào),使得兩者之間的重建誤差最小。通過將原始信號(hào)編碼成另一形式,能夠有效地提取信號(hào)中的主要信息,能夠簡(jiǎn)潔地表達(dá)原始圖像(視頻)的特征。
3 深度學(xué)習(xí)的應(yīng)用
3.1 語音識(shí)別
從2009年開始,微軟研究院語音識(shí)別專家通過與Hinton合作,首先將RBM和DBN引入到語音識(shí)別聲學(xué)模型訓(xùn)練中,使得語音識(shí)別的錯(cuò)誤率相對(duì)減低30%,這徹底改變了語音識(shí)別原有的技術(shù)框架。在國(guó)際上,IBM、google等公司都快速進(jìn)行了DNN語音識(shí)別的研究,并且速度飛快。國(guó)內(nèi)方面,阿里巴巴,科大訊飛、百度、中科院自動(dòng)化所等公司或研究單位,也在進(jìn)行深度學(xué)習(xí)在語音識(shí)別上的研究。
3.2 視頻中的動(dòng)作行為識(shí)別
準(zhǔn)確迅速識(shí)別視頻中人的動(dòng)作行為對(duì)于視頻搜索和視頻監(jiān)控具有劃時(shí)代的意義。最近幾年,深度學(xué)習(xí)技術(shù)被應(yīng)用于視頻動(dòng)作行為識(shí)別中。如Ji等人[4]提出多層網(wǎng)絡(luò)的3D卷積神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)視頻中的時(shí)空特征,并通過卷積來實(shí)現(xiàn)對(duì)整個(gè)視頻特征的學(xué)習(xí),從而代替之前的時(shí)空興趣點(diǎn)檢測(cè)和特征描述提取。在TRECVID數(shù)據(jù)庫上進(jìn)行的實(shí)驗(yàn)取得了不錯(cuò)效果。
4 結(jié)束語
文章對(duì)深度學(xué)習(xí)的主要概念進(jìn)行了全面闡述,包括其由來、原理、研究進(jìn)展和相應(yīng)的應(yīng)用等。在很多領(lǐng)域中,深度學(xué)習(xí)都表現(xiàn)了潛在的巨大價(jià)值,但深度學(xué)習(xí)作為淺層學(xué)習(xí)的延伸,仍處于發(fā)展階段,還有很多問題值得我們深入探討:
(1)我們需要了解深度學(xué)習(xí)的樣本復(fù)雜度,需要多少訓(xùn)練樣本才能學(xué)習(xí)到足夠的深度模型。
(2)在推進(jìn)深度學(xué)習(xí)的學(xué)習(xí)理論和計(jì)算理論的同時(shí),我們是否可以建立一個(gè)通用的深度學(xué)習(xí)網(wǎng)絡(luò)模型,作為統(tǒng)一的框架來處理語音、圖像和語言。
(3)神經(jīng)網(wǎng)絡(luò)具有前饋性連接和反饋性連接,可是我們研究的深度網(wǎng)絡(luò)中還沒有加入反饋連接,這些都給深度學(xué)習(xí)的研究帶來了嚴(yán)峻的挑戰(zhàn)。
參考文獻(xiàn)
[1]王亮,胡衛(wèi)明,譚鐵牛.人運(yùn)動(dòng)的視覺分析綜述[J].計(jì)算機(jī)學(xué)報(bào),2002,25(3):225-237.
[2]余凱,賈磊,陳雨強(qiáng).深度學(xué)習(xí)的昨天、今天和明天[J].計(jì)算機(jī)研究與發(fā)展,2013,50(9):1799-1804.
關(guān)鍵詞:人臉識(shí)別技術(shù);病毒管控;人工智能;神經(jīng)網(wǎng)絡(luò)
互聯(lián)網(wǎng)在今天的社會(huì)中發(fā)揮著舉足輕重的作用。如今社會(huì),隨著許多人工智能技術(shù)、網(wǎng)絡(luò)技術(shù)、云計(jì)算等互聯(lián)網(wǎng)技術(shù)不斷發(fā)展,像人臉識(shí)別等技術(shù)的應(yīng)用越來越廣泛,在控制病毒傳播途徑等場(chǎng)合發(fā)揮了巨大作用,不斷地提高著社會(huì)的安全性和便利性,不僅提高了防控中病毒檢測(cè)效率,也為病毒的控制提供了可靠的技術(shù)方法,能夠及時(shí)發(fā)現(xiàn)和控制公共場(chǎng)所的安全隱患因素,避免對(duì)社會(huì)經(jīng)濟(jì)、居民生活造成破壞,。但目前的人臉識(shí)別等技術(shù)還存在許多缺陷,需要完善和革新,充滿著巨大的潛力和進(jìn)步空間。
1人臉識(shí)別技術(shù)研究意義
人臉識(shí)別技術(shù)是一種生物特征識(shí)別技術(shù),最早產(chǎn)生于上世紀(jì)60年代,基于生理學(xué)、圖像處理、人機(jī)交互及認(rèn)知學(xué)等方面的一種識(shí)別技術(shù)。相比于其他人類特征像指紋識(shí)別、聲紋識(shí)別、虹膜識(shí)別等技術(shù),人臉識(shí)別雖然存在人臉識(shí)別單一性低,且區(qū)分度難度高、易受環(huán)境影響等不足。但是人臉識(shí)別技術(shù)擁有速度快、大范圍群體識(shí)別及非接觸、遠(yuǎn)距離可識(shí)別等優(yōu)勢(shì),都是其他生物識(shí)別識(shí)別技術(shù)所不具備的,而在傳播性強(qiáng)、感染風(fēng)險(xiǎn)大的病毒傳播過程中,這些顯然是必須要考慮的重要影響因素。通過將人臉識(shí)別等人工智能技術(shù)引入信息管理系統(tǒng),綜合集成視頻監(jiān)控、圖像處理、深度學(xué)習(xí)和大數(shù)據(jù)等技術(shù),結(jié)合非接觸測(cè)溫、定位等技術(shù),助力病情防控,在一定程度上推動(dòng)病毒病情防控信息化、智能化發(fā)展進(jìn)程??勺鳛榧訌?qiáng)公共場(chǎng)所的人員的體溫實(shí)時(shí)監(jiān)測(cè)、地址信息定位的監(jiān)控管理,規(guī)范公共場(chǎng)所針對(duì)病毒傳播的預(yù)防行為。
2人臉識(shí)別技術(shù)
2.1人臉檢測(cè)技術(shù)
人臉檢測(cè)是自動(dòng)人臉識(shí)別系統(tǒng)中的一個(gè)關(guān)鍵環(huán)節(jié)。早期的人臉識(shí)別研究主要針對(duì)具有較強(qiáng)約束條件的人臉圖象(如無背景的圖象),往往假設(shè)人臉位置靜止或者容易獲取。人臉檢測(cè)分為前深度學(xué)習(xí)時(shí)期,AdaBoost框架時(shí)期以及深度學(xué)習(xí)時(shí)期。前深度學(xué)習(xí)時(shí)期,人們將傳統(tǒng)的計(jì)算機(jī)視覺算法運(yùn)用于人臉檢測(cè),使用了模板匹配技術(shù),依賴于人工提取特征,然后用這些人工特征訓(xùn)練一個(gè)檢測(cè)器;后來技術(shù)發(fā)展,在2001年Viola和Jones設(shè)計(jì)了一種人臉檢測(cè)算法,它使用簡(jiǎn)單的Haar-like特征和級(jí)聯(lián)的AdaBoost分類器構(gòu)造檢測(cè)器,檢測(cè)速度較之前的方法有2個(gè)數(shù)量級(jí)的提高,并且保持了很好的精度,稱這種方法為VJ框架。VJ框架是人臉檢測(cè)歷史上第一個(gè)最具有里程碑意義的一個(gè)成果,奠定了基于AdaBoost目標(biāo)檢測(cè)框架的基礎(chǔ),使用級(jí)聯(lián)AdaBoost分類器進(jìn)行目標(biāo)檢測(cè)的思想是:用多個(gè)AdaBoost分類器合作實(shí)現(xiàn)對(duì)候選框的分類,這些分類器組成一個(gè)流水線,對(duì)滑動(dòng)窗口中的候選框圖像進(jìn)行判定,確定檢測(cè)目標(biāo)是人臉還是非人臉。Adaboost框架技術(shù)的精髓在于用簡(jiǎn)單的強(qiáng)分類器在初期快速排除掉大量的非人臉窗口,同時(shí)保證高的召回率,使得最終能通過所有級(jí)強(qiáng)分類器的樣本數(shù)數(shù)量較少。在深度學(xué)習(xí)時(shí)期,開始將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于人臉檢測(cè)領(lǐng)域。研究方向有兩種:一是將適用于多任務(wù)的目標(biāo)檢測(cè)網(wǎng)絡(luò)應(yīng)用于人臉檢測(cè)中;另一種是研究特定的的人臉檢測(cè)網(wǎng)絡(luò)。人臉檢測(cè)技術(shù)具有特殊唯一性和穩(wěn)定性,在現(xiàn)今社會(huì)對(duì)于構(gòu)建居民身份識(shí)別系統(tǒng),病毒傳播防控系統(tǒng),以及計(jì)算機(jī)視覺交互模型的構(gòu)建具有廣泛的應(yīng)用。人臉檢測(cè)技術(shù)不僅作為人臉識(shí)別的首要步驟,也在許多其他領(lǐng)域發(fā)揮巨大影響,如人臉關(guān)鍵點(diǎn)提取、人臉追蹤、基于內(nèi)容的檢索、數(shù)字視頻處理、視頻檢測(cè)、安防監(jiān)控、人證比對(duì)、社交等領(lǐng)域都有重要的應(yīng)用價(jià)值。數(shù)碼相機(jī)、手機(jī)等移動(dòng)端上的設(shè)備已經(jīng)大量使用人臉檢測(cè)技術(shù)實(shí)現(xiàn)成像時(shí)對(duì)人臉的對(duì)焦、圖集整理分類等功能,各種虛擬美顏相機(jī)也需要人臉檢測(cè)技術(shù)定位人臉。評(píng)價(jià)一個(gè)人臉檢測(cè)算法好壞的指標(biāo)是檢測(cè)率和誤報(bào)率,我們定義檢測(cè)率為:算法要求在檢測(cè)率和誤報(bào)率之間盡量平衡,理想的情況是達(dá)到高檢測(cè)率,低誤報(bào)率。
2.2人臉識(shí)別技術(shù)
目前主要流行的人臉識(shí)別技術(shù)包括幾何特征識(shí)別,模型識(shí)別,特征臉識(shí)別和基于深度學(xué)習(xí)/神經(jīng)網(wǎng)絡(luò)的的人臉識(shí)別技術(shù)等。人臉特征識(shí)別主要通過對(duì)人臉面部結(jié)構(gòu)特征如眼睛、鼻子等五官幾何特點(diǎn)及其相對(duì)位置分布等,生成圖像,并計(jì)算各個(gè)面部特征之間的歐式距離、分布、大小等關(guān)系該方法比較簡(jiǎn)單,反應(yīng)速度快,并且具有魯棒性強(qiáng)等優(yōu)點(diǎn),但是在實(shí)際環(huán)境下使用容易受檢測(cè)的環(huán)境的變化、人臉部表情變化等影響,精度通常不高,細(xì)節(jié)處理上不夠完善。模型識(shí)別技術(shù)主要包括隱馬爾可夫模型、主動(dòng)表象模型、主動(dòng)形狀模型等,識(shí)別率較高,并且對(duì)表情等變化影響較小。特征臉識(shí)別來源于主成分描述人臉照片技術(shù)(PCA技術(shù)),從數(shù)學(xué)上來講,特征臉就是人臉的圖像集協(xié)方差矩陣的特征向量。該技術(shù)能有效的顯示人臉信息,效率較高?;谏疃葘W(xué)習(xí)的人臉識(shí)別是獲取人臉圖像特征,并將包含人臉信息的特征進(jìn)行線性組合等,提取人臉圖像的特征,學(xué)習(xí)人臉樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次。可以采用如三層前饋BP神經(jīng)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)是1986年由Rumelhart和McClelland為首的科學(xué)家提出的概念,是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),是應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。BP網(wǎng)絡(luò)本質(zhì)上是一種能夠?qū)W量的輸入與輸出之間的映射關(guān)系的輸入到輸出的映射,從結(jié)構(gòu)上講,BP網(wǎng)絡(luò)具有輸入層、隱藏層和輸出層;從本質(zhì)上講,BP算法就是以網(wǎng)絡(luò)誤差平方為目標(biāo)函數(shù)、采用梯度下降法來計(jì)算目標(biāo)函數(shù)的最小值。BP神經(jīng)網(wǎng)路輸入層有n個(gè)神經(jīng)元節(jié)點(diǎn),輸出層具有m個(gè)神經(jīng)元,隱含層具有k個(gè)神經(jīng)元,采用BP學(xué)習(xí)算法訓(xùn)練神經(jīng)網(wǎng)絡(luò)。BP算法主要包括兩個(gè)階段:向前傳播階段和向后傳播階段。在向前傳播階段,信息從輸入層經(jīng)過逐級(jí)的變換,傳送到輸出層。這個(gè)過程也是在網(wǎng)絡(luò)完成訓(xùn)練后正常運(yùn)行時(shí)執(zhí)行。將Xp作為輸入向量,Yp為期望輸出向量則BP神經(jīng)網(wǎng)絡(luò)向前傳播階段的運(yùn)算,得到實(shí)際輸出表達(dá)式為向后傳播階段主要包括兩大步驟:①計(jì)算實(shí)際輸出Op與對(duì)應(yīng)理想輸出Yp之差;②按極小化誤差方法調(diào)整帶權(quán)矩陣。之所以將此階段稱為向后傳播階段,是對(duì)應(yīng)于輸入信號(hào)的正常傳播而言的,因?yàn)樵撾A段都需要收到精度要求進(jìn)行誤差處理,所以也可以稱之為誤差傳播階段。(1)確定訓(xùn)練集。由訓(xùn)練策略選擇樣本圖像作為訓(xùn)練集。(2)規(guī)定各權(quán)值Vij,Wjk和閾值Φj,θk參數(shù),并初始化學(xué)習(xí)率α及精度控制參數(shù)ε。(3)從訓(xùn)練集中取輸入向量X到神經(jīng)網(wǎng)絡(luò),并確定其目標(biāo)輸出向量D。(4)利用上式計(jì)算出一個(gè)中間層輸出H,再用本式計(jì)算出網(wǎng)絡(luò)的實(shí)際輸出Y。(5)將輸出矢量中yk與目標(biāo)矢量中dk進(jìn)行比較,計(jì)算輸出誤差項(xiàng),對(duì)中間層的隱單元計(jì)算出L個(gè)誤差項(xiàng)。(6)最后計(jì)算出各權(quán)值和閾值的調(diào)整量。所以,卷積神經(jīng)網(wǎng)絡(luò)算法是通過訓(xùn)練人臉特征庫的方式進(jìn)行學(xué)習(xí)生成,對(duì)不同環(huán)境下不同表現(xiàn)情況的人臉圖像識(shí)別有更高的精確性。
2.3人臉識(shí)別軟件實(shí)現(xiàn)方式
(1)采集人臉數(shù)據(jù)集,然后對(duì)數(shù)據(jù)集進(jìn)行標(biāo)注,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理變成訓(xùn)練格式。(2)部署訓(xùn)練模型,根據(jù)訓(xùn)練算法所需依賴部署電腦環(huán)境。(3)訓(xùn)練過程,下載預(yù)訓(xùn)練模型,將人臉數(shù)據(jù)集分批次作為輸入開始訓(xùn)練,最終輸出為訓(xùn)練好的模型。(4)部署訓(xùn)練好的模型,捕獲畫面即可對(duì)畫面中的人臉進(jìn)行實(shí)時(shí)檢測(cè)。
3人臉識(shí)別在病毒傳播防控中的應(yīng)用
通過人臉識(shí)別技術(shù),可以實(shí)現(xiàn)無接觸、高效率的對(duì)流動(dòng)人員進(jìn)行信息的收集、身份識(shí)別、定位地址信息等操作,大大減少了傳染的可能性,切斷了病毒傳播途徑,大大提高了工作效率。通過提前收錄人臉信息,采用深度學(xué)習(xí)對(duì)人臉特征模型的訓(xùn)練學(xué)習(xí),即可獲取人臉識(shí)別特征模型,再次驗(yàn)證時(shí)即可實(shí)現(xiàn)人臉識(shí)別和個(gè)人信息快速匹配。AI人工智能幫助人們更好的解放雙手,為人們的生活和工作提供了重要的幫助。本文還提出了在人臉識(shí)別的系統(tǒng)基礎(chǔ)上,可以加入定位系統(tǒng)、測(cè)溫系統(tǒng)等,依托物聯(lián)網(wǎng)技術(shù)和云計(jì)算大數(shù)據(jù),更加優(yōu)化管控系統(tǒng)的效率。病毒傳播防控中人臉識(shí)別系統(tǒng)流程可以概括為圖2。
4結(jié)語
本文研究了一種人臉識(shí)別技術(shù)在病毒傳播管控系統(tǒng)中的應(yīng)用,并分析設(shè)計(jì)了人臉識(shí)別實(shí)時(shí)監(jiān)測(cè)及病毒管控系統(tǒng)的流程,大大提高了信息管理的效率,減弱了傳播風(fēng)險(xiǎn)。作為一門新興技術(shù),目前的人臉識(shí)別技術(shù)還存在著諸多不足之處,像存在環(huán)境光的影響、人臉表情變化、妝容變化、佩戴口罩等都會(huì)影響到系統(tǒng)識(shí)別精度;另外安全問題也引人深思:現(xiàn)今人臉支付方式迅猛發(fā)展,錄入的人臉模型信息數(shù)據(jù)庫存在有一定的安全風(fēng)險(xiǎn),一旦被不法分子盜取信息后果不堪設(shè)想,所以模型數(shù)據(jù)庫安全、網(wǎng)絡(luò)安全,也是系統(tǒng)開發(fā)中必須重視的問題。人臉識(shí)別為代表的人工智能技術(shù)的研究,在病毒傳播管控作出重大貢獻(xiàn),依托我國(guó)領(lǐng)先的計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和5G等技術(shù),加強(qiáng)人工智能技術(shù)與5G通信技術(shù)的結(jié)合,優(yōu)勢(shì)互補(bǔ),以此來加快大數(shù)據(jù)、人工智能和物聯(lián)網(wǎng)技術(shù)發(fā)展進(jìn)程,對(duì)我國(guó)社會(huì)進(jìn)步,促進(jìn)城市建設(shè)和管理朝著高效、秩序、和諧穩(wěn)定的方向不斷發(fā)展,增強(qiáng)我國(guó)的經(jīng)濟(jì)實(shí)力有著重大價(jià)值和研究意義。
參考文獻(xiàn)
[1]王彥秋,馮英偉.基于大數(shù)據(jù)的人臉識(shí)別方法[J].現(xiàn)代電子技術(shù),2021,44(7):87-90.
[2]李剛,高政.人臉自動(dòng)識(shí)別方法綜述[J].計(jì)算機(jī)應(yīng)用研究,2003,20(8):4-9,40.
[3]馬玉琨,徐姚文.ReviewofPresentationAttackDetectioninFaceRecognitionSystem[J].計(jì)算機(jī)科學(xué)與探索,2021,7(15):1195-1206.
[4]余璀璨,李慧斌.基于深度學(xué)習(xí)的人臉識(shí)別方法綜述[J].工程數(shù)學(xué)學(xué)報(bào),2021,38.
[5]王紅星,胡永陽,鄧超.基于LBP和ELM的人臉識(shí)別算法研究與實(shí)現(xiàn)[J].河南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2005.
[6]鐘陳,王思翔,王文峰.面向疫情防控的人臉識(shí)別系統(tǒng)與標(biāo)準(zhǔn)研究[J].信息技術(shù)與標(biāo)準(zhǔn)化,2020,6,11-13,1671-539X.
[6]彭駿,吉綱,張艷紅,占濤.精準(zhǔn)人臉識(shí)別及測(cè)溫技術(shù)在疫情防控中的應(yīng)用[J].軟件導(dǎo)刊,2020,10,1672-7800.
P鍵詞關(guān)鍵詞:視網(wǎng)膜;PCNN;血管分割;MATLAB;GUIDE
DOIDOI:10.11907/rjdk.161883
中圖分類號(hào):TP319
文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2016)008-0068-03
0 引言
眼睛是人體接受外界信息最主要的器官,約75%左右的信息來源于視覺信息。因此,眼睛健康與否對(duì)人的學(xué)習(xí)、生活和工作的影響非常大。而眼底則是這個(gè)器官的重要組成部分,主要包括視網(wǎng)膜、脈絡(luò)膜、黃斑和視盤等。眼底視網(wǎng)膜中的血管是人體內(nèi)唯一可以非創(chuàng)傷的方式直接觀察到的較深層微血管,其顏色、亮度、位置分布、形狀以及曲率等變化可以直接反映出疾病對(duì)血管網(wǎng)絡(luò)形態(tài)結(jié)構(gòu)的影響,是心腦血管疾病對(duì)血管微循環(huán)檢查的重要部位。因此,視網(wǎng)膜圖像中血管網(wǎng)絡(luò)的檢測(cè)與分割對(duì)心腦血管疾病的診斷及治療具有重要意義[1]。
由于該方法計(jì)算公式復(fù)雜,涉及參數(shù)較多,且目前主要使用編寫腳本程序的方式進(jìn)行視網(wǎng)膜眼底圖像中的血管分割,各個(gè)參數(shù)的調(diào)整都要在腳本程序中進(jìn)行,非常復(fù)雜,不便于可視化地觀察實(shí)驗(yàn)結(jié)果變化。因此,設(shè)計(jì)開發(fā)一款界面友好、操作簡(jiǎn)單的視網(wǎng)膜血管分割系統(tǒng)是非常必要的。
MATLAB是一款由Mathworks公司推出的數(shù)學(xué)軟件,它在數(shù)值分析、矩陣運(yùn)算、數(shù)值擬合以及圖形繪制等方面均有極其強(qiáng)大的功能,已被廣泛應(yīng)用于數(shù)字圖像處理、信號(hào)處理和系統(tǒng)仿真等各個(gè)領(lǐng)域。同時(shí),MATLAB 軟件具有界面友好、操作簡(jiǎn)單的圖形可視化界面設(shè)計(jì)工具,其集成圖形用戶界面GUIDE(Graphical User Interface Development Environment)包含了窗口菜單、對(duì)話框、按鈕和文本等各種控件[2]。用戶通過對(duì)控件進(jìn)行布局,編寫控件的回調(diào)函數(shù)即可實(shí)現(xiàn)GUI 與用戶之間的交互,操作十分方便。
本系統(tǒng)在對(duì)視網(wǎng)膜眼底圖像中的血管進(jìn)行預(yù)處理并運(yùn)用脈沖耦合神經(jīng)網(wǎng)絡(luò)(Pulse Coupled Neural Network,PCNN)迭代原理分割的基礎(chǔ)上,利用MATLAB 的圖形用戶界面開發(fā)環(huán)境(GUIDE)實(shí)現(xiàn)了視網(wǎng)膜血管分割系統(tǒng)。該系統(tǒng)為醫(yī)學(xué)圖像研究提供了一種有效的視網(wǎng)膜血管分割方法,也為醫(yī)學(xué)圖像處理提供了一個(gè)操作方便的實(shí)驗(yàn)平臺(tái)。
1 研究方法
首先是對(duì)視網(wǎng)膜眼底圖像中的血管進(jìn)行預(yù)處理,然后利用PCNN方法對(duì)視網(wǎng)膜圖像中的血管進(jìn)行分割。
1.1 視網(wǎng)膜血管圖像預(yù)處理
所處理的視網(wǎng)膜圖像為眼底視網(wǎng)膜RGB彩色圖像,通過將RGB 彩色圖像分解成紅、綠、藍(lán)三通道單色圖像可以發(fā)現(xiàn),綠色通道的視網(wǎng)膜圖像中血管和背景對(duì)比度最高, 而紅、藍(lán)色通道的單色圖像中噪聲較多、對(duì)比度較低, 因此采用綠色通道的視網(wǎng)膜圖像進(jìn)行處理。
由于視網(wǎng)膜眼底圖像是由專門的醫(yī)學(xué)設(shè)備采集的,血管周圍區(qū)域難免會(huì)對(duì)后續(xù)處理產(chǎn)生干擾,因此需要對(duì)視網(wǎng)膜圖像進(jìn)行有效區(qū)域的選取。將RGB圖像進(jìn)行二值化處理,使其歸一化到[0,1]之間,再依次應(yīng)用形態(tài)學(xué)中的開運(yùn)算、閉運(yùn)算和腐蝕操作,生成二值掩膜圖像。
由于血管直徑大小不一、背景干擾以及成像時(shí)光照不均等因素影響,使得血管與背景的對(duì)比度較低。為獲得理想的分割效果,要對(duì)眼底圖像進(jìn)行預(yù)處理,以增強(qiáng)血管和背景的對(duì)比度。本系統(tǒng)主要采用對(duì)比度受限制的自適應(yīng)直方圖均衡化(CLAHE)[3]與二維高斯匹配濾波[4]方法對(duì)視網(wǎng)膜血管進(jìn)行對(duì)比度的增強(qiáng)。
直方圖均衡化(HE)的基本思想是通過圖像的灰度分布直方圖確定一條映射曲線,用來對(duì)圖像進(jìn)行灰度變換,以達(dá)到提高圖像對(duì)比度的目的。然而HE是對(duì)圖像全局進(jìn)行調(diào)整的方法,不能有效提高局部對(duì)比度。為了提高圖像的局部對(duì)比度,有研究者提出自適應(yīng)直方圖均衡化(AHE)方法,將圖像分成若干子塊,對(duì)子塊進(jìn)行HE處理。但是AHE 對(duì)局部對(duì)比度提高過大,將導(dǎo)致圖像失真。為了解決這個(gè)問題,必須對(duì)局部對(duì)比度進(jìn)行限制,這便是CLAHE方法。CLAHE處理后的圖像既能體現(xiàn)不同位置灰度分布之間的差異,又能使全局灰度較為協(xié)調(diào)。
二維高斯匹配濾波的原理主要是根據(jù)血管曲率較小且寬度漸進(jìn)改變這一特點(diǎn),將血管近似分段為等寬度的線段,然后用高斯曲線模擬其橫截面的灰度輪廓。由于血管方向具有任意性,因此需要旋轉(zhuǎn)高斯曲線來匹配不同方向的血管。每30°旋轉(zhuǎn)一次,得到從0°~180°的6個(gè)匹配濾波器,再分別與經(jīng)過CLAHE處理后的圖像進(jìn)行卷積,選擇其中最大的卷積值作為增強(qiáng)圖像的像素值。
最后,將經(jīng)過CLAHE處理之后的圖像減去經(jīng)過CLAHE、二維高斯匹配濾波后的圖像,即可得到最終的預(yù)處理結(jié)果。
1.2 基于PCNN的視網(wǎng)膜血管分割
脈沖耦合神經(jīng)網(wǎng)絡(luò) (PCNN ,Pulse Coupled Neutral Network)[5]是20世紀(jì)90年代形成和發(fā)展的與傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)有著根本不同的新型神經(jīng)網(wǎng)絡(luò),其模型直接來源于高級(jí)哺乳動(dòng)物的視覺神經(jīng)系統(tǒng),具有現(xiàn)實(shí)的生物學(xué)依據(jù),在圖像處理與分析及計(jì)算機(jī)視覺領(lǐng)域中有著廣泛應(yīng)用。它不僅能夠克服微小變化造成的影響,而且能夠較完整地保留圖像的區(qū)域信息。因此,使用PCNN進(jìn)行視網(wǎng)膜血管圖像分割具有一定優(yōu)勢(shì)。
本系統(tǒng)采用PCNN簡(jiǎn)化模型對(duì)視網(wǎng)膜圖像血管自動(dòng)分割,該模型不僅保持了原始模型的重要特性,而且減少了部分參數(shù)。用迭代公式可以描述為:
式中,Sij是外部刺激,即點(diǎn)(i,j)對(duì)應(yīng)像素的灰度值,F(xiàn)ij是神經(jīng)元的輸入項(xiàng),Lij、Uij、Yij、Eij分別是神經(jīng)元的耦合連接輸入、內(nèi)部活動(dòng)項(xiàng)、脈沖輸出和動(dòng)態(tài)閾值。VL為連接輸入域的放大系數(shù),β為神經(jīng)元之間的連接強(qiáng)度系數(shù),VE和αE分別為動(dòng)態(tài)閾值的放大系數(shù)和衰減常數(shù)因子,W為連接加權(quán)系數(shù)矩陣。PCNN應(yīng)用于眼底圖像處理時(shí),其神經(jīng)元數(shù)目與圖像像素?cái)?shù)目一致,各神元與像素一一對(duì)應(yīng),像素的灰度值作為對(duì)應(yīng)神經(jīng)元的輸入Sij。當(dāng)連接加權(quán)系數(shù)矩陣W所在鄰域內(nèi)有相似灰度值像素時(shí),若其中某個(gè)神經(jīng)元點(diǎn)火產(chǎn)生脈沖輸出,會(huì)引起鄰域內(nèi)相近灰度值像素對(duì)應(yīng)的神經(jīng)元點(diǎn)火,產(chǎn)生脈沖序列輸出,這些輸出脈沖序列構(gòu)成的二值圖像Y即為輸出的分割圖像。
2 系統(tǒng)設(shè)計(jì)思路及方法
根據(jù)上述分割過程,將系統(tǒng)設(shè)計(jì)成兩大模塊,分別對(duì)應(yīng)于兩個(gè)界面,主界面為視網(wǎng)膜圖像預(yù)處理模塊,子界面為視網(wǎng)膜血管分割模塊。通過使用MATLAB GUIDE中的控件進(jìn)行布局和編寫相應(yīng)的回調(diào)函數(shù)來實(shí)現(xiàn)各模塊功能。
利用MATLAB GUI實(shí)現(xiàn)視網(wǎng)膜血管分割系統(tǒng)的過程可以分為GUI 圖形界面布局和GUI 程序?qū)崿F(xiàn)兩部分[6]。對(duì)于界面布局,首先要考慮窗口大小、控件位置以及界面所要實(shí)現(xiàn)的功能及各控件需要完成的任務(wù)。完成控件的布局之后,接著應(yīng)對(duì)控件屬性進(jìn)行設(shè)置,通過在相應(yīng)的控件上雙擊鼠標(biāo)左鍵,打開屬性查看器,設(shè)置該控件屬性。最后需要對(duì)各個(gè)控件進(jìn)行回調(diào)函數(shù)的編寫,這是界面設(shè)計(jì)的關(guān)鍵一步,直接影響界面各個(gè)功能的實(shí)現(xiàn)。
3 系統(tǒng)功能實(shí)現(xiàn)
3.1 視網(wǎng)膜圖像預(yù)處理模塊
視網(wǎng)膜圖像預(yù)處理模塊包括選擇圖片、選擇RGB通道、CLAHE增強(qiáng)處理、二維高斯匹配濾波處理以及最終預(yù)處理結(jié)果5個(gè)子模塊,如圖1所示。
具體操作如下:界面初始化后自動(dòng)加載一幅默認(rèn)圖片,也可以由用戶選擇其它圖片;單擊“選擇圖片”按鈕,之后會(huì)彈出一個(gè)對(duì)話框,選擇要載入的圖片,可以看到圖片顯示在界面的左上角,文件名顯示在圖片正下方;然后選擇彩色通道,默認(rèn)為綠色通道,選擇的通道圖像顯示在右邊區(qū)域左上角。如果勾選 “生成掩膜”選項(xiàng),則后面的運(yùn)行結(jié)果均會(huì)顯示出單擊“生成掩膜”之后的圖像,默認(rèn)狀態(tài)為未勾選;接下來需要進(jìn)行CLAHE處理,以增強(qiáng)圖像對(duì)比度。在這里,主要是對(duì)adapthisteq函數(shù)中的參數(shù)進(jìn)行設(shè)置;最后單擊“運(yùn)行”按鈕,結(jié)果顯示在右邊區(qū)域的右上角。在進(jìn)行CLAHE處理之后,需要進(jìn)行二維高斯匹配濾波處理,主要是對(duì)濾波核個(gè)數(shù)、血管半徑及血管段長(zhǎng)度進(jìn)行設(shè)置,以進(jìn)一步增強(qiáng)血管與背景的對(duì)比度;然后單擊“運(yùn)行”按鈕,結(jié)果顯示在右邊區(qū)域的左下角;單擊“最終預(yù)處理結(jié)果”按鈕,結(jié)果顯示在右邊區(qū)域的右下角。
3.2 視網(wǎng)膜血管分割模塊
視網(wǎng)膜血管圖像分割模塊主要是根據(jù)PCNN算法迭代原理,調(diào)節(jié)PCNN各個(gè)參數(shù),對(duì)視網(wǎng)膜血管圖像進(jìn)行分割,如圖2所示。
具體操作如下:?jiǎn)螕糁鹘缑嬷械摹癙CNN分割”按鈕,即可進(jìn)入視網(wǎng)膜血管分割模塊的界面;接著選擇所需PCNN模型和核,并設(shè)置核的半徑大小。若選擇“原始模型”,則需要設(shè)置PCNN的6個(gè)參數(shù),若選擇“改進(jìn)模型”,則只需設(shè)置PCNN的4個(gè)參數(shù);之后設(shè)置迭代次數(shù)和beta的值,單擊“運(yùn)行”按鈕,在彈出的對(duì)話框中,選擇一幅迭代圖片,將自動(dòng)生成分割結(jié)果;對(duì)于分割后的結(jié)果,單擊“保存”按鈕,可以保存圖片;最后單擊“返回”按鈕,可以返回主界面。
4 結(jié)語
基于MATLAB 軟件在圖形繪制、數(shù)值運(yùn)算及可視化界面開發(fā)等方面的優(yōu)勢(shì),在對(duì)視網(wǎng)膜眼底圖像中的血管預(yù)處理并運(yùn)用PCNN算法迭代原理進(jìn)行分割的基礎(chǔ)上,通過MATLAB GUI 設(shè)計(jì)完成了視網(wǎng)膜血管分割系統(tǒng),可以實(shí)現(xiàn)視網(wǎng)膜血管圖像的增強(qiáng)處理,進(jìn)而利用脈沖耦合神經(jīng)網(wǎng)絡(luò)方法對(duì)視網(wǎng)膜血管圖像進(jìn)行分割。本系統(tǒng)提供了一種有效的視網(wǎng)膜血管分割方法,在醫(yī)學(xué)圖像研究方面具有一定參考價(jià)值。同時(shí),系統(tǒng)具有界面友好、操作簡(jiǎn)單等特點(diǎn),為醫(yī)學(xué)圖像處理提供了一個(gè)操作方便的實(shí)驗(yàn)平臺(tái)。
參考文獻(xiàn):
[1] 姚暢,陳后金,李居朋. 基于過渡區(qū)提取的視網(wǎng)膜血管分割方法[J].電子學(xué)報(bào),2008,36(5):974-978.
[2] 姚秀芳,崔松菲. 基于MATLAB GUIDE的程序設(shè)計(jì)[J]. 電腦知識(shí)與技術(shù),2009,27(5):7767-7768.
[3] 陳萌夢(mèng),熊興良,張琰,等. 1種視網(wǎng)膜眼底圖像增強(qiáng)的新方法[J]. 重慶醫(yī)科大學(xué)學(xué)報(bào),2014,39(8):1087-1090.
[4] 姚暢,陳后金. 一種新的視網(wǎng)膜血管網(wǎng)絡(luò)自動(dòng)分割方法[J].光電子?激光,2009,20(2):274-278.
關(guān)鍵詞: 情感分析; 情感傾向性; 詞典擴(kuò)充; 電力客服工單; 主動(dòng)服務(wù)
中圖分類號(hào): TN915.853?34; V249 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)11?0163?04
Dictionary expansion based sentiment tendency analysis of power customer service order
GU Bin, PENG Tao, CHE Wei
(State Grid Jiangsu Electric Power Company, Nanjing 210000, China)
Abstract: In order to improve the customer satisfaction and active service consciousness of the electric power enterprises effectively, the textual characteristic of the power customer service order is combined to construct the sentiment analysis model of the power customer service order. The keywords of the service order are extracted according to TF?IDF thought. The word2vec training is used to get the word vector of each word. The cosine similarity is calculated to expand the high similarity field vocabulary to the sentiment dictionary. The service order sentiment analysis and text classification are performed. The validity of the method is verified with experimental analysis. The results show that, in comparison with the original sentiment dictionary, the method of dictionary expansion and service order sentiment tendency analysis is superior, has higher accuracy, and can provide a certain reference significance for the customer relation management of power enterprise.
Keywords: sentiment analysis; sentiment tendency; dictionary expansion; power customer service order; active service
0 引 言
隨著電力體制改革的逐步深化,配電市場(chǎng)競(jìng)爭(zhēng)不斷加劇,迫切需要供電企業(yè)改變傳統(tǒng)的思維方式和工作模式,進(jìn)一步樹立市場(chǎng)化服務(wù)意識(shí),從客戶需求出發(fā),挖掘客戶的潛在需求和內(nèi)在價(jià)值,從而提升客戶滿意度和運(yùn)營(yíng)效益。作為與客戶交流、溝通的重要窗口,電力企業(yè)95598客服系統(tǒng)記錄了海量的客戶信息,若能徹底挖掘客服工單中的客戶特征、情感信息并了解客戶的關(guān)注焦點(diǎn),對(duì)電力企業(yè)和客戶都將具有十分重要的意義[1]。
電力客服工單情感傾向性分析可以有效地發(fā)掘客戶情感信息和需求,可根據(jù)客戶情感傾向性識(shí)別潛在的投訴客戶,可根據(jù)反饋信息判別某項(xiàng)業(yè)務(wù)的實(shí)施效果等。針對(duì)文本情感傾向性分析,現(xiàn)有的理論研究比較側(cè)重于文本特征提取以及采用機(jī)器學(xué)習(xí)方法對(duì)文本進(jìn)行分類,但是基于具體業(yè)務(wù)特征進(jìn)行情感詞典擴(kuò)充的研究還比較少,導(dǎo)致情感傾向性計(jì)算往往會(huì)存在一定的差異,因此,根據(jù)電力行業(yè)的特c,進(jìn)行客戶服務(wù)工單情感詞典擴(kuò)充及情感傾向性的研究非常有必要。
情感分析是指利用文本挖掘、機(jī)器學(xué)習(xí)技術(shù)分析挖掘隱藏在文本中的情感信息,并將其分類為積極情感態(tài)度和消極情感態(tài)度[2]。目前,國(guó)內(nèi)外關(guān)于文本情感傾向性分析已經(jīng)進(jìn)行了較多的研究工作[3?7],文獻(xiàn)[3]基于情感詞間的點(diǎn)互信息和上下文約束,提出一種兩階段的領(lǐng)域情感詞典構(gòu)建算法,提升了情感詞情感傾向的識(shí)別能力。文獻(xiàn)[4]研究了基于矩陣投影(MP)和歸一化向量(NLV)的文本分類算法,實(shí)現(xiàn)對(duì)商品評(píng)價(jià)的情感分析,不僅可以有效識(shí)別商品評(píng)論情感性傾向,而且提升了識(shí)別效率。文獻(xiàn)[5]將詞級(jí)別向量和字級(jí)別向量作為原始特征,采用卷積神經(jīng)網(wǎng)絡(luò)提取文本特征并進(jìn)行情感傾向性分析,結(jié)果表明字級(jí)別向量可取得較高的準(zhǔn)確率。文獻(xiàn)[6]提出一種詞圖模型的方法,利用PageRank算法得到情感詞的褒貶權(quán)值,并將其作為條件隨機(jī)場(chǎng)模型特征預(yù)測(cè)情感詞傾向,提升了具體語境下預(yù)測(cè)的準(zhǔn)確性,但是針對(duì)文本數(shù)量較大的情況準(zhǔn)確率較低。文獻(xiàn)[7]結(jié)合句子結(jié)構(gòu)上下文語義關(guān)聯(lián)信息,提出一種基于深度神經(jīng)網(wǎng)絡(luò)的跨文本粒度情感分類模型,提升了分類準(zhǔn)確率,但該方法只適應(yīng)于特定領(lǐng)域,泛化能力較低。
鑒于以上研究現(xiàn)狀,本文以電力客戶服務(wù)領(lǐng)域文本特征為突破口,構(gòu)建了電力客服工單情感分析模型,基于工單關(guān)鍵詞提取對(duì)原始的情感詞典進(jìn)行擴(kuò)充,并對(duì)工單情感傾向性進(jìn)行分析,最后,通過算例應(yīng)用驗(yàn)證了本文所提方法的有效性。
1 相關(guān)工作
1.1 情感分類
情感分類技術(shù)的主要目標(biāo)是基于文本數(shù)據(jù)識(shí)別用戶所表達(dá)的情感信息,并將文本數(shù)據(jù)分為正類和負(fù)類。當(dāng)前,針對(duì)情感分類的研究,主要從監(jiān)督學(xué)習(xí)、基于規(guī)則方法、跨領(lǐng)域情感分析等方面展_研究,與此同時(shí),針對(duì)文本特征的提取和特征情感判別是情感分類研究的兩個(gè)關(guān)鍵問題。
1.2 Word2vec介紹
word2vec是Google在2013年開源的一款將詞表征為實(shí)數(shù)值向量(word vector)的高效工具,采用的模型有CBOW(Continuous Bag?of?Words,即連續(xù)的詞袋模型)和Skip?Gram兩種,word2vec采用的是Distributed Representation的詞向量表示方式,經(jīng)過對(duì)輸入集數(shù)據(jù)進(jìn)行訓(xùn)練,可以實(shí)現(xiàn)將文本詞匯轉(zhuǎn)換為維空間向量,然后基于空間向量相似度來表達(dá)文本語義相似度,模型輸出結(jié)果可用于自然語言處理領(lǐng)域相關(guān)工作,比如文本聚類、詞典擴(kuò)充、詞性分析等。
word2vec生成詞向量的基本思想來源于NNLM(Neural Network Language Model)模型,其采用一個(gè)三層神經(jīng)網(wǎng)絡(luò)構(gòu)建語言模型,假設(shè)某個(gè)詞的出現(xiàn)只與前個(gè)詞相關(guān),其原理示意圖如圖1所示。
圖1中,最下方的為前個(gè)輸入詞,并根據(jù)其預(yù)測(cè)下一個(gè)詞每個(gè)輸入詞被映射為一個(gè)向量,為詞語的詞向量。網(wǎng)絡(luò)的第一層(輸入層)為輸入詞語組成的維向量網(wǎng)絡(luò)第二層(隱藏層)計(jì)算為偏置因子,使用激活函數(shù)tanh;網(wǎng)絡(luò)第三層(輸出層)包含個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)表示下一詞的未歸一化log概率,并使用softmax激活函數(shù)將輸出值歸一化,最后使用隨機(jī)梯度下降法對(duì)模型進(jìn)行優(yōu)化。
圖1 NNLM原理模型圖
模型的目標(biāo)函數(shù)為:
需要滿足的約束條件為:
2 電力客服工單情感分析模型
本文以某電力公司客服工單數(shù)據(jù)為研究對(duì)象,在深入理解電力業(yè)務(wù)及工單文本語義特點(diǎn)的基礎(chǔ)上,建立了一種電力客服工單情感分析模型。首先,在進(jìn)行文本預(yù)處理的基礎(chǔ)上,對(duì)文本進(jìn)行分詞處理并且完成關(guān)鍵詞提取;然后,采用word2vec訓(xùn)練工單數(shù)據(jù),并基于關(guān)鍵詞進(jìn)行情感詞典擴(kuò)充,構(gòu)建電力客服領(lǐng)域?qū)S们楦性~典;最后,進(jìn)行工單情感傾向性分析。
2.1 工單文本預(yù)處理
由于工單文本數(shù)據(jù)中存在大量?jī)r(jià)值含量較低甚至沒有價(jià)值意義的數(shù)據(jù),在進(jìn)行分詞、情感分析中會(huì)對(duì)結(jié)果產(chǎn)生較大的影響,那么在文本挖掘之前就必須先進(jìn)行文本預(yù)處理,去除大量沒有挖掘意義的工單數(shù)據(jù)。工單文本預(yù)處理工作主要包括:刪除未標(biāo)注業(yè)務(wù)類型數(shù)據(jù)、分句處理、文本去重、短句刪除等。
分句處理:將工單數(shù)據(jù)處理成以句子為最小單位,以句尾標(biāo)點(diǎn)符號(hào)為標(biāo)志分割,包括“,”,“?!保?;”,“!”等符號(hào)。
文本去重:就是去除工單數(shù)據(jù)中重復(fù)的部分,常用的方法有觀察比較刪除法、編輯距離去重法、Simhash算法去重等。
短句刪除:刪除過短的文本,如“還可以”,“非常好”等,設(shè)置文本字符數(shù)下限為10個(gè)國(guó)際字符。
2.2 電力客戶服務(wù)領(lǐng)域情感詞典構(gòu)建
2.2.1 分詞
本文采用python的jieba分詞工具對(duì)數(shù)據(jù)集進(jìn)行分詞,并完成詞性標(biāo)注和去除停用詞,由于情感分析通常由名詞、形容詞、副詞和連詞等反映出來,因此刪除詞性為動(dòng)詞的詞匯。jieba中文分詞工具包包含三種分詞模式:精確模式、全模式和搜索引擎模式,綜合分詞效果及后文的研究,本文選擇精確模式進(jìn)行分詞,三種模式的分詞效果如表1所示。
另外,在實(shí)際的分詞過程中,出現(xiàn)了個(gè)別分詞結(jié)果與實(shí)際的語義不符,原因是字典中缺少相關(guān)的專有名詞,或者是這些詞語的詞頻較低,比如“客戶/咨詢/抄/表示/數(shù)等/信息”,“客戶/查戶/號(hào)”,“變壓器/重/過載”,“查/分/時(shí)/電價(jià)”等,因此,需要對(duì)原有詞典進(jìn)行更新。python中采用jieba.load_userdict(dict.txt)語句添加自定義詞典,其中dict.txt是保存字典內(nèi)容的文件,其格式為每一行分三部分:一部分為詞語;另一部分為詞頻;最后為詞性(可省略),用空格隔開。
2.2.2 關(guān)鍵詞提取
構(gòu)建電力客戶服務(wù)領(lǐng)域?qū)偾楦性~典,需要盡可能保證領(lǐng)域詞典的多樣性,關(guān)鍵詞的提取要求一方面能夠盡量反應(yīng)出這個(gè)特征項(xiàng)所屬的類別,另一方面能夠把自身屬于的類別與其他類別有效地區(qū)分開來,依據(jù)此原理,本文采用TF?IDF思想進(jìn)行電力客戶服務(wù)領(lǐng)域關(guān)鍵詞的提取,關(guān)鍵詞選取的權(quán)重決定了情感詞典的多樣性,為下文情感詞典的擴(kuò)充做好基礎(chǔ),算法原理如下。
將工單文檔和特征項(xiàng)構(gòu)建成二維矩陣,各條工單的特征向量可表示為:
式中:表示第個(gè)工單中第個(gè)特征中的詞頻。則與為:
式中:表示語料庫中的文件總數(shù);表示包含詞語的文件總數(shù),防止分母為零的情況,通常對(duì)分母做+1的處理。因此,的計(jì)算公式為:
實(shí)際應(yīng)用中,依據(jù)維度的大小確定相應(yīng)的權(quán)重大小,這樣就形成了代表語料特征的關(guān)鍵詞集。
2.2.3 基于word2vec進(jìn)行情感詞典擴(kuò)充
隨著經(jīng)濟(jì)技術(shù)的發(fā)展及客戶文化的差異,不同的客戶通常使用不同的詞匯描述同一個(gè)對(duì)象特征,且電力行業(yè)中存在許多專用詞匯,同樣也表達(dá)了一定情感,但這些詞脫離于現(xiàn)有的情感詞典,因此,有必要對(duì)現(xiàn)有的情感詞典進(jìn)行擴(kuò)充,進(jìn)而提升工單情感傾向性分析的準(zhǔn)確性[8]。選取中國(guó)知網(wǎng)情感詞集和大連理工大學(xué)林鴻飛教授整理和標(biāo)注的中文情感詞匯本體庫作為基礎(chǔ)的情感詞典,然后依據(jù)權(quán)重較大的關(guān)鍵詞對(duì)原有詞典進(jìn)行擴(kuò)充[9]。基于上文電力客戶服務(wù)工單中提取的關(guān)鍵詞,采用word2vec工具對(duì)工單數(shù)據(jù)集進(jìn)行訓(xùn)練,根據(jù)CBOW模型或Skip?Gram模型訓(xùn)練出每個(gè)詞的詞向量,并通過計(jì)算余弦相似度得到文本語義上的相似度,并將相似度較高的詞語加入到情感詞典中。
依據(jù)上文分詞后得到的工單文本數(shù)據(jù),采用Linux Version2.6環(huán)境對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,操作命令如下:
./word2vec ?train data95598.txt ?output vectors_95598data.bin ?cbow 0 ?size 200 ?winodw 5 ?negative 0 ?hs 1 ?sample le?3 threads 12 ?binary 1
其中,data95598.txt為輸入數(shù)據(jù)集;vectors_95598data.bin為模型輸出文件;采用Skip?Gram模型進(jìn)行訓(xùn)練,詞向量維度設(shè)置為200;訓(xùn)練窗口大小設(shè)置為5;-sample表示采樣的閾值,訓(xùn)練結(jié)果采用二進(jìn)制方式存儲(chǔ)。這樣,得到的模型文件中就包含了每個(gè)詞的詞向量。
采用余弦相似度計(jì)算關(guān)鍵詞的相似詞,即基于生成的詞向量計(jì)算兩個(gè)維向量的相似度,因?yàn)閣ord2vec本身就是基于上下文語義生成的詞向量,因此,余弦值越大,表明兩個(gè)詞語的語義越相似。向量與的余弦計(jì)算公式如下:
通過distince命令計(jì)算輸入詞與其他詞的余弦相似度,經(jīng)過排序返回相似詞列表,再經(jīng)過人工篩選,將這些詞加入到原有情感詞典中,實(shí)現(xiàn)對(duì)原有情感詞典的擴(kuò)充。
2.3 工單情感傾向性分析
工單情感傾向性分析是基于構(gòu)建的情感詞典,計(jì)算每個(gè)客服工單的情感分值,從而判斷工單的情感傾向性。通過上文處理,每一個(gè)客服工單都可以被分割成一個(gè)個(gè)子句片段,表示為每個(gè)子句片段由一系列分詞后的詞語構(gòu)成,提取每個(gè)句子的情感詞、否定詞等,表示為依據(jù)情感詞典中給定詞的極性值計(jì)算每個(gè)子句的情感值,分別算每個(gè)句子的正向和負(fù)向情感分值,計(jì)算公式如下:
式中:SenSum表示某個(gè)客服工單的情感分值;表示第個(gè)子句中第個(gè)正向情感詞的極性值;表示第個(gè)子句中第個(gè)負(fù)向情感詞的極性值。
在否定子句中,當(dāng)為偶數(shù)時(shí),否定子句情感為正;當(dāng)為奇數(shù)時(shí),否定子句情感極性為負(fù)。對(duì)所有的子句情感分值求和并求均值,就得到了整個(gè)客服工單的情感值,進(jìn)而判斷客服工單的情感傾向性,若SenSum為正,表示工單情感為正向;否則,工單情感為負(fù)向。
3 實(shí)驗(yàn)分析
3.1 實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備
本文的實(shí)驗(yàn)環(huán)境基于Linux系統(tǒng),采用python語言進(jìn)行算法的實(shí)現(xiàn),抽取某電力公司95598客服工單數(shù)據(jù)作為研究對(duì)象,運(yùn)用jieba包進(jìn)行中文分詞處理,并采用word2vec訓(xùn)練數(shù)據(jù)生成詞向量及擴(kuò)充情感詞典。由于工單數(shù)據(jù)是按照業(yè)務(wù)類型生成的,因此選取業(yè)務(wù)類型為表揚(yáng)的工單作為正類,選取業(yè)務(wù)類型為投訴的作為負(fù)類,其中,正類和負(fù)類數(shù)據(jù)比例為21,共得到20 000條數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)集,隨后進(jìn)行情感傾向性分析,隨機(jī)選擇70%的數(shù)據(jù)作為訓(xùn)練集,30%的數(shù)據(jù)作為測(cè)試集。
3.2 評(píng)價(jià)指標(biāo)
當(dāng)前針對(duì)文本分類效果評(píng)估有許多方法,本文選擇準(zhǔn)確率(precision)、召回率(recall)和值進(jìn)行文本情感分類效果的評(píng)估,準(zhǔn)確率是對(duì)分類精確性的度量,召回率是對(duì)分類完全性的度量,值越大說明分類效果越好,準(zhǔn)確率和召回率是一組互斥指標(biāo),值是將二者結(jié)合的一個(gè)度量指標(biāo),值越大,分類效果越好,并將通過本文情感分析模型得到的結(jié)果與業(yè)務(wù)員標(biāo)注的類型做對(duì)比分析。它們的計(jì)算公式如下:
3.3 實(shí)驗(yàn)結(jié)果及分析
本文基于抽取到的客服工單數(shù)據(jù),結(jié)合設(shè)計(jì)的電力客服工單情感分析模型,實(shí)現(xiàn)對(duì)電力客戶服務(wù)領(lǐng)域情感詞典的擴(kuò)充,并基于構(gòu)建的電力客服領(lǐng)域?qū)僭~典進(jìn)行工單情感傾向性分析,70%的數(shù)據(jù)用于訓(xùn)練word2vec并進(jìn)行情感詞典的擴(kuò)充,30%的數(shù)據(jù)用于測(cè)試工單情感分類的準(zhǔn)確性。測(cè)試集共包含工單數(shù)6 000條,其中正類工單3 895條,負(fù)類工單2 105條。將采用本文情感分析模型得到的結(jié)果與原始基礎(chǔ)情感詞典得到的結(jié)果進(jìn)行對(duì)比分析,見表2。
由表2可知,采用本文構(gòu)建的電力客服工單詞典針對(duì)正向和負(fù)向的情感詞都有較高的準(zhǔn)確率、召回率和值,由此可知,本文設(shè)計(jì)的電力客服工單情感分析模型是合理的,且具有明顯的性能優(yōu)勢(shì)。
4 結(jié) 語
本文設(shè)計(jì)了一種電力客服工單情感分析模型,構(gòu)建了電力客服領(lǐng)域情感專用詞典并進(jìn)行工單情感傾向性分析。采用word2vec工具對(duì)采集到的數(shù)據(jù)進(jìn)行訓(xùn)練,并用測(cè)試集數(shù)據(jù)對(duì)本文提出的模型進(jìn)行驗(yàn)證分析,結(jié)果表明,本文所提方法具有一定的合理性和可行性,可為電力企業(yè)客戶關(guān)系管理提供一定的參考意義,促進(jìn)企業(yè)客戶滿意度及運(yùn)營(yíng)效益的提升。此外,本文主要研究了基于構(gòu)建的電力客服專用情感詞典進(jìn)行客戶情感傾向性分析,但是對(duì)于無監(jiān)督性學(xué)習(xí)方法情感傾向性分析以及情感強(qiáng)度的分析還有待進(jìn)一步研究。
參考文獻(xiàn)
[1] 李勝宇,高俊波,許莉莉.面向酒店評(píng)論的情感分析模型[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2017,26(1):227?231.
[2] SINGH VK, PIRYANI R, UDDIN A, et al. Sentiment analysis of movie reviews: a new feature?based heuristic for aspect?level sentiment classification [C]// Proceedings of 2013 International Multi?Conference on Automation, Computing, Communication, Control and Compressed Sensing (iMac4s). Kottayam: IEEE, 2013: 712?717.
[3] 郗亞輝.產(chǎn)品評(píng)論中領(lǐng)域情感詞典的構(gòu)建[J].中文信息學(xué)報(bào),2016,30(5):136?144.
[4] 鐘將,楊思源,孫啟干.基于文本分類的商品評(píng)價(jià)情感分析[J].計(jì)算機(jī)應(yīng)用,2014,34(8):2317?2321.
[5] 劉龍飛,楊亮,張紹武,等.基于卷積神經(jīng)網(wǎng)絡(luò)的微博情感傾向性分析[J].中文信息學(xué)報(bào),2015,29(6):159?165.
[6] 黃挺,姬東鴻.基于圖模型和多分類器的微博情感傾向性分析[J].計(jì)算機(jī)工程,2015,41(4):171?175.
[7] 劉金碩,張智.一種基于聯(lián)合深度神經(jīng)網(wǎng)絡(luò)的食品安全信息情感分類模型[J].計(jì)算機(jī)科學(xué),2016,43(12):277?280.
關(guān)鍵字:筆記鑒別;紋理;Gabor
中圖分類號(hào):G642
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1672-5913(2008)02-0122-03
1引言
不同的人根據(jù)自身的生理特征和后天的學(xué)習(xí)情況不同,而練就不同的筆跡,正所謂“字如其人”。筆跡正是一種相對(duì)穩(wěn)定的行為特征,因此筆跡可以用來識(shí)別個(gè)體身份。目前在公安、社會(huì)化考試、銀行等領(lǐng)域得到日益廣泛的應(yīng)用,其中一個(gè)典型應(yīng)用就是高等教育自學(xué)考試考生試卷筆跡真?zhèn)舞b定?,F(xiàn)在試卷筆跡鑒定工作是通過考試中心文檢人員手工比對(duì),這種傳統(tǒng)的筆跡鑒別方法,容易引入個(gè)人因素,影響鑒定效果的真實(shí)性。隨著考生人數(shù)的增多,這項(xiàng)比對(duì)工作相當(dāng)耗費(fèi)人力、物力。本文正是基于高自考這樣的背景,來研究基于文本獨(dú)立的離線筆跡鑒別。
目前筆跡鑒別研究方向可以分為在線(on-line)和離線(off-line)兩類。進(jìn)一步細(xì)分,離線筆跡鑒別又可分為:文本依存(Text-dependent)和文本獨(dú)立(Text-independent)
兩種。文本依存就是提前規(guī)定書寫內(nèi)容,文本獨(dú)立則對(duì)書寫內(nèi)容沒有限制。筆跡鑒別的復(fù)雜性在于字跡的變化性,其任務(wù)就是從所有筆跡樣本中提取那些變化最大的特征,然后根據(jù)這些特征對(duì)測(cè)試筆跡樣本進(jìn)行真、偽分類。
另一個(gè)問題是,目前分類方法主要有支持向量機(jī)、多層神經(jīng)網(wǎng)絡(luò)等,由于實(shí)際應(yīng)用中樣本數(shù)較少,以上方法都不適用,因此本文主要針對(duì)訓(xùn)練樣本少的實(shí)際應(yīng)用情況討論文本獨(dú)立型(Text-independent)書寫人識(shí)別。通過用Gabor等紋理分析方法提取文字紋理特征,獲得了較好的識(shí)別效果。
2基于Gabor小波的紋理分析
紋理分析在圖像處理、分析和識(shí)別中廣泛應(yīng)用,是從圖像中提取反映紋理特性的特征。每個(gè)人都有自己的書寫風(fēng)格,從整體筆跡圖像看,它們含有不同的紋理特征,如筆跡的排版規(guī)律(行間、字間排列等)、單個(gè)字符的筆劃搭配關(guān)系都可以看成是一種紋理。從已知的筆跡鑒別方法來看,有不少都采用了紋理分析的思想。將筆跡視為圖像紋理,利用紋理分析的方法提取筆跡紋理特征并進(jìn)行鑒別,是目前研究的熱點(diǎn)。
Gabor函數(shù)由Dennis Gabor于20世紀(jì)40年代提出的,后來被J.Daugman首先用于表征圖像,并用于視覺方面的研究。隨著計(jì)算機(jī)的不斷發(fā)展,成為了非常流行的圖像處理方法,這得益于Gabor函數(shù)特有的屬性及其生物意義。生物學(xué)的研究表明Gabor函數(shù)可以較準(zhǔn)確地描述人腦視覺皮層簡(jiǎn)單細(xì)胞的感受野。如圖1所示。
圖1視覺皮層簡(jiǎn)單細(xì)胞的感受野與二維Gabor函數(shù)的對(duì)比
Gabor函數(shù)是一個(gè)被復(fù)正弦函數(shù)調(diào)制的高斯函數(shù),它是唯一能夠達(dá)到時(shí)頻測(cè)不準(zhǔn)關(guān)系下界的函數(shù),能夠最好地兼顧信號(hào)在時(shí)域和頻域中的分辨能力。其中,一維Gabor函數(shù)如式(1):
其中m用來控制函數(shù)的中心,s為寬度(Gaussian函數(shù)的標(biāo)準(zhǔn)偏差),周期為T,函數(shù)波形如圖2所示。
圖2一維Gabor函數(shù)波形
二維Gabor函數(shù)具有方向選擇性和帶通性,能夠比較精確地提取圖像的局部紋理特征。二維Gabor函數(shù)如式(2)所示:
3Gabor變換以及筆跡特征獲取
本文使用Gabor核函數(shù)對(duì)筆跡紋理圖像進(jìn)行Gabor變換,提取筆跡特征。給定一幅圖像f(x,y),其Gabor變換定義為:
(4)
根據(jù)卷積定理,時(shí)域中卷積相當(dāng)于頻域中乘積,故可借助快速傅立葉變換(FFT)。這是由于快速傅立葉變換算法的計(jì)算效率要比基本的離散傅立葉變換高出幾個(gè)數(shù)量級(jí),由于FFT的高效率,在許多情況下實(shí)現(xiàn)卷積最有效的方法是先計(jì)算參與卷積的序列的離散傅立葉變換,然后將它們的變換相乘,最后計(jì)算這些變換乘積的逆變換??焖俑盗⑷~變換算法有很多種,目前廣為使用的是蝶形算法。對(duì)于本文中,進(jìn)行的是二維傅立葉變換,由于其行列可分性,因此可以先對(duì)列進(jìn)行一維快速傅立葉變換,然后對(duì)行進(jìn)行一維傅立葉變換。特征提取的實(shí)現(xiàn)過程入下:
(1) 先根據(jù)Gabor核函數(shù)的參數(shù),即4個(gè)頻率和8個(gè)相位,依次求出32個(gè)Gabor核函數(shù),并對(duì)其依次進(jìn)行二維快速傅立葉變換,將其結(jié)果保存到數(shù)組;
(2) 對(duì)筆跡紋理圖像塊進(jìn)行二維快速傅立葉變換,將其結(jié)果分別與32個(gè)Gabor核函數(shù)相乘,并且乘上一個(gè)系數(shù);
(3) 對(duì)32個(gè)相乘結(jié)果分別進(jìn)行二維傅立葉逆變換,這樣對(duì)于每一個(gè)Gabor核函數(shù)將對(duì)應(yīng)得到一個(gè)Gabor變換系數(shù),該系數(shù)為復(fù)數(shù),對(duì)于每一個(gè)筆跡樣本就對(duì)應(yīng)得到32個(gè)變換系數(shù);
(4) 針對(duì)每一變換系數(shù),分別求出模值,然后根據(jù)模值求出方差和均值,經(jīng)實(shí)驗(yàn)比較,對(duì)于本文文本依存情況,僅選取32維方差要比選取32維均值或者64維方差和均值的混合特征作為筆跡特征,鑒別率要高,效果要好,因此最終特征選用32維變換系數(shù)模值的方差。
4分類器的構(gòu)建
由于人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等分類器均需要較多樣本進(jìn)行訓(xùn)練,而在實(shí)際應(yīng)用中樣本數(shù)較少。根據(jù)這一事實(shí),并且結(jié)合本文提出的訓(xùn)練方法,本文從樣本距離角度尋求分類器。從相關(guān)文獻(xiàn)中了找了8個(gè)與距離相關(guān)的分類標(biāo)準(zhǔn),目的是通過實(shí)驗(yàn)從中找出適合于本文的分類器。這8個(gè)分類標(biāo)準(zhǔn)依次為歐氏距離、普通距離、相似度、特征距離、Canberra距離、Dice系數(shù)、Jacquard系數(shù)、向量間距離,其數(shù)學(xué)表達(dá)式分別如式4~1所示:
歐氏距離:
以上8個(gè)式子中, 和 分別為特征向量,i=1,2,3,4,5……
實(shí)驗(yàn)時(shí)選取8個(gè)人的樣本,其中5個(gè)人每人1份,另3個(gè)人每人10份樣本,共8個(gè)人35份筆跡樣本,測(cè)試結(jié)果如表1所示,表中A,B,C分別為三個(gè)書寫人,每人10份筆跡樣本,實(shí)驗(yàn)步驟為(以A為例,其它類似):
(1) 以A的第一份樣本為參考樣本,經(jīng)“隨機(jī)訓(xùn)練”為每個(gè)分類器獲取閾值;
(2) 以A的第一份樣本為參考樣本,用獲取到的閾值,與A的其它9個(gè)樣本進(jìn)行比對(duì),給出測(cè)試正確樣本數(shù),對(duì)于每個(gè)分類器分別填入對(duì)應(yīng)表格“本人”處;
(3) 以A的第一份樣本為參考樣本,用獲取到的閾值,與B、C的各5個(gè)樣本進(jìn)行比對(duì),給出測(cè)試正確樣本數(shù),對(duì)于每個(gè)分類器分別填入對(duì)應(yīng)表格“不同人”處;
(4) 分別統(tǒng)計(jì)每個(gè)分類器判別正確的樣本數(shù)。
根據(jù)表中各分類器的分類結(jié)果,并結(jié)合運(yùn)算量,本文最終選定歐氏距離作為分類器。對(duì)于兩個(gè)樣本,其歐氏距離越小,表明兩個(gè)樣本越相似,假設(shè)兩個(gè)樣本之間的歐氏距離為d,分類閾值為g,那么如果d
5結(jié)論
本文研究?jī)?nèi)容是文本獨(dú)立的離線筆跡鑒別,結(jié)合課題背景本文給出一種基于紋理的方法。實(shí)驗(yàn)時(shí),先采集30人共計(jì)108份筆跡樣本,然后對(duì)這些筆跡樣本進(jìn)行預(yù)處理、形成紋理圖,使用32個(gè)Gabor核函數(shù),進(jìn)行Gabor變換,把變換后所得系數(shù)的方差作為最后的筆跡特征,共32維。最后使用歐氏距離作為分類器,采用本文提出的閾值獲取辦法進(jìn)行訓(xùn)練。我們?cè)谧约翰杉墓P跡庫上實(shí)驗(yàn),在對(duì)28人的56份樣本實(shí)驗(yàn)中,對(duì)于與參考樣本出自同一人的筆跡樣本的測(cè)試,共28份,對(duì)于與參考樣本不同人的筆跡樣本,共140份。
從表2可以看出,針對(duì)本文方法,對(duì)于與參考樣本出自同一人的筆跡樣本的測(cè)試,共28份,其中被正確鑒別的份數(shù)為26,正確接受率為92.9% 。對(duì)于與參考樣本不同人的筆跡樣本,共140份,正確鑒別的份數(shù)為126,正確拒絕率為90.0%。達(dá)到了較為理想的效果。
Writer Identification Based on Small Amount of Test Samples and TextureAnalyse
Abstract This paper is presented for identification of examination papers handwriting, A kind of algorithm, which is characterized with less training samples and text-independent, is proposed, and it is used of artificial handwriting identification expert knowledge. Finally, experiments show that the correct acceptances rate is 92.9% and the correct rejections rate is 90.0%.
Keywords:handwriting identification, texture, Gabor filter
參考文獻(xiàn)
[1] 孫廣萍. 身份驗(yàn)證中的簽名鑒別技術(shù)[J]. 黑龍江通信技術(shù),2003,(1):34-35.
[2] 劉宏,李錦濤,崔國(guó)勤. 基于SVM和紋理的筆跡鑒別方法[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2003,15(12):1479-1484.
[3] 許春曄,郭寶蘭. 基于Gabor函數(shù)的漢字字體識(shí)別[J]. 河北大學(xué)學(xué)報(bào)(自然科學(xué)報(bào)),2001,21(2):167-170.
[4] 邊肇祺,張學(xué)工. 模式識(shí)別[M]. 北京:清華大學(xué)出版社,2000.
[5] Andrew R Webb著. 王萍,楊培龍,羅穎昕譯. Statistical Pattern Recognition, 2ED[M]. 北京:電子工業(yè)出版社,2004.
[6] 陶躍華. 基于向量的相似度計(jì)算方案[J]. 云南師范大學(xué)學(xué)報(bào),2001,21(5):17-19.
[7] 易東,陳慶虎. 基于多分類器組合的筆跡驗(yàn)證[J]. 計(jì)算機(jī)應(yīng)用,2006,26(1):172-173.
[8] 劉成林,戴汝為,劉迎建. 簡(jiǎn)化的Winger分布及其在筆跡鑒別中的應(yīng)用[J]. 計(jì)算機(jī)學(xué)報(bào),1997,20(11):1018-1024.