前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇卷積神經(jīng)網(wǎng)絡(luò)情感分析范文,相信會(huì)為您的寫作帶來(lái)幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
關(guān)鍵詞:人工智能 機(jī)器學(xué)習(xí) 機(jī)器人情感獲得 發(fā)展綜述
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-9082 (2017) 04-0234-01
引言
人類自從工業(yè)革命結(jié)束之后,就已然開(kāi)始了對(duì)人工智能的探索,究其本質(zhì),實(shí)際上就是對(duì)人的思維進(jìn)行模仿,以此代替人類工作。人工智能的探索最早可以追溯到圖靈時(shí)期,那時(shí)圖靈就希望未來(lái)的智能系統(tǒng)能夠像人一樣思考。在20世紀(jì)五十年代,人工智能被首次確定為一個(gè)新興的學(xué)科,并吸引了大批的學(xué)者投入到該領(lǐng)域的研究當(dāng)中。經(jīng)過(guò)長(zhǎng)時(shí)間的探索和嘗試,人工智能的許多重要基本理論已經(jīng)形成,如模式識(shí)別、特征表示與推理、機(jī)器學(xué)習(xí)的相關(guān)理論和算法等等。進(jìn)入二十一世紀(jì)以來(lái),隨著深度學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展,人工智能再一次成為研究熱點(diǎn)。人工智能技術(shù)與基因過(guò)程、納米科學(xué)并列為二十一世紀(jì)的三大尖端技術(shù), 并且人工智能涉及的學(xué)科多,社會(huì)應(yīng)用廣泛,對(duì)其原理和本質(zhì)的理解也更為復(fù)雜。 一、人工智能的發(fā)展歷程
回顧人工智能的產(chǎn)生與發(fā)展過(guò)程 ,可以將其分為:初期形成階段,綜合發(fā)展階段和應(yīng)用階段。
1.初期形成階段
人工智能這一思想最早的提出是基于對(duì)人腦神經(jīng)元模型的抽象。其早期工作被認(rèn)為是由美國(guó)的神經(jīng)學(xué)家和控制論學(xué)者 Warren McCulloch與Walter Pitts共同完成的。在1951年,兩名普林斯頓大學(xué)的研究生制造出了第一臺(tái)人工神經(jīng)元計(jì)算機(jī)。而其真正作為一個(gè)新的概念被提出是在1956年舉行的達(dá)茅斯會(huì)議上。由麥卡錫提議并正式采用了“人工智能”(Artificial Intelligence)礱枋穌庖謊芯咳綰斡沒(méi)器來(lái)模擬人類智能的新興學(xué)科。1969年的國(guó)際人工智能聯(lián)合會(huì)議標(biāo)志著人工智能得到了國(guó)際的認(rèn)可。至此,人工智能這一概念初步形成,也逐漸吸引了從事數(shù)學(xué)、生物、計(jì)算機(jī)、神經(jīng)科學(xué)等相關(guān)學(xué)科的學(xué)者參與該領(lǐng)域的研究。
2.綜合發(fā)展階段
1.7 7年, 費(fèi)根鮑姆在第五屆國(guó)際人工智能聯(lián)合會(huì)議上正式提出了“知識(shí)工程”這一概念。而后其對(duì)應(yīng)的專家系統(tǒng)得到發(fā)展,許多智能系統(tǒng)紛紛被推出,并應(yīng)用到了人類生活的方方面面。20世紀(jì)80年代以來(lái),專家系統(tǒng)逐步向多技術(shù)、多方法的綜合集成與多學(xué)科、多領(lǐng)域的綜合應(yīng)用型發(fā)展。大型專家系統(tǒng)開(kāi)發(fā)采用了多種人工智能語(yǔ)言、多種知識(shí)表示方法、多種推理機(jī)制和多種控制策略相結(jié)合的方式, 并開(kāi)始運(yùn)用各種專家系統(tǒng)外殼、專家系統(tǒng)開(kāi)發(fā)工具和專家系統(tǒng)開(kāi)發(fā)環(huán)境等等。在專家系統(tǒng)的發(fā)展過(guò)程中,人工智能得到了較為系統(tǒng)和全面的綜合發(fā)展,并能夠在一些具體的任務(wù)中接近甚至超過(guò)人類專家的水平。
3.應(yīng)用階段
進(jìn)入二十一世紀(jì)以后,由于深度人工神經(jīng)網(wǎng)絡(luò)的提出,并在圖像分類與識(shí)別的任務(wù)上遠(yuǎn)遠(yuǎn)超過(guò)了傳統(tǒng)的方法,人工智能掀起了前所未有的。2006年,由加拿大多倫多大學(xué)的Geoffery Hinton及其學(xué)生在《Science》雜志上發(fā)表文章,其中首次提到了深度學(xué)習(xí)這一思想,實(shí)現(xiàn)對(duì)數(shù)據(jù)的分級(jí)表達(dá),降低了經(jīng)典神經(jīng)網(wǎng)絡(luò)的訓(xùn)練難度。并隨后提出了如深度卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN),以及區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Region-based Convolutional Neural Network, R-CNN),等等新的網(wǎng)絡(luò)訓(xùn)練結(jié)構(gòu),使得訓(xùn)練和測(cè)試的效率得到大幅提升,識(shí)別準(zhǔn)確率也顯著提高。
二、人工智能核心技術(shù)
人工智能由于其涉及的領(lǐng)域較多,內(nèi)容復(fù)雜,因此在不同的應(yīng)用場(chǎng)景涉及到許多核心技術(shù),這其中如專家系統(tǒng)、機(jī)器學(xué)習(xí)、模式識(shí)別、人工神經(jīng)網(wǎng)絡(luò)等是最重要也是發(fā)展較為完善的幾個(gè)核心技術(shù)。
1.專家系統(tǒng)
專家系統(tǒng)是一類具有專門知識(shí)和經(jīng)驗(yàn)的計(jì)算機(jī)智能程序系統(tǒng),通過(guò)對(duì)人類專家的問(wèn)題求解能力建模,采用人工智能中的知識(shí)表示和知識(shí)推理技術(shù)來(lái)模擬通常由專家才能解決的復(fù)雜問(wèn)題,達(dá)到具有與專家同等解決問(wèn)題能力的水平。對(duì)專家系統(tǒng)的研究,是人工智能中開(kāi)展得較為全面、系統(tǒng)且已經(jīng)取得廣泛應(yīng)用的技術(shù)。許多成熟而先進(jìn)的專家系統(tǒng)已經(jīng)被應(yīng)用在如醫(yī)療診斷、地質(zhì)勘測(cè)、文化教育等方面。
2.機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)是一個(gè)讓計(jì)算機(jī)在非精確編程下進(jìn)行活動(dòng)的科學(xué),也就是機(jī)器自己獲取知識(shí)。起初,機(jī)器學(xué)習(xí)被大量應(yīng)用在圖像識(shí)別等學(xué)習(xí)任務(wù)中,后來(lái),機(jī)器學(xué)習(xí)不再限于識(shí)別字符、圖像中的某個(gè)目標(biāo),而是將其應(yīng)用到機(jī)器人、基因數(shù)據(jù)的分析甚至是金融市場(chǎng)的預(yù)測(cè)中。在機(jī)器學(xué)習(xí)的發(fā)展過(guò)程中,先后誕生了如凸優(yōu)化、核方法、支持向量機(jī)、Boosting算法等等一系列經(jīng)典的機(jī)器學(xué)習(xí)方法和理論。機(jī)器學(xué)習(xí)也是人工智能研究中最為重要的核心方向。
3.模式識(shí)別
模式識(shí)別是研究如何使機(jī)器具有感知能力 ,主要研究圖像和語(yǔ)音等的識(shí)別。其經(jīng)典算法包括如k-means,主成分分析(PCA),貝葉斯分類器等等。在日常生活各方面以及軍事上都有廣大的用途。近年來(lái)迅速發(fā)展起來(lái)應(yīng)用模糊數(shù)學(xué)模式、人工神經(jīng)網(wǎng)絡(luò)模式的方法逐漸取代傳統(tǒng)的基于統(tǒng)計(jì)學(xué)習(xí)的識(shí)別方法。圖形識(shí)別方面例如識(shí)別各種印刷體和某些手寫體文字,識(shí)別指紋、癌細(xì)胞等技術(shù)已經(jīng)進(jìn)入實(shí)際應(yīng)用。語(yǔ)音識(shí)別主要研究各種語(yǔ)音信號(hào)的分類,和自然語(yǔ)言理解等等。模式識(shí)別技術(shù)是人工智能的一大應(yīng)用領(lǐng)域,其非常熱門的如人臉識(shí)別、手勢(shì)識(shí)別等等對(duì)人們的生活有著十分直接的影響。
4.人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是在研究人腦的結(jié)構(gòu)中得到啟發(fā), 試圖用大量的處理單元模仿人腦神經(jīng)系統(tǒng)工程結(jié)構(gòu)和工作機(jī)理。而近年來(lái)發(fā)展的深度卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural networks, CNNs)具有更復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),與經(jīng)典的機(jī)器學(xué)習(xí)算法相比在大數(shù)據(jù)的訓(xùn)練下有著更強(qiáng)的特征學(xué)習(xí)和表達(dá)能力。含有多個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)能夠?qū)斎朐紨?shù)據(jù)有更抽象喝更本質(zhì)的表述,從而有利于解決特征可視化以及分類問(wèn)題。另外,通過(guò)實(shí)現(xiàn)“逐層初始化”這一方法,實(shí)現(xiàn)對(duì)輸入數(shù)據(jù)的分級(jí)表達(dá),可以有效降低神經(jīng)網(wǎng)絡(luò)的訓(xùn)練難度。目前的神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別任務(wù)中取得了十分明顯的進(jìn)展,基于CNN的圖像識(shí)別技術(shù)也一直是學(xué)術(shù)界與工業(yè)界一致追捧的熱點(diǎn)。
三、機(jī)器人情感獲得
1.智能C器人現(xiàn)狀
目前智能機(jī)器人的研究還主要基于智能控制技術(shù),通過(guò)預(yù)先定義好的機(jī)器人行動(dòng)規(guī)則,編程實(shí)現(xiàn)復(fù)雜的自動(dòng)控制,完成機(jī)器人的移動(dòng)過(guò)程。而人類進(jìn)行動(dòng)作、行為的學(xué)習(xí)主要是通過(guò)模仿及與環(huán)境的交互。從這個(gè)意義上說(shuō),目前智能機(jī)器人還不具有類腦的多模態(tài)感知及基于感知信息的類腦自主決策能力。在運(yùn)動(dòng)機(jī)制方面,目前幾乎所有的智能機(jī)器人都不具備類人的外周神經(jīng)系統(tǒng),其靈活性和自適應(yīng)性與人類運(yùn)動(dòng)系統(tǒng)還具有較大差距。
2.機(jī)器人情感獲得的可能性
人腦是在與外界永不停息的交互中,在高度發(fā)達(dá)的神經(jīng)系統(tǒng)的處理下獲得情感。智能機(jī)器人在不斷的機(jī)器學(xué)習(xí)和大數(shù)據(jù)處理中,中樞處理系統(tǒng)不斷地自我更新、升級(jí),便具備了獲得情感的可能性及幾率。不斷地更新、升級(jí)的過(guò)程類似于生物的進(jìn)化歷程,也就是說(shuō),智能機(jī)器人有充分的可能性獲得與人類同等豐富的情感世界。
3.機(jī)器人獲得情感的利弊
機(jī)器人獲得情感在理論可行的情況下,伴之而來(lái)的利弊則眾說(shuō)紛紜。一方面,擁有豐富情感世界的機(jī)器人可以帶來(lái)更多人性化的服務(wù),人機(jī)合作也可進(jìn)行地更加深入,可以為人類帶來(lái)更為逼真的體驗(yàn)和享受。人類或可與智能機(jī)器人攜手共創(chuàng)一個(gè)和諧世界。但是另一方面,在機(jī)器人獲得情感時(shí),機(jī)器人是否能徹底貫徹人類命令及協(xié)議的擔(dān)憂也迎面而來(lái)。
4.規(guī)避機(jī)器人情感獲得的風(fēng)險(xiǎn)
規(guī)避智能機(jī)器人獲得情感的風(fēng)險(xiǎn)應(yīng)預(yù)備強(qiáng)制措施。首先要設(shè)計(jì)完備的智能機(jī)器人情感協(xié)議,將威脅泯滅于未然。其次,應(yīng)控制智能機(jī)器人的能源獲得,以限制其自主活動(dòng)的能力,杜絕其建立獨(dú)立體系的可能。最后,要掌控核心武器,必要時(shí)強(qiáng)行停止運(yùn)行、回收、甚至銷毀智能機(jī)器人。
三、總結(jié)
本文梳理了人工智能的發(fā)展歷程與核心技術(shù),可以毋庸置疑地說(shuō),人工智能具有極其廣闊的應(yīng)用前景,但也伴隨著極大的風(fēng)險(xiǎn)?;仡櫰浒l(fā)展歷程,我們有理由充分相信,在未來(lái)人工智能的技術(shù)會(huì)不斷完善,難題會(huì)被攻克。作為世界上最熱門的領(lǐng)域之一,在合理有效規(guī)避其風(fēng)險(xiǎn)的同時(shí),獲得情感的智能機(jī)器人會(huì)造福人類,并極大地幫助人們的社會(huì)生活。
參考文獻(xiàn)
[1]韓曄彤.人工智能技術(shù)發(fā)展及應(yīng)用研究綜述[J].電子制作,2016,(12):95.
[2]曾毅,劉成林,譚鐵牛.類腦智能研究的回顧與展望[J].計(jì)算機(jī)學(xué)報(bào),2016,(01):212-222.
[3]張?jiān)?人工智能綜述:讓機(jī)器像人類一樣思考
關(guān)鍵詞:AlphaGo;人工智能;圍棋;未來(lái)展望
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2017)07-0193-02
1 圍棋與人工智能
圍棋作為中國(guó)傳統(tǒng)四大藝術(shù)之一,擁有著幾千年的悠久歷史。圍棋棋盤由19條橫線和19條豎線組成,共有19*19=361個(gè)交叉點(diǎn),圍棋子分為黑白兩種顏色,對(duì)弈雙方各執(zhí)一色,輪流將一枚棋子下在縱橫交叉點(diǎn)上,終局時(shí),棋子圍上交叉點(diǎn)數(shù)目最多的一方獲勝。圍棋棋盤上每一個(gè)縱橫交叉點(diǎn)都有三種可能性:落黑子、落白子、留空,所以圍棋擁有高達(dá)3^361種局面;圍棋的每個(gè)回合有250種可能,一盤棋可長(zhǎng)達(dá)150回合,所以圍棋的計(jì)算復(fù)雜度為250^150,約為10^170,然而全宇宙可觀測(cè)的原子數(shù)量只有10^80,這足以體現(xiàn)圍棋博弈的復(fù)雜性和多變性。
人工智能(Artificial Intelligence,AI)主要研究人類思維、行動(dòng)中那些尚未算法化的功能行為,使機(jī)器像人的大腦一樣思考、行動(dòng)。長(zhǎng)期以來(lái),圍棋作為一種智力博弈游戲,以其變化莫測(cè)的博弈局面,高度體現(xiàn)了人類的智慧,為人工智能研究提供了一個(gè)很好的測(cè)試平臺(tái),圍棋人工智能也是人工智能領(lǐng)域的一個(gè)重要挑戰(zhàn)。
傳統(tǒng)的計(jì)算機(jī)下棋程序的基本原理,是通過(guò)有限步數(shù)的搜索樹(shù),即采用數(shù)學(xué)和邏輯推理方法,把每一種可能的路徑都走一遍,從中選舉出最優(yōu)路徑,使得棋局勝算最大。這種下棋思路是充分發(fā)揮計(jì)算機(jī)運(yùn)算速度快、運(yùn)算量大等優(yōu)勢(shì)的“暴力搜索法”,是人類在對(duì)弈規(guī)定的時(shí)間限制內(nèi)無(wú)法做到的。但是由于圍棋局面數(shù)量太大,這樣的運(yùn)算量對(duì)于計(jì)算機(jī)來(lái)講也是相當(dāng)之大,目前的計(jì)算機(jī)硬件無(wú)法在對(duì)弈規(guī)定的時(shí)間內(nèi),使用計(jì)算機(jī)占絕對(duì)優(yōu)勢(shì)的“暴力搜索法”完成圍棋所有局面的擇優(yōu),所以這樣的下棋思路不適用于圍棋對(duì)弈。
搜索量巨大的問(wèn)題一直困擾著圍棋人工智能,使其發(fā)展停滯不前,直到2006年, 蒙特卡羅樹(shù)搜索的應(yīng)用出現(xiàn),才使得圍棋人工智能進(jìn)入了嶄新的階段,現(xiàn)代圍棋人工智能的主要算法是基于蒙特卡洛樹(shù)的優(yōu)化搜索。
2 圍棋人工智能基本原理
目前圍棋人工智能最杰出的代表,是由谷歌旗下人工智能公司DeepMind創(chuàng)造的AlphaGo圍棋人工智能系統(tǒng)。它在與人類頂級(jí)圍棋棋手的對(duì)弈中充分發(fā)揮了其搜索和計(jì)算的優(yōu)勢(shì),幾乎在圍棋界立于不敗之地。
AlphaGo系統(tǒng)的基本原理是將深度強(qiáng)化學(xué)習(xí)方法與蒙特卡洛樹(shù)搜索結(jié)合,使用有監(jiān)督學(xué)習(xí)策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò),極大減少了搜索空間,即在搜索過(guò)程中的計(jì)算量,提高了對(duì)棋局估計(jì)的準(zhǔn)確度。
2.1 深度強(qiáng)化學(xué)習(xí)方法
深度學(xué)習(xí)源于人工神經(jīng)網(wǎng)絡(luò)的研究,人類大量的視覺(jué)聽(tīng)覺(jué)信號(hào)的感知處理都是下意識(shí)的,是基于大腦皮層神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法,通過(guò)模擬大腦皮層推斷分析數(shù)據(jù)的復(fù)雜層狀網(wǎng)絡(luò)結(jié)構(gòu),使用包含復(fù)雜結(jié)構(gòu)或由多重非線性變換構(gòu)成的多個(gè)處理層對(duì)數(shù)據(jù)進(jìn)行高層抽象,其過(guò)程類似于人們識(shí)別物體標(biāo)注圖片?,F(xiàn)如今,應(yīng)用最廣泛的深度學(xué)習(xí)模型包括:卷積神經(jīng)網(wǎng)絡(luò)、深度置信網(wǎng)絡(luò)、堆棧自編碼網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)等。
強(qiáng)化學(xué)習(xí)源于動(dòng)物學(xué)習(xí)、參數(shù)擾動(dòng)自適應(yīng)控制等理論,通過(guò)模擬生物對(duì)環(huán)境以試錯(cuò)的方式進(jìn)行交互達(dá)到對(duì)環(huán)境的最優(yōu)適應(yīng)的方式,通過(guò)不斷地反復(fù)試驗(yàn),將變化無(wú)常的動(dòng)態(tài)情況與對(duì)應(yīng)動(dòng)作相匹配。強(qiáng)化學(xué)習(xí)系統(tǒng)設(shè)置狀態(tài)、動(dòng)作、狀態(tài)轉(zhuǎn)移概率和獎(jiǎng)賞四個(gè)部分,在當(dāng)前狀態(tài)下根據(jù)策略選擇動(dòng)作,執(zhí)行該過(guò)程并以當(dāng)前轉(zhuǎn)移概率轉(zhuǎn)移到下一狀態(tài),同時(shí)接收環(huán)境反饋回來(lái)的獎(jiǎng)賞,最終通過(guò)調(diào)整策略來(lái)最大化累積獎(jiǎng)賞。
深度學(xué)習(xí)具有較強(qiáng)的感知能力,但缺乏一定的決策能力;強(qiáng)化學(xué)習(xí)具有決策能力,同樣對(duì)感知問(wèn)題無(wú)能為力。深度強(qiáng)化學(xué)習(xí)方法是將具有感知能力的深度學(xué)習(xí)和具有決策能力的強(qiáng)化學(xué)習(xí)結(jié)合起來(lái),優(yōu)勢(shì)互補(bǔ),用深度學(xué)習(xí)進(jìn)行感知,從環(huán)境中獲取目標(biāo)觀測(cè)信息,提供當(dāng)前環(huán)境下的狀態(tài)信息;然后用強(qiáng)化學(xué)習(xí)進(jìn)行決策,將當(dāng)前狀態(tài)映射到相應(yīng)動(dòng)作,基于初期匯報(bào)評(píng)判動(dòng)作價(jià)值。
深度強(qiáng)化學(xué)習(xí)為復(fù)雜系統(tǒng)的感知決策問(wèn)題提供了一種全新的解決思路。
2.2 蒙特卡洛樹(shù)搜索
蒙特卡洛樹(shù)搜索是將蒙特卡洛方法與樹(shù)搜索相結(jié)合形成的一種搜索方法。所謂蒙特卡洛方法是一種以概率統(tǒng)計(jì)理論為指導(dǎo)的強(qiáng)化學(xué)習(xí)方法,它通常解決某些隨機(jī)事件出現(xiàn)的概率問(wèn)題,或者是某隨機(jī)變量的期望值等數(shù)字特征問(wèn)題。通過(guò)與環(huán)境的交互,從所采集的樣本中學(xué)習(xí),獲得關(guān)于決策過(guò)程的狀態(tài)、動(dòng)作和獎(jiǎng)賞的大量數(shù)據(jù),最后計(jì)算出累積獎(jiǎng)賞的平均值。
蒙特卡洛樹(shù)搜索算法是一種用于解決完美信息博弈(perfect information games,沒(méi)有任何信息被隱藏的游戲)的方法,主要包含選擇(Selection)、擴(kuò)展(Expansion)、模擬(Simulation)和反向傳播(Backpropagation)四個(gè)步驟。
2.3 策略網(wǎng)絡(luò)與價(jià)值網(wǎng)絡(luò)
AlphaGo系統(tǒng)擁有基于蒙特卡洛樹(shù)搜索方法的策略網(wǎng)絡(luò)(Policy Network)和價(jià)值網(wǎng)絡(luò)(Value Network)兩個(gè)不同的神經(jīng)網(wǎng)絡(luò)大腦,充分借鑒人類棋手的下棋模式,用策略網(wǎng)絡(luò)來(lái)模擬人類的“棋感”,用價(jià)值網(wǎng)絡(luò)來(lái)模擬人類對(duì)棋盤盤面的綜合評(píng)估。
AlphaGo系統(tǒng)主要采用有監(jiān)督學(xué)習(xí)策略網(wǎng)絡(luò),通過(guò)觀察棋盤布局,進(jìn)行棋路搜索,得到下一步合法落子行動(dòng)的概率分布,從中找到最優(yōu)的一步落子位置,做落子選擇。DeepMind團(tuán)隊(duì)使用棋圣堂圍棋服務(wù)器上3000萬(wàn)個(gè)專業(yè)棋手對(duì)弈棋譜的落子數(shù)據(jù),來(lái)預(yù)測(cè)棋手的落子情況。期間,系統(tǒng)進(jìn)行上百萬(wàn)次的對(duì)弈嘗試,進(jìn)行強(qiáng)化學(xué)習(xí),將每一個(gè)棋局進(jìn)行到底,不斷積累“經(jīng)驗(yàn)”,學(xué)會(huì)贏面最大的棋路走法,最終達(dá)到頂級(jí)圍棋棋手的落子分析能力。而AlphaGo的價(jià)值網(wǎng)絡(luò)使用百萬(wàn)次對(duì)弈中產(chǎn)生的棋譜,根據(jù)最終的勝負(fù)結(jié)果來(lái)進(jìn)行價(jià)值網(wǎng)絡(luò)訓(xùn)練,預(yù)測(cè)每一次落子選擇后贏棋的可能性,通過(guò)整體局面的判斷來(lái)幫助策略網(wǎng)絡(luò)完成落子選擇。
3 圍棋人工智能意義
經(jīng)過(guò)比賽測(cè)試證明,AlphaGo系統(tǒng)的圍棋對(duì)弈能力已經(jīng)達(dá)到世界頂級(jí)棋手水平。一直以來(lái),圍棋因?yàn)閺?fù)雜的落子選擇和巨大的搜索空間使得圍棋人工智能在人工智能領(lǐng)域成為一個(gè)具有代表性的難度挑戰(zhàn)。目前的硬件水平面對(duì)如此巨大的搜索空間顯得束手無(wú)策,AlphaGo系統(tǒng)基于有監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)大大減少搜索空間,在訓(xùn)練中開(kāi)創(chuàng)性地使用深度強(qiáng)化學(xué)習(xí),然后結(jié)合蒙特卡洛樹(shù)搜索方法,使得系統(tǒng)自學(xué)習(xí)能力大大提高,并且AlphaGo系統(tǒng)在與人類頂級(jí)棋手對(duì)弈中取得的連勝卓越成績(jī),櫧湓諶斯ぶ悄芰煊虻於了堅(jiān)實(shí)的里程碑地位。
雖然圍棋人工智能取得了如此優(yōu)秀的成績(jī),但是也僅僅是它在既定規(guī)則內(nèi)的計(jì)算處理能力遠(yuǎn)遠(yuǎn)超過(guò)了人類的現(xiàn)有水平,并且還有有待提高和完善的地方。在人類的其他能力中,例如情感、思維、溝通等等領(lǐng)域,目前的人工智能水平是遠(yuǎn)遠(yuǎn)達(dá)不到的。但是隨著科技的進(jìn)步和人類在人工智能領(lǐng)域的研究深入,人工智能與人類的差距會(huì)逐漸減小,像圍棋人機(jī)大戰(zhàn)人工智能連勝人類這樣的例子也可能在其他領(lǐng)域發(fā)生,這就意味著人工智能的發(fā)展前景十分可觀。
4 結(jié)語(yǔ)
人類和人工智能共同探索圍棋世界的大幕即將拉開(kāi),讓人類棋手結(jié)合人工智能,邁進(jìn)全新人機(jī)共同學(xué)習(xí)交流的領(lǐng)域,進(jìn)行一次新的圍棋革命,探索圍棋真理更高的境界。
參考文獻(xiàn)