在线观看av毛片亚洲_伊人久久大香线蕉成人综合网_一级片黄色视频播放_日韩免费86av网址_亚洲av理论在线电影网_一区二区国产免费高清在线观看视频_亚洲国产精品久久99人人更爽_精品少妇人妻久久免费

首頁 > 文章中心 > 博弈最優(yōu)策略

博弈最優(yōu)策略

前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇博弈最優(yōu)策略范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。

博弈最優(yōu)策略

博弈最優(yōu)策略范文第1篇

[關(guān)鍵詞]公地悲?。?a href="http://m.bjhyfc.net/haowen/195338.html" target="_blank">博弈論;內(nèi)生規(guī)則

[DOI]1013939/jcnkizgsc201529111

1968年英國哈丁教授(Garrett Hardin)在《The tragedy of the commons》一文中首先提出“公地悲劇”這一概念,它意味著“環(huán)境的退化會發(fā)生在任何時候,只要許多人共同使用一種稀缺資源”。本文把博弈論的概念和思想引入到“公地悲劇”這一現(xiàn)象中,致力于找出化解“公地悲劇”的方法。

1“公地悲劇”的博弈論模型

假設(shè)在由n個牧民共同擁有的草原上,每個牧民都養(yǎng)羊,根據(jù)世代多年放牧的傳統(tǒng),他們都知道這片草原上羊的最優(yōu)的飼養(yǎng)數(shù)量,我們把這一數(shù)量設(shè)為Q1,那么每個牧民的最優(yōu)飼養(yǎng)量為Q1/n。由于草原是公共的,只要有利可圖,牧民養(yǎng)羊的飼養(yǎng)數(shù)量越多越好。假定每個牧民能獲得收益的飼養(yǎng)量不低于Q1/n,這樣,每個牧民羊的飼養(yǎng)數(shù)量有兩個可能,一是超額飼養(yǎng),二是根據(jù)統(tǒng)一的指標限額飼養(yǎng)。

為了使我們的分析更具有一般的普遍性,把草原上的n個牧民簡化為兩個典型性的代表A和B,A和B共同在這片草原上放牧,把羊的飼養(yǎng)量的確定過程看作是A和B相互之間的博弈,那么A和B就有兩個可選擇的策略,即超額或限額。在A、B選擇不同的策略的情況下,A、B會出現(xiàn)收益變化:①A超額、B限額,在市場均衡的情況下,A的飼養(yǎng)里比B的飼養(yǎng)量多,收益也多,A的收益為a,B的收益為b,則a>b;②B超額、A限額,A的收益為b,B的收益為a,同理,有a>b;③A、B都限額,總收益為T,達到社會最優(yōu),A、B共享收益π,每人π/2,由公地放牧?xí)?dǎo)致非帕累托最優(yōu),有π>a+b,④A、B都超額,那么A、B的收益均為τ/2,有τ

2博弈模型分析

首先,假定以上“公地悲劇”博弈模型是在完全信息的情況下進行的,即A、B都知道對方的策略和收益;之后,將A和B的博弈分為同時博弈和序貫博弈兩種情形。下面將對以上兩種情形進行敘述分析。

當(dāng)A和B同時博弈,對A來說,當(dāng)B采取限制飼養(yǎng)數(shù)量的策略時,A的收益a>π/2,A的最優(yōu)選擇是超額;當(dāng)B采取超額飼養(yǎng)策略時,A的收益b>τ/2;由以上分析可知對A不存在占優(yōu)策略,A所采取的策略需要根據(jù)B的策略進行選擇。對B來說,當(dāng)A采取限額策略時,B的收益為a>π/2;當(dāng)A采取超額策略時,B的收益b>τ/2,B的最優(yōu)選擇是限額;同樣,B也不存在占優(yōu)策略,B所采取的策略需要根據(jù)A的策略進行選擇。

由以上分析可知,在同時博弈的情形下,A、B之間有著兩個納什均衡,即(限額;超額)與(超額;限額)。因為同時博弈存在的階段性,納什均衡不具有唯一解,這說明在實際情況下A和B會面臨策略選擇上的困境,在這樣的情形下,為了實現(xiàn)自身利益的最大化,A和B均有可能以一定的概率選擇超額策略或限額策略。那么,我們假定A選擇限額策略的概率是r1,選擇超額策略的概率是1-r1;B選擇限額策略的概率是r2,選擇超額策略的概率是1-r2,那么,A的最優(yōu)化模型為:

VA=r1[[SX(]π[]2[SX)]r2+(1-r2)b]+(1-r1)[ar2+(1-r2)[SX(]τ[]2[SX)]]

求A在概率r1下的收益最大值Max[DD(X]r1[DD)]VA,有:[SX(]π[]2[SX)]r2+b(1-r2)-ar2-[SX(]τ[]2[SX)](1-r2)=0,則,r2=[SX(]b-[SX(]τ[]2[SX)][](a+b)-([SX(]π[]2[SX)]+[SX(]τ[]2[SX)])[SX)]>0

根據(jù)支付矩陣的對稱性,可推出:r1=r2=[SX(]b-[SX(]τ[]2[SX)][](a+b)-([SX(]π[]2[SX)]+[SX(]τ[]2[SX)])[SX)]

綜上可知:r*1=r*2=[SX(]b-[SX(]τ[]2[SX)][](1+b)-([SX(]π[]2[SX)]+[SX(]τ[]2[SX)])[SX)]為混合策略的納什均衡,這一均衡說明了當(dāng)A以概率r*1選擇限額策略時,A進行策略選擇時沒有必要參考B的策略選擇來進行,同樣的,B以概率r*2選擇限額策略時的策略選擇也不需要考慮A的策略選擇。

根據(jù)以上描述可得到以下結(jié)果:A、B選擇限額策略的聯(lián)合概率分布為:P(A=不超額;B=不超額)=r*1×r*2=[SX(](b-[SX(]τ[]2[SX)])2[][(a+b)-([SX(]π[]2[SX)]+[SX(]τ[]2[SX)])]2[SX)];A、B選擇超額飼養(yǎng)策略的概率分布為:P(A=超額;B=超額)=(1-r*1)(1-r*2);A、B選擇相異策略的概率為:r*1(1-r*2)+r*2(1-r*1)=2η*(1-r*2)=2r*2(1-r*1)。A和B中只要有一人選擇了超額飼養(yǎng)策略,草原的飼養(yǎng)量將偏離帕累托最優(yōu),出現(xiàn)“公地悲劇”現(xiàn)象,出現(xiàn)的概率為:P(A=超額;B=超額)+P(A=超額;B=不超額)+P(A=不超額;B=超額)=(1-r*1)(1-r*2)+2η*(1-r*2);根據(jù)概率的相關(guān)知識,“公地悲劇”出現(xiàn)的概率也可表示為1-P(A=不超額;B=不超額)=1-r*1×r*2∈[0,1]。

把A和B兩個牧民決定羊的飼養(yǎng)數(shù)量的決策過程看作是一個博弈,根據(jù)以上計算可知,“公地悲劇”這一現(xiàn)象會以一定的概率出現(xiàn)在博弈的收益中,這樣,從博弈論的視角分析“公地悲劇”就有了可行性。

其次,A、B連續(xù)博弈。當(dāng)A和B兩個牧民中有一個人在某些方面優(yōu)于另一個人即具備先行者的優(yōu)勢時,那么先行者就有觀望和利用先行者優(yōu)勢兩種選擇,這時A、B之間的博弈不再是同時博弈而是連續(xù)博弈。這里假設(shè)在完全信息的情況下,A是先行者,A先行動、B后行動,收益矩陣和同時博弈的時候相同。

對A來說,A知道假如他選擇超額策略,由于b>[SX(]π[]2[SX)],B的最優(yōu)策略為限額策略,那么,A將獲得a的收益,B獲得b;假如A選擇限額策略,那么B一定超額,那么A獲得收益b,B獲得a。當(dāng)A具有先行者優(yōu)勢時,A能夠先行動,并獲得a的收益(a>b),所以無論如何A也會選擇超額策略,這時,博弈的均衡解釋(超額;限額)。這就表示在連續(xù)一次性的博弈過程中,A、B兩個牧民的羊的總的飼養(yǎng)數(shù)量將超過草原上的帕累托最優(yōu)數(shù)量,出現(xiàn)“公地悲劇”。

從上文中的分析可知,理論上,在一次博弈的情形下,不管是同時博弈還是連續(xù)博弈,“公地悲劇”都可能發(fā)生,但在實際情況下,因為養(yǎng)羊這個活動是不間斷連續(xù)進行下去的,那么草原上牧民之間養(yǎng)羊數(shù)量的決策過程就是重復(fù)博弈的過程。一旦存在重復(fù)博弈,牧民之間由于人際關(guān)系、文化等原因會形成一種相互牽制的情況,最終使草原上羊群的飼養(yǎng)數(shù)量限制在符合集體利益最大化的帕累托最優(yōu)數(shù)量上面。

3對策研究

由以上分析可知,A、B因為存在a-[SX(]π[]2[SX)]的超額收益而產(chǎn)生了超額飼養(yǎng)羊的投機心理。A和B都是理性人,都是自私的,都不愿意因為自己限額而損失了額外的收益,更不愿意看到因為雙方都超額而帶來的共同損失。當(dāng)不存在一個實際有效的機制來約束雙方行為時,為了能減少自身的損失,在博弈的過程中,博弈雙方會透露這樣的信息:如果在社會交換的過程中出現(xiàn)了違約者,則拒絕與他合作,而拒絕合作給違約者造成的損失大于他不違約的損失,這樣就形成了一種可信的、有效的威脅。A和B在牧羊博弈的過程當(dāng)中自主地限制羊的數(shù)量,使其形成一個內(nèi)生的規(guī)則。當(dāng)限額策略合理地解決了“公地悲劇”問題時,在接下來的重復(fù)博弈中,人們會將這一行為堅持下去,就成為了一種制度,一種內(nèi)生的制度,“公地悲劇”便得到了解決,不再出現(xiàn)。

4結(jié)論

通過以上分析,當(dāng)牧民們在選擇羊的飼養(yǎng)數(shù)量時,相互之間存在一種相互約束、制約機制,并且這一博弈是重復(fù)進行時,那么,飼養(yǎng)羊數(shù)量的限額將成為一個內(nèi)生的博弈規(guī)則,它不需要借助外界或第三方的力量來保證實施便能自己起到約束雙方行為的作用,因而“公地悲劇”能夠依靠內(nèi)部的約束機制自發(fā)解決。

參考文獻:

博弈最優(yōu)策略范文第2篇

【關(guān)鍵詞】 無線電 博弈論 納什均衡

一、博弈論的概述

1.1概念

博弈論(game theory)是研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題的理論[20]。也就是說,博弈論研究當(dāng)一個主體,譬如說一個人或一個企業(yè)的選擇受到其他人(其他企業(yè))的選擇的影響,而且反過來影響到其他人(其他企業(yè))選擇時的決策問題和均衡問題。所以在這個意義上說,博弈論又稱為“對策論”。博弈論是一種使用嚴謹數(shù)學(xué)模型來解決現(xiàn)實中利害沖突的理論,由于沖突、合作、競爭等行為是現(xiàn)實中常見的現(xiàn)象,因此很多領(lǐng)域都能應(yīng)用博弈論,如軍事領(lǐng)域、經(jīng)濟領(lǐng)域、政治外交等。

1.2博弈論模型簡介

博弈論自產(chǎn)生到發(fā)展至今已形成了較成熟的理論體系,它并不是經(jīng)濟學(xué)的一個分支,它是一種方法,應(yīng)用范圍不僅包括經(jīng)濟學(xué),政治學(xué)、軍事、外交、國際關(guān)系、公共選擇,還有犯罪學(xué)等都涉及到博弈論。不過博弈論也具有自身的基本模型,可以對一個博弈過程用5個方面來描述,G={P,A,O,I,U}

① P(player):博弈的參與方。

② A(action):博弈方可選擇的全部行為或策略的集合

③ O(orders):博弈的次序。

④ I(information):博弈的信息。

⑤ U(utility):博弈方的收益。

以上五個方面是定義一個博弈時必須首先設(shè)定的,確定了上述五個方面就是確定了一個博弈。博弈論就是系統(tǒng)研究用上述方法定義的各種各樣的博弈問題,尋求各博弈方合理選擇策略的情況下博弈的解,也既是均衡。

1.3博弈論的分類

現(xiàn)實中各種博弈可以按照不同的辦法進行分類。根據(jù)參與人的多少,可以將博弈分為兩人博弈和多人博弈;根據(jù)參與人是否合作,可以將博弈分為合作博弈和非合作博弈;根據(jù)博弈結(jié)果的不同,又可以將博弈分為零和博弈、常和博弈和變和博弈。

1.4納什均衡

1.4.1納什均衡的定義

納什均衡(Nash Equilibrium)[20]是一種策略組合,它能夠使得每個參與者的策略都是對其他參與者策略的最優(yōu)反應(yīng)?!白顑?yōu)反應(yīng)”指的是該策略帶給采用它的博弈方的利益或期望利益,大于或至少不小于其它任何策略能帶來的利益。博弈的目的,就是為了尋求這樣的一個最佳的策略組合。

1.5 一些特殊的博弈模型

1.5.1重復(fù)博弈模型

重復(fù)博弈是目前人們了解的最為透徹的一類動態(tài)博弈,參與人每一期都面對同樣的“階段博弈”或“選民博弈”,而且參與人的全部收益是每階段所得收益的加權(quán)平均。參與者基于對博弈過程的認知,例如對過去行為的了解,對未來的預(yù)期和對當(dāng)前情況的觀察,在每一個階段的博弈中選擇自身的策略。這些策略可以是固定的,也可以隨其它參與者行動的改變而變化,甚至可以是自適應(yīng)的。

1.5.2潛在博弈模型

潛在博弈是一般形式博弈中的一種特殊類型,存在函數(shù)u:SR當(dāng)單方面的背離發(fā)生時,u的變化Δu將被反映到單方面背離博弈者的效用上。

二、在無線通信系統(tǒng)資源分配問題中應(yīng)用博弈論的可行性分析

隨著無線通信系統(tǒng)的飛速發(fā)展,許多概念和技術(shù)與現(xiàn)有系統(tǒng)相比都有很大的變化。通信系統(tǒng)將具有智能的資源管理,采用大量動態(tài)的、分布式的、自適應(yīng)式的資源管理方式。

三、基于博弈論的動態(tài)頻譜接入方法

如何利用博弈論方法對認知無線電技術(shù)的研究進行分析,其中的關(guān)鍵是如何將博弈論引入到相應(yīng)算法的設(shè)計和分析中,找到算法的納什均衡點。在開始具體的算法研究之前,需要將所研究的問題抽象成博弈論問題模型。

3.1 分布式自適應(yīng)頻譜接入方法

博弈論模型適用于分析認知無線電系統(tǒng)各用戶競爭頻譜的分布式行為,各用戶根據(jù)自己獲得的信息單獨進行決策。

博弈最優(yōu)策略范文第3篇

[關(guān)鍵詞]合作困境 博弈分析 現(xiàn)實對策

中圖分類號:D125?4 文獻標識碼:A 文章編號:1007-1369(2007)2-0046-05

石油是現(xiàn)代經(jīng)濟的血液,對于經(jīng)濟快速發(fā)展的中國和資源匱乏的日本具有重大的戰(zhàn)略意義。從“安大線”、“安納線”較量到東海海洋權(quán)益爭端,再到現(xiàn)在日趨浮現(xiàn)的在非洲石油輸出國的競爭,石油因素在兩國關(guān)系及其政治話語中已具有重要地位。鑒于中日兩國政治關(guān)系的脆弱性,以及國際能源環(huán)境變化的不確定性和全球化、區(qū)域化下的雙邊、多邊能源合作的快速發(fā)展,加強中日海外石油合作,對于發(fā)展面向21世紀的穩(wěn)定的中日關(guān)系具有重大的現(xiàn)實意義。

本文采用博弈論的分析方法,通過對中日之間在海外石油市場上競爭態(tài)勢的分析,探討中日在海外石油上采取合作策略的制約困境與現(xiàn)實對策。

制約困境的博弈分析

1.博弈理論的一般說明博弈是假定為理者的個人、團體或組織,面對一定的環(huán)境,在一定的約束條件下,依靠所掌握的信息,同時或先后,一次或多次,從各自可能的行為或策略中進行選擇并實施,各自從中取得相應(yīng)結(jié)果或收益的過程。由于它強調(diào)理者之間相互影響的制衡關(guān)系,因此在全球化不斷發(fā)展,國家間聯(lián)系不斷增多的情況下,博弈及其研究理論日益被用來描述、研究國家間日趨復(fù)雜的相互依存關(guān)系。鑒于國際社會天然的無政府狀態(tài)與國家不懈的自助努力,因此在博弈理論中,非合作博弈又成為現(xiàn)代博弈論研究的重點。

按照博弈理論的一般分類,根據(jù)行為者所占有的信息集的完全程度和行為的行動順序,非合作博弈可分為:

其中,完全信息靜態(tài)博弈是其他博弈分析的起點,有著較為嚴格的條件假設(shè)--它要求追求利益最大化的理者掌握完全的信息集(即對博弈策略與利益有清楚的了解),并且在決策時不存在相互間的信息交換,而且一旦決策后就只能等待結(jié)果。因此,對于行為者來說,盡管此類博弈中占有完全的信息集,但是由于決策時信息交流的阻斷,導(dǎo)致行為者無法確定對方是否會采取“背德”行為使自己利益受損,以致為了實現(xiàn)自身利益的最大化而不得不采取自己的“最優(yōu)策略”,所以由此看來,在完全信息靜態(tài)博弈中,主導(dǎo)行為者最優(yōu)決策思維的并非是帕累托最優(yōu),而是風(fēng)險上策均衡。其結(jié)果便是,行為者從自身利益最大化出發(fā),不約而同地采取了“坦白”策略,卻最終得到了“集體利益”最小化的“囚徒困境”。而在目前中日兩國的海外石油競爭中,此種情況卻大量存在。

比如在中日在俄輸油管線的較量中,本來中俄議定的“安大線”全長只有2400公里,造價只有20~25美元(其中俄方17億,可從中方獲得50%的貸款),且所經(jīng)地區(qū)自然環(huán)境優(yōu)越,便與施工養(yǎng)護。假如日本在此問題上合作,共擔(dān)建設(shè)費用和管理成本,共享由此獲得的石油收益,那么兩國各自在投資上必然小于20~25美元。但是,由于日本擔(dān)心中國在俄的輸油管建設(shè)威脅其“太平洋石油管線”“戰(zhàn)略計劃”,所以在“安大線”即將開工之際,日本便提出了從西伯利亞地區(qū)安加爾斯克至海參崴地區(qū)納霍德卡的“安納線”計劃。該線不僅全長3 765公里,造價50億美元(全部由日本承擔(dān),而且日本還需再追加10億美元助俄管道建設(shè)),而且所經(jīng)地區(qū)有1100公里的地震區(qū),施工養(yǎng)護條件惡劣。此后,中日兩國展開了激烈的競爭,其結(jié)果便是俄羅斯改建“泰納線”(從泰舍特至納霍德卡),日本不僅要為此方案提供50億美元貸款,中國亦愿意向該工程陸續(xù)投放120億美元的貸款,而且還讓俄羅斯給中日兩國附加上了“安全保障”。所以與先前的“安大線”相比,可見其代價之巨大。

但是,值得注意的是,完全信息靜態(tài)博弈的理論假設(shè)之一是行為者在決策時不發(fā)生任何的信息交換??蓮默F(xiàn)實來看,中日之間在多邊與雙邊層次上存在著不同程度、不同形式的對話交流,比如在多邊層次上,中日兩國可通過聯(lián)合國、亞太經(jīng)合組織、東盟論壇、東亞峰會等場合進行對話交流;在雙邊層次上,中日之間可借助中日戰(zhàn)略對話和東海問題磋商等會議進行信息交換和對話磋商,所以可以認為,當(dāng)中日兩國的決策者在進行策略選擇時,可以從多種渠道了解對方的策略意圖--從目前來看,實現(xiàn)石油供應(yīng)源的多樣化,穩(wěn)定石油來源等已成為中日兩國各自對對方能源戰(zhàn)略的基本認知,而世界石油的儲量、價格、交易、運輸?shù)刃畔⒏莾蓢寄苷莆盏墓残畔?。所以這不得不令人發(fā)問:中日兩國為何在具備信息交流的情況下,還不能突破困擾兩國的“囚徒困境”?

要回答這問題,完全信息靜態(tài)博弈由于其嚴格的條件限定,已不能擔(dān)此重任,而需借助于條件限定較為放寬的完全信息動態(tài)博弈。在完全信息動態(tài)博弈中,行為者追求利益最大化的本性與掌握完全信息集的要求并未改變,但是允許行為者在做出策略選擇時有先后順序,后行動者可以根據(jù)先行動者的行為信息做出自己的策略選擇,從而實現(xiàn)一定程度的信息交流,因此比較適合用于分析中日兩國在海外石油博弈中所遇到的“囚徒困境”。

實際上,假如采用“大歷史觀”的審視問題視角,從技術(shù)角度看待事物之間的相互聯(lián)系與歷史脈絡(luò),將中日兩國在海外石油上的博弈放人中日兩國“雙重崛起”(即中國的和平發(fā)展與日本謀求政治大國的訴求)的背景下,將中日“雙重崛起”下的國家戰(zhàn)略性博弈與其他次國家層面或超國家層面的各類博弈總計為G,將中日在海外石油市場上的博弈記為g,那么在g與G之間便因石油本身在現(xiàn)代社會政治話語中所具有的戰(zhàn)略性意義,不僅自然聯(lián)系起來,形成一個簡化的次數(shù)為2的“有限次重復(fù)博弈”,而且使石油在g中得益在G中的作用直接體現(xiàn)出來,使構(gòu)建得益函數(shù)UG=UG(ug)成為可能。

在有限次重復(fù)博弈中,在每次重復(fù)博弈之前,以前博弈的結(jié)果各行為者都能觀察到,成為下次博弈中行為者行動的參考依據(jù),所以在有限次重復(fù)博弈中,行為者不能只考慮某個階段的得益,而需顧及前次博弈的得益對后次博弈的影響以及最后的總得益。因此對于中日兩國間由g與G構(gòu)成的有限次重復(fù)博弈,中日雙方不僅要考慮g的得益,還要考慮g的得益對G的影響以及最后的總得益。由于是有限次數(shù)重復(fù),所以可以借助“逆向歸納法”對此作具體的博弈分析。

2.具體的博弈分析

首先,進行條件假設(shè)。由于石油作為一次性能源的不可再生性,其探明儲量與產(chǎn)量在特定時期,技術(shù)發(fā)展既定的情況下是有限的,所以石油資

源人類活動約束已呈現(xiàn)出“存量約束”的形式。所以可假定在只有中日兩國的封閉系統(tǒng)中,海外石油資源存量為X,中國對外石油的依賴度為d,那么中國就需要從外進口石油量為dX,假如中國能實現(xiàn)這一進口量,那么日本獲取海外石油量為(1-d)X。由此根據(jù)基數(shù)效用理論假定出中國在g中的得益為ugl=AdX-BP,日本在g中的得益為ug2=C(1-d)X-DP(其中A、B,C、D分別為中日在g中的得益系數(shù),在一定的技術(shù)條件下A、B,C、D恒定,但是,從現(xiàn)實來看,在一定技術(shù)條件下,日本的技術(shù)水平在常態(tài)分布上高于中國,所以A

其次,用逆向歸納法對上述假設(shè)進行具體分析。由于中日之間政治互信度比較低,在中日之間雙重崛起的背景下,一方面中國政府由于日本對歷史問題的虛無主義態(tài)度,對華關(guān)系的定位(目前日本將中日關(guān)系定性為“協(xié)調(diào)與共存”、“競爭與摩擦”混在的關(guān)系)以及近來日本對周邊的一些舉動等,擔(dān)心日本走向政治大國后的政策走向;另一方面,日本政府面對中國快速的和平發(fā)展和自己過去所經(jīng)歷的“喪失的十年”,心理上難以調(diào)適并擔(dān)心發(fā)展起來的中國危及自身的戰(zhàn)略利益,特別是日本作為目前國際體系的既得利益者,其固有的保守心態(tài)是它尤其擔(dān)心作為后發(fā)國家的中國縮小與它的差距,從而改變現(xiàn)有利益布局,所以在中日兩國的博弈中,日本政府的最優(yōu)策略便是使U1'

求解導(dǎo)數(shù)R∞=U1’,可得U1’=Ad{1+[E(b1)/(1+r1)]}①,同理可得U2'=C(-d){l+[E(b2)/(1+r2)]}②(這里“一”表示中日兩國間的負相關(guān)關(guān)系,比較時取其絕對值),比較①與②,可以發(fā)現(xiàn),由于從2003-2006年間,中國經(jīng)濟的r1一直保持高位運行,分別是10.O%、10.1%、10.4%、10.7%,日本經(jīng)濟的r2則為1.4%、2.6%、0.8%、2.8%,所以1,(1+r1)必然小于1/(1+b)。而在E(h)函數(shù)上,由于日本在2001年的能耗強度為0.91,而同期中國的能耗強度卻為8.45,換句話講,就是同等能耗,日本將有更多的產(chǎn)出,因而也就對生更大的影響,即E(h1)

究其原因,癥結(jié)就在于未能將納什均衡貫徹于動態(tài)博弈的各個階段,實現(xiàn)子博弈精煉納什均衡。按照子博弈精煉納什均衡的條件要求,行為者的最優(yōu)策略必須貫徹于博弈的各個階段,以便在博弈的各個階段實現(xiàn)納什均衡。而在上述分析中,δ與E等系數(shù)借助影響單位X增益而作用于G博弈在日本政府的最優(yōu)策略中得到了體現(xiàn),盡管借此可實現(xiàn)策略選擇在G博弈中的納什均衡,但是卻忽視了最優(yōu)策略在g博弈中的貫徹,因而也就未能在g博弈中實現(xiàn)納什均衡。所以對于日本政府來說,將最優(yōu)策略進一步貫徹于g博弈中以便在g博弈也實現(xiàn)納什均衡,就成為其必然的策略選擇。從上述表達式來看,U1

實際上,日本政府選擇阻擾或干擾中國海外油源拓展的對抗策略,就是這一策略考量的直接體現(xiàn)。因為在貼現(xiàn)系數(shù)存在的情況下,盡管阻擾或干擾中國海外油源的拓展的舉動并不能必然帶給日本單位x的增益,但是由于r1>r2,帶來δ1

自己在既得利益分布中的地位。而對中國來說,情況亦是如此,只能采取“針鋒相對”的策略,不斷拓展自己穩(wěn)定的海外油源(這在客觀上起到了阻擾或干擾日本海外油源拓展的作用),才能保證自己的損失總小于日方。由此可以看出,雙方的對抗策略借助對d的影響將納什均衡貫徹到了博弈中,從而實現(xiàn)了在整個次數(shù)為2的有限性重復(fù)博弈中的子博弈精煉納什均衡。由此也就可以理解為何在海外石油市場上,中日之間不斷出現(xiàn)拓展、干擾、再拓展、再干擾……局面的原因。

最后,經(jīng)過上述分析,基本可以得出如下結(jié)論:

(1)雙方缺乏政治互信,才使得雙方不斷追求相對得益,奉行自我利益占優(yōu)的納什均衡策略。

(2)減弱d的影響,緩解相互制約的負相關(guān)關(guān)系,既是雙方貫徹最優(yōu)策略,在博弈的兩個階段實現(xiàn)納什均衡的著力點,也是雙方實現(xiàn)子博弈精煉納什均衡后的客觀結(jié)果。

(3)油價因素在上述條件下的博弈中并不發(fā)揮主要作用。換言之,高油價并不必然導(dǎo)致合作產(chǎn)生,有時高油價還會導(dǎo)致對穩(wěn)定油源的進一步爭奪。

現(xiàn)實對策:訂立基于互信的政治契約

1.訂立基于互信的政治契約的必要性

基于上述分析,可以看出,中日兩國缺乏政治互信是導(dǎo)致兩國不斷追求相對利益,奉行自我利益占優(yōu)的納什均衡策略的主要原因。按照新現(xiàn)實主義的看法,感到不安全的國家總關(guān)心收益如何分配,它們并不注重參與者兩方是否都收益,而只關(guān)心誰多得益。如果收益分配不均,得益的國家總想要削弱對方以改變自己在利益分配中處于不利地位,即使利益分配的雙方有獲得絕對收益這種愿望,但都害怕對方的實力增強對自己有威脅,所以合作起來就不成功。

因此,要實現(xiàn)中日在海外石油上的合作,就必須首先在雙方之間訂立基于互信的政治契約,消除因?qū)Ψ讲恍湃味a(chǎn)生的不安全感以及由此引發(fā)的對相對收益的追求。而一旦這種政治契約得以訂立,那么按照新制度經(jīng)濟學(xué)的判斷,將促進雙方實現(xiàn)“記憶編碼”,使其參與的博弈轉(zhuǎn)變成“制度支持的完美記憶”(institution-assisted perfectrecall)博弈,從而大大提高信息交換的效率,穩(wěn)定雙方在博弈中的行動策略與心理預(yù)期,進而緩解雙方因?qū)Ψ秸呖赡艹霈F(xiàn)的突變性而產(chǎn)生的不安全感,降低談判中的“討價還價”成本,推動合作進程的快速發(fā)展。

在這一點上,法德和解給與了歷史的佐證。在1963年,法德兩國簽署了《法德友好條約》。其意義不僅在于標志著法德雙方和解的開始,更在于它還是法德之間基于互信訂立的一種政治契約,使得雙方從此可以秉信釋疑,開誠布公地探討地區(qū)合作事宜,攜手推動歐洲一體化的發(fā)展。

2.訂立基于互信的政治契約的著力點

任何政治契約的訂立,都是緣于對利益的關(guān)注,也都以利益為訂立契約的著力點,所以中日之間訂立基于互信的政治契約,也必須以兩國利益為著力點。

根據(jù)上述困境分析,減弱d的影響,緩解相互制約的負相關(guān)關(guān)系是雙方在整個有限性博弈中貫徹最優(yōu)策略,實現(xiàn)各自利益占優(yōu)的著力點:日本政府借此緩解中日之間相互制約的負相關(guān)關(guān)系的策略是對抗,即阻撓或干擾中國海外油源的拓展,導(dǎo)致中國也不得不采取針鋒相對的策略,最終形成了雙方追求各自利益占優(yōu)的子博弈精煉納什均衡。

實際上,在當(dāng)今世界,保證穩(wěn)定的油源,緩解相互制約的負相關(guān)關(guān)系一直有兩條思路:一是直接拓展油源,保證有穩(wěn)定的石油供給,上述中日博弈也就是在這方面展開;二是尋找替代能源,發(fā)展節(jié)能技術(shù)。如果說前者在中日博弈中證明其占優(yōu)策略為對抗的話,那么第二種則要在合作中實現(xiàn)自我利益最優(yōu)。所以只要中日雙方轉(zhuǎn)換思維,加強雙方在替代能源、節(jié)能技術(shù)上的合作,那么就可以規(guī)避在前者中面臨的納什均衡,在合作中實現(xiàn)各自利益的最優(yōu)。因此,中日雙方訂立基于互信的政治契約,其著力點就可以放在尋找替代能源,發(fā)展節(jié)能技術(shù)上。首先在“節(jié)流”上培養(yǎng)雙方的信任度,隨后在一定程度時將此信任度“外溢”至“開源”領(lǐng)域,從而實現(xiàn)雙方“記憶的編碼”,緩解雙方在此領(lǐng)域的擔(dān)心與焦慮,進而達到訂立互信政治契約的目的,最后消除雙方的不安全感,使雙方摒棄對相對收益的追求,在“開源”領(lǐng)域?qū)崿F(xiàn)合作的最優(yōu)收益。

而且從現(xiàn)實來看,此種著力點也有其存在的客觀現(xiàn)實性:

第一,中國有尋找替代能源,發(fā)展節(jié)能技術(shù)的積極愿望。“節(jié)能優(yōu)先”已成為中國可持續(xù)能源戰(zhàn)略的重要組成部分。

第二,日本有著較為發(fā)達的開發(fā)替代能源、發(fā)展節(jié)能技術(shù)的科技水平。比如2005年9月,日本與印度簽署的兩國在能源領(lǐng)域進行綜合性合作的共同聲明,已堪稱能源合作的典范。

博弈最優(yōu)策略范文第4篇

【關(guān)鍵詞】傾銷 反傾銷 博弈分析

一、前言

隨著經(jīng)濟全球化和貿(mào)易自由化的不斷發(fā)展,進口關(guān)稅、配額和出口補貼等貿(mào)易保護手段作為保護本國經(jīng)濟的一種手段,其作用越來越弱。反傾銷作為一種被世界貿(mào)易組織所允許的合法而有效的手段,被越來越多的國家所采用。改革開放以來,中國對外貿(mào)易迅速發(fā)展,但隨之而來的是國外反傾銷調(diào)查的迅速增加。根據(jù)WTO統(tǒng)計,截止至2012年12月,我國所遭受反傾銷調(diào)查數(shù)量為885件,是全球遭受反傾銷調(diào)查最多的國家。世界各國對我國頻繁實施的反傾銷訴訟已經(jīng)嚴重阻礙了我國對外貿(mào)易的健康發(fā)展。

傾銷是指以低于成本的價格將一國商品銷售到另外一國市場的行為。WTO反傾銷協(xié)議規(guī)定,如果一項產(chǎn)品從一國出口到另一國的出口價格低于在出口國國內(nèi)消費的正常貿(mào)易過程中的同類產(chǎn)品的可比價格,則該產(chǎn)品被認為是傾銷產(chǎn)品。反傾銷指進口國當(dāng)局依法向?qū)M口國產(chǎn)業(yè)造成損害的傾銷行為采取征收反傾銷稅等措施,以抵消損害后果的法律行為,這是一種被世界各國普遍認可的限制進口手段。

目前,國外對傾銷與反傾銷的博弈研究既有理論研究,又有實證分析。理論研究主要集中在完全信息條件下雙寡頭靜態(tài)博弈,如Brander、Krugman、Spencer等。Prusa、Tharakan等則對反傾銷進行了實證分析,并從博弈角度論述了反傾銷法作為指導(dǎo)局中雙方博弈的規(guī)則尚有不完善的地方需要修訂。國內(nèi)運用博弈論分析傾銷與反傾銷問題的尚不多見,張維迎和馬捷從產(chǎn)權(quán)角度研究了產(chǎn)權(quán)對傾銷問題的影響,楊仕輝就外國對華反傾銷的逆向選擇作了實證分析,楊仕輝和張娟通過構(gòu)建不完全信息條件下的傾銷與反傾銷動態(tài)博弈模型對反傾銷效應(yīng)進行了理論推導(dǎo)。本文在參考國內(nèi)外文獻的基礎(chǔ)上,運用博弈論為分析工具,建立了傾銷與反傾銷的博弈模型,對傾銷與反傾銷中出現(xiàn)的問題進行分析。

二、傾銷與反傾銷的博弈論分析

(一)傾銷與反傾銷的完全信息博弈分析

假定國外企業(yè)不進行傾銷而國內(nèi)企業(yè)不進行反傾銷訴訟,其效用分別為u1 和u2;國外企業(yè)進行傾銷,傾銷成本為c1,同時國內(nèi)企業(yè)不進行反傾銷時國外企業(yè)進行傾銷的利潤為m;國內(nèi)企業(yè)進行反傾銷,反傾銷成本為c2。通常m>c1,m>c2。博弈矩陣如圖1。

當(dāng)國外企業(yè)傾銷時,如果國內(nèi)企業(yè)進行反傾銷,國內(nèi)企業(yè)的效用為u2-c2;如果國內(nèi)企業(yè)不進行反傾銷,國內(nèi)企業(yè)的效用為u2-m,由于u2-c2>u2-m,國內(nèi)企業(yè)的最優(yōu)策略是進行反傾銷。當(dāng)國外企業(yè)不傾銷時,如果國內(nèi)企業(yè)進行反傾銷,國內(nèi)企業(yè)的效用為u2-c2;如果國內(nèi)企業(yè)不進行反傾銷,國內(nèi)企業(yè)的效用為u2,由于u2-c2

如果一個人采取混合戰(zhàn)略,其對手不能準確地猜出他實際上會選擇的戰(zhàn)略。假定國外企業(yè)進行傾銷的概率為p,不傾銷的概率為1-p;國內(nèi)企業(yè)進行反傾銷的概率為q,不進行反傾銷的概率為1-q。

(二)傾銷與反傾銷的不完全信息博弈分析

假設(shè)進行傾銷與反傾銷博弈的參與人仍是國外企業(yè)和國內(nèi)企業(yè),他們追求利潤最大化。但信息是不完全的,潛在國外企業(yè)決定是否對某國進行傾銷,國內(nèi)企業(yè)并不知道國外企業(yè)的成本函數(shù)。假定國外企業(yè)有兩個可能的類型:低成本或高成本;國外企業(yè)是低成本時,實施低價策略不會導(dǎo)致國內(nèi)企業(yè)反傾銷的成功,而高成本時國外企業(yè)的低價策略會導(dǎo)致國內(nèi)企業(yè)反傾銷的成功。兩種成本情況下的支付矩陣如圖2所示。

國內(nèi)企業(yè)在博弈開始時只知道國外企業(yè)是高成本的概率為p,低成本的概率為1-p。無論國外企業(yè)是低成本還是高成本,出口到某國的選擇都有低價格和高價格。博弈的第一階段,當(dāng)國外企業(yè)選擇低價策略,國內(nèi)企業(yè)的最優(yōu)選擇是反傾銷;當(dāng)國外企業(yè)選擇高價格,國內(nèi)企業(yè)的最優(yōu)選擇是不反傾銷。博弈的第二階段,國內(nèi)企業(yè)是否對國外企業(yè)的價格策略實施反傾銷,依賴于國內(nèi)企業(yè)對國外企業(yè)成本的判斷,如果國外企業(yè)是低成本的時候,國內(nèi)企業(yè)的最優(yōu)選擇是不反傾銷,當(dāng)國外是高成本,選擇低價格的時候,國內(nèi)企業(yè)的最優(yōu)選擇是反傾銷;反之,則不反傾銷。國內(nèi)企業(yè)是否進行反傾銷,依賴于他對國外企業(yè)成本的判斷。高成本國外企業(yè)如果選擇價格a21時,會招致國內(nèi)企業(yè)的反傾銷,因此,高成本企業(yè)可能會選擇價格a11或a12,以避免招致國內(nèi)企業(yè)的反傾銷。在觀測到國外企業(yè)的第一階段的價格選擇后,國內(nèi)企業(yè)會修正對國外企業(yè)的成本函數(shù)的先驗概率p。如果國內(nèi)企業(yè)觀測到國外企業(yè)選擇低價格a21,就可以推斷國外企業(yè)一定是高成本,采取反傾銷就是最優(yōu)選擇。國內(nèi)企業(yè)看到國外企業(yè)選擇低價策略,可以估計國外企業(yè)在低價條件下低成本和高成本的概率, 即P(c1∣p1)和P(c2∣p1)。

假設(shè)p=0.5,低成本條件下選擇低價格策略的概率大于高成本條件下選擇低價格的概率,即a1>a2,可以得出P(c1∣p1)>P(c2∣p1)。如果國內(nèi)企業(yè)作出這樣的估計,就不會對國外企業(yè)進行反傾銷了,反之,則選擇進行反傾銷。如圖3,博弈方國外企業(yè)選擇了低價策略,這個低價策略可能來自兩種不同的成本類型。博弈方國內(nèi)企業(yè)在決策點有兩種選擇,即反傾銷和不反傾銷。如果國外企業(yè)是低成本類型,即沒有傾銷行為,國內(nèi)企業(yè)的最優(yōu)選擇是不反傾銷,因為b11b32。如果國內(nèi)企業(yè)估計A 是高成本類型的,他會選擇進行不反傾銷,但是國內(nèi)企業(yè)估計錯誤,那他會選擇不進行反傾銷,而事實上卻遭受了傾銷,這樣給貿(mào)易雙方都帶來了一定的損失。

三、結(jié)論

近些年,我國在外貿(mào)出口取得巨大成就的同時,面臨嚴重的反傾銷危機,中國企業(yè)在面對反傾銷調(diào)查時,大都采取消極避戰(zhàn)的態(tài)度,助長了國外對華反傾銷的氣焰。從博弈的角度來看,主要是因為我國企業(yè)還沒有積極參與國際市場的博弈過程,不能通過主動介入改變被動局面。要改變這種局面,必須積極參與博弈,并利用可置信威脅改變對方的博弈路徑,以獲取利潤最大化。同時,在企業(yè)選擇價格策略時,要從長遠利益出發(fā),注意進口國對自己價格策略的反應(yīng),盡量不給進口國一個低價傾銷的印象,以免使自己陷入反傾銷的訴訟中。

參考文獻

[1]張維迎,馬捷.惡性競爭的產(chǎn)權(quán)基礎(chǔ)[J].經(jīng)濟研究,1999(06).

[2]楊仕輝.反傾銷博弈與逆向選擇[J].世界經(jīng)濟,2000(01).

[3]楊仕輝,張娟.不完全信息條件下傾銷與反傾銷動態(tài)博弈[J].中國管理科學(xué),2000(03).

博弈最優(yōu)策略范文第5篇

【關(guān)鍵詞】博弈論;非合作博弈;納什均衡;應(yīng)用

文章編號:ISSN1006―656X(2013)12-0043-01

一、博弈論的概述

博弈論(game theory),又稱對策論,是研究決策主體的行為發(fā)生直接相互作用時的決策以及這種決策的均衡問題,也就是一些個人或組織,面對特定的環(huán)境條件,在一定的規(guī)則約束下,同時或先后,一次或多次,從各自的行為或策略中進行選擇并加以實施,各自取得相應(yīng)結(jié)果的過程。

一個完整的博弈一般包含幾個要素:參與者,行動,策略,結(jié)果,均衡等。參與者、行動和結(jié)果統(tǒng)稱為博弈規(guī)則,博弈分析的目的是使用博弈規(guī)則來決定均衡。但是,博弈的行動不等同于博弈的策略,博弈的結(jié)果不等同于博弈的均衡。根據(jù)參與人的數(shù)量,可分為二人博弈和多人博弈;根據(jù)參與人是否合作,可分為合作博弈和非合作博弈;根據(jù)博弈結(jié)果的不同,可分為零和博弈、常和博弈和變和博弈。

博弈論對我們的經(jīng)濟生活有重要意義,人們之間決策行為相互影響的例子有很多:從國家角度出發(fā),在國際貿(mào)易中合理運用博弈論可使本國和其他國家都受益,取得雙贏效果;從個人角度出發(fā),在生活中合理運用博弈論可使自己選擇最優(yōu)策略,減少不必要的成本開支。

二、非合作博弈――納什均衡

非合作博弈是指不允許存在有約束力協(xié)議的博弈。完全信息靜態(tài)博弈屬于非合作博弈,該博弈中,每個博弈方的策略都是針對其他博弈方策略或策略組合的最佳對策,具有這種性質(zhì)的策略組合,正是非合作博弈理論中最重要的一個概念“納什均衡”。

用表示一個博弈,如果有個博弈方,每個博弈方的全部可選策略的集合稱為“策略空間”,用表示;表示博弈方的第個策略,其中可取有限個值(有限策略博弈),也可取無限個值(無限策略博弈);博弈方的得益用表示,是各博弈方策略的多元函數(shù)。個博弈方的博弈常寫成。在博弈中,如果由各個博弈方的每一個策略組成的某個策略組合中,任一博弈方的策略,都是對其余博弈方策略組合的最佳對策,即

,對任意都成立,則稱為的一個“納什均衡”。

納什均衡的求解,常采用得益矩陣法。在囚徒困境中,每個參與者都能猜出對方策略,稱該納什均衡為純策略納什均衡。囚徒困境問題反映了非合作博弈的根本特征,體現(xiàn)了個人理性與集體理性的矛盾。兩寡頭企業(yè)選擇產(chǎn)量的博弈就是囚徒困境問題在經(jīng)濟學(xué)上的應(yīng)用。若兩企業(yè)聯(lián)合形成卡特爾,選擇壟斷利潤最大化的產(chǎn)量,每個企業(yè)都能得到更多利潤。但卡特爾協(xié)定不是納什均衡,給定對方遵守協(xié)議,每個企業(yè)都有增加產(chǎn)量的沖動,最后每個企業(yè)只能得到納什均衡產(chǎn)量的利潤,它嚴格小于卡特爾產(chǎn)量下的利潤。

在某類博弈中,每個理性人都不能猜出對方的策略,參與人是以一定的概率選擇某種策略的,這樣的策略稱為混合策略,相應(yīng)的均衡稱為混合策略納什均衡。純策略是混合策略的特例。相關(guān)的例子有日常生活中的打撲克、劃拳等。

三、治理河流污水排放的制度設(shè)計

環(huán)境保護,人人有責(zé),限制企業(yè)的污水排放符合社會各界的呼聲。檢查和制止排污是政府的職責(zé),對于以利潤最大化為目標的企業(yè),其一直采取各種措施盡可能降低生產(chǎn)成本。政府和企業(yè)間的關(guān)系可用經(jīng)濟學(xué)中的監(jiān)督博弈來解釋。

該博弈的參與者是政府和企業(yè),政府的策略選擇是檢查或不檢查,企業(yè)的策略選擇是排污或不排污。假設(shè)是企業(yè)治理污水(不排污)增加的生產(chǎn)成本,若排污,為自己多得的收益。是政府檢查所需成本。是政府對企業(yè)排污的罰款金額。是企業(yè)排污對社會利益的損害。假設(shè)且,即政府對排污企業(yè)采取重罰措施。對應(yīng)不同策略組合的得益矩陣可見下表。

政府和企業(yè)的得益矩陣

在以上假設(shè)條件下,政府和企業(yè)都猜不出對方會采取何種策略,因而不存在純策略納什均衡,只能求解混合策略納什均衡。如果假定條件不成立,通過劣策略剔除可得到占優(yōu)策略,即(檢查,不排污)或(不檢查,排污)為占優(yōu)均衡。

在得益矩陣中,用表示政府檢查的概率,表示企業(yè)排污的概率。給定,政府檢查和不檢查的期望收益分別為:

由,得。即如果企業(yè)排污概率小于,政府的最優(yōu)選擇是不檢查;如果大于,政府的最優(yōu)選擇是檢查;如果等于,政府隨機地選擇檢查或不檢查。

政府的最終目標是降低企業(yè)排污概率并保護環(huán)境。據(jù)的結(jié)果,有兩種措施:一是增大分母,即采取重罰措施,使企業(yè)平日不敢排污;二是減小分子,即降低檢查成本。現(xiàn)階段可行做法是設(shè)立舉報電話,避免政府盲目檢查,提高辦事效率。

再者,給定,企業(yè)選擇排污和不排污的期望收益分別為:

由得,即如果政府的檢查概率小于,企業(yè)的最優(yōu)選擇是排污。現(xiàn)實中,政府對排污的懲罰越重,企業(yè)因排污獲得的收益越低,企業(yè)的排污概率就越小。反之,企業(yè)的排污概率就越大。

企業(yè)因排污獲得收益的大小,政府難以準確把握。前面談到的企業(yè)都是以利潤最大化為目標的企業(yè),適于民營企業(yè)?,F(xiàn)實中大多排污者是國有企業(yè),這就涉及企業(yè)經(jīng)營的控制權(quán)收益問題。企業(yè)因排污獲得的生產(chǎn)成本降低部分可以很容易轉(zhuǎn)化為企業(yè)經(jīng)營者的控制權(quán)收益,這些收益包括獎金、福利或者因企業(yè)效益上升而帶來的升遷機會。反過來,如果企業(yè)因為排污而受罰,經(jīng)營者并沒有控制權(quán)損失,因為罰款由企業(yè)出,經(jīng)營者只是沒有控制權(quán)收益而已。

四、小結(jié)

本文以納什均衡為理論基礎(chǔ),分析了純策略納什均衡和混合策略納什均衡在經(jīng)濟生活中的應(yīng)用。但本文探討的只是博弈論中一個很小的方面,對均衡問題中的子博弈精煉納什均衡等沒有涉及到,但它們的應(yīng)用也很廣泛。在日常經(jīng)濟生活中,小到購物時的討價還價,大到企業(yè)間的競爭與合作、國家間的傾銷與反傾銷等,都可歸結(jié)為博弈問題。

參考文獻:

台前县| 石渠县| 宁蒗| 呼玛县| 乌什县| 乌兰浩特市| 洪泽县| 洪湖市| 威远县| 宽甸| 南澳县| 嘉禾县| 平昌县| 滦平县| 新和县| 虞城县| 湖南省| 莱阳市| 宜黄县| 密山市| 罗田县| 赤水市| 吉安市| 阜新市| 天峻县| 田东县| 祁门县| 房山区| 杂多县| 常山县| 屯门区| 健康| 濮阳县| 鲜城| 依安县| 庆城县| 洛南县| 察雅县| 垫江县| 林甸县| 平顶山市|