《博弈論與信息經(jīng)濟(jì)學(xué)》課件(全套)_第1頁(yè)
已閱讀1頁(yè),還剩307頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、博弈論與信息經(jīng)濟(jì)學(xué)Game Theory and Economics of Information,,博弈論基本思想,人們?cè)谌粘I钪羞M(jìn)行著博弈,與配偶,朋友,陌生人,老板/員工,教授等。類(lèi)似的博弈也在商業(yè)活動(dòng)、政治和外交事務(wù)、戰(zhàn)爭(zhēng)中進(jìn)行著——在任何一種情況下,人們相互影響以達(dá)成彼此有利的協(xié)議或者解決爭(zhēng)端。博弈論為眾多學(xué)科提供了分析的概念和方法:經(jīng)濟(jì)學(xué)和商學(xué),政治科學(xué),生物學(xué), 心理學(xué)和哲學(xué)。,如何在“博弈”中獲勝?,日常生活中

2、的博弈(“游戲”)往往指的是諸如賭博和運(yùn)動(dòng)這樣的東西: 賭拋硬幣 百米賽跑 打網(wǎng)球/橄欖球How can you win such games?許多博弈都包含著運(yùn)氣、技術(shù)和策略。策略是為了獲勝所需要的一種智力的技巧。它是對(duì)于如何最好地利用身體(物質(zhì))的技巧的一種算計(jì)。,什么是策略博弈?What is a Game of Strategy?,策略思考本質(zhì)上涉及到與他人的相互影響。其他人在同一時(shí)間

3、、對(duì)同一情形也在進(jìn)行類(lèi)似的思考。 博弈論就是用來(lái)分析這樣交互式的決策的。 理性的行為指的是:明白自己的目的和偏好,同時(shí)了解自己行動(dòng)的限制和約束,然后以精心策劃的方式選擇自己的行為,按照自己的標(biāo)準(zhǔn)做到最好。博弈論對(duì)理性的行為又從新的角度賦予其新的含義——與其他同樣具有理性的決策者進(jìn)行相互作用。博弈論是關(guān)于相互作用情況下的理性行為的科學(xué)。,如何在博弈中獲勝?,…… 真的能在博弈中(總是)獲勝嗎?對(duì)手和你一樣聰明! 許多博弈相

4、當(dāng)復(fù)雜,博弈論并不能提供萬(wàn)無(wú)一失的應(yīng)對(duì)辦法。,例1:無(wú)謂競(jìng)爭(zhēng)(The GPA Rat Race),你所注冊(cè)的一門(mén)課程按照比例來(lái)給分:無(wú)論卷面分?jǐn)?shù)是多少,只有40%的人能夠得優(yōu)秀,40%的人能得良好。所有學(xué)生達(dá)成一個(gè)協(xié)議,大家都不要太用功,如何?想法不錯(cuò),但無(wú)法實(shí)施!稍加努力即可勝過(guò)他人,誘惑大矣。問(wèn)題是,大家都這么做。這樣一來(lái),所有人的成績(jī)都不比大家遵守協(xié)議來(lái)得高。而且,大家還付出了更多的功夫。正因?yàn)檫@樣的博弈對(duì)所有參與者存在著或

5、大或小的潛在成本,如何達(dá)成和維護(hù)互利的合作就成為一個(gè)值得探究的重要問(wèn)題。存在雙贏的博弈嗎?,例2:焦點(diǎn)博弈 “We Can’t Take the Exam,Because We Had a Flat Tire”,兩個(gè)學(xué)生想要推遲考試,謊稱(chēng)由于返校途中輪胎漏氣,未能很好地備考。教授分別對(duì)他們提出了問(wèn)題:“哪個(gè)輪胎漏氣?”如何應(yīng)答?他們本應(yīng)該預(yù)計(jì)到教授的招數(shù),提前準(zhǔn)備好答案。在博弈中,參與者應(yīng)該向前看到未來(lái)的行動(dòng),然后通過(guò)向后推理

6、,推算出目前的最佳行動(dòng)。如果雙方都沒(méi)有準(zhǔn)備,他能夠獨(dú)立地編出一個(gè)相互一致的謊言嗎?,例2:焦點(diǎn)博弈 “We Can’t Take the Exam,Because We Had a Flat Tire”,“乘客側(cè)前輪”看起來(lái)是一個(gè)合乎邏輯的選擇。但真正起作用的是你的朋友是否使用同樣的邏輯,或者認(rèn)為這一選擇同樣顯然。并且是否你認(rèn)為這一選擇是否對(duì)他同樣顯然;反之,是否她認(rèn)為這一選擇對(duì)你同樣顯然?!源祟?lèi)推。也就是說(shuō),需要的是對(duì)這樣

7、的情況下該選什么的預(yù)期的收斂。這一使得參與者能夠成功合作的共同預(yù)期的策略被稱(chēng)為焦點(diǎn)。心有靈犀一點(diǎn)通。,例2:焦點(diǎn)博弈 “We Can’t Take the Exam,Because We Had a Flat Tire”,我們無(wú)法從所有這樣的博弈的結(jié)構(gòu)中找到一般和本質(zhì)的東西,來(lái)保證這樣的收斂。某些博弈中,由于偶然的外因可以對(duì)策略貼標(biāo)簽,或者參與者之間擁有某些共同的知識(shí)體驗(yàn),導(dǎo)致了焦點(diǎn)的存在。沒(méi)有某個(gè)這樣的暗示,默契的合作就完全不可

8、能。,例3:為什么教授如此苛刻?,許多教授強(qiáng)硬地規(guī)定,不進(jìn)行補(bǔ)考,不允許遲交作業(yè)或論文。教授們?yōu)楹稳绱丝量蹋咳绻试S某種遲交,而且教授又不能辨別真?zhèn)?,那么學(xué)生就總是會(huì)遲交。期限本身就毫無(wú)意義了。避免這一“滑梯”通常只有一種辦法,就是“沒(méi)有例外”的策略。,例3:為什么教授如此苛刻?,問(wèn)題是,一個(gè)好心腸的教授如何維持如此鐵石心腸的承諾?他必須找到某種使拒絕變得強(qiáng)硬和可信的方法。拿行政程序或者學(xué)校政策來(lái)做擋箭牌在課程開(kāi)始時(shí)做出明

9、確和嚴(yán)格的宣布通過(guò)幾次嚴(yán)打來(lái)獲得“冷面殺手”的聲譽(yù),導(dǎo)論,博弈均衡與一般均衡博弈論與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者博弈論的基本概念與類(lèi)型主要參考文獻(xiàn),導(dǎo)論,一、博弈均衡與一般均衡,案例:囚犯困境,,,支付,嫌疑人B,嫌疑人A,與傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的比較,一致性利益最大化原則均衡原則不一致人與人之間的關(guān)系-個(gè)人理性導(dǎo)致集體非理性-設(shè)計(jì)協(xié)調(diào)性機(jī)制-滿(mǎn)足個(gè)人理性前提下達(dá)到集體理性信息不完全-委托-代理理論、信號(hào)傳遞與信息篩選模型,導(dǎo)論,二

10、、博弈論與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者,1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者,美國(guó)人約翰-海薩尼(John C. Harsanyi) 和美國(guó)人約翰-納什(John F. Nash Jr.)以及德國(guó)人萊因哈德-澤爾騰(Reinhard Selten)  獲獎(jiǎng)理由:在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響 。,約翰·納什1928年生于美國(guó),約翰·海薩尼1920年生于美國(guó),萊因哈

11、德·澤爾騰,1930年生于德國(guó),1996年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者,英國(guó)人詹姆斯·莫里斯 (James A. Mirrlees)和美國(guó)人威廉-維克瑞(William Vickrey) 獲獎(jiǎng)理由:前者在信息經(jīng)濟(jì)學(xué)理論領(lǐng)域做出了重大貢獻(xiàn),尤其是不對(duì)稱(chēng)信息條件下的經(jīng)濟(jì)激勵(lì)理論的論述;后者在信息經(jīng)濟(jì)學(xué)、激勵(lì)理論、博弈論等方面都做出了重大貢獻(xiàn)。,詹姆斯·莫里斯1936年生于英國(guó),威廉·維克瑞,1914-19

12、96,生于美國(guó),2001年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者,三位美國(guó)學(xué)者喬治-阿克爾洛夫(George A. Akerlof)、邁克爾-斯彭斯(A. Michael Spence)和約瑟夫-斯蒂格利茨(Joseph E. Stiglitz) 獲獎(jiǎng)理由:在“對(duì)充滿(mǎn)不對(duì)稱(chēng)信息市場(chǎng)進(jìn)行分析”領(lǐng)域做出了重要貢獻(xiàn)。,2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者,以羅伯特·奧曼色列經(jīng)濟(jì)學(xué)家羅伯特-奧曼(Robert J. Aumann)和美國(guó)經(jīng)濟(jì)學(xué)家托馬斯

13、83;謝林(Thomas C. Schelling) 獲獎(jiǎng)原因:“通過(guò)博弈論分析加強(qiáng)了我們對(duì)沖突和合作的理解”所作出的貢獻(xiàn)而獲獎(jiǎng)。,導(dǎo)論,三、博弈論的基本類(lèi)型,合作博弈與非合作博弈,合作博弈(cooperative game) 達(dá)成有約束力的協(xié)議(binding agreement),強(qiáng)調(diào)團(tuán)體理性,強(qiáng)調(diào)效率、公正、公平非合作博弈(non-cooperative game) 強(qiáng)調(diào)個(gè)人理性,其結(jié)果可能有效率,也可能無(wú)效率。,

14、非合作博弈的基本分類(lèi),靜態(tài)博弈與動(dòng)態(tài)博弈(static games and dynamic games),同時(shí)決策或者同時(shí)行動(dòng)的博弈屬于靜態(tài)博弈;先后或序貫決策或者行動(dòng)的博弈,屬于動(dòng)態(tài)博弈即使決策或行動(dòng)有先后,但只要局中人在決策時(shí)都還不知道對(duì)手的決策或者行動(dòng)是什么,也算是靜態(tài)博弈,完全信息博弈與不完全信息博弈(games of complete information and games of incomplete inform

15、ation),按照大家是否清楚對(duì)局情況下每個(gè)局中人的得益。“各種對(duì)局情況下每個(gè)人的得益是多少” 是所有局中人的共同知識(shí)(common knowledge)。據(jù)“共同知識(shí)”的掌握分為完全信息與不完全信息博弈。,完美信息博弈與不完美信息博弈(games with perfect information and games with imperfect information),是關(guān)于動(dòng)態(tài)博弈進(jìn)行過(guò)程之中面臨決策或者行動(dòng)的參與人對(duì)于博

16、弈進(jìn)行迄今的歷史是否清楚的一種刻劃。如果在博弈進(jìn)行過(guò)程中的每一時(shí)刻,面臨決策或者行動(dòng)的參與人,對(duì)于博弈進(jìn)行到這個(gè)時(shí)刻為止所有參與人曾經(jīng)采取的決策或者行動(dòng)完全清楚,則稱(chēng)為完美信息博弈;否則位不完美信息。,零和博弈與非零和博弈(zero-sum game and non-zero-sum game),如果一個(gè)博弈在所有各種對(duì)局下全體參與人之得益總和總是保持為零,這個(gè)博弈就叫零和博弈;相反,如果一個(gè)博弈在所有各種對(duì)局下全體參與人之得益總

17、和不總是保持為零,這個(gè)博弈就叫非零和博弈。零和博弈是利益對(duì)抗程度最高的博弈。,常和博弈與非常和博弈(constant-sum game and variable-sum game),如果一個(gè)博弈在所有各種對(duì)局下全體參與人之得益總和總是保持為一個(gè)常數(shù),這個(gè)博弈就叫常和博弈;相反,如果一個(gè)博弈在所有各種對(duì)局下全體參與人之得益總和不總是保持為一個(gè)常數(shù),這個(gè)博弈就叫非常和博弈。常和博弈也是利益對(duì)抗程度最高的博弈。非常和(變和)博弈蘊(yùn)含

18、雙贏或多贏。,導(dǎo)論,四、主要參考文獻(xiàn),張維迎著,《博弈論與信息經(jīng)濟(jì)學(xué)》,上海三聯(lián)書(shū)店、上海人民出版社,1996年版。Roger B. Myerson著:Game Theory(原文版、譯文版),中國(guó)經(jīng)濟(jì)出版社,2001年版。王則柯、李杰編著,《博弈論教程》,中國(guó)人民大學(xué)出版社,2004年版。艾里克.拉斯繆森(Eric Rasmusen)著,《博弈與信息:博弈論概論》,北京大學(xué)出版社,2003年版。因內(nèi)思·馬可-斯達(dá)德勒

19、,J.大衛(wèi)·佩雷斯-卡斯特里羅著,《信息經(jīng)濟(jì)學(xué)引論:激勵(lì)與合約》,上海財(cái)經(jīng)大學(xué)出版社,2004年版。施錫銓編著,《博弈論》上海財(cái)大出版社,2000年版。謝識(shí)予編著,《經(jīng)濟(jì)博弈論》,復(fù)旦大學(xué)出版社,2002年版。謝識(shí)予主編,《經(jīng)濟(jì)博弈論習(xí)題指南》,復(fù)旦大學(xué)出版社,2003年版。,課程主要內(nèi)容,第一章 完全信息靜態(tài)博弈第二章 完全信息動(dòng)態(tài)博弈第三章 不完全信息靜態(tài)博弈第四章 不完全信息動(dòng)態(tài)博弈第五章 委托-代理理論

20、第六章 逆向選擇與信號(hào)傳遞,第一章 完全信息靜態(tài)博弈,博弈論的基本概念及戰(zhàn)略式表述納什均衡納什均衡應(yīng)用舉例混合戰(zhàn)略納什均衡納什均衡的存在性與多重性,第一節(jié) 博弈論的基本概念與戰(zhàn)略式表述,博弈論的基本概念與戰(zhàn)略式表述,博弈論(game theory)是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問(wèn)題。博弈的戰(zhàn)略式表述:G={N,(Si)i?N,(Ui)i?N}有三個(gè)基本要素:(1)參與人(players

21、)i?N={1,2,…,n} ;(2)戰(zhàn)略(strategies),si?Si(戰(zhàn)略空間);(3)支付(payoffs),ui=ui(s-i,si)。,案例1:囚犯困境,,,支付,嫌疑人B,嫌疑人A,均衡與均衡結(jié)果,均衡戰(zhàn)略(坦白,坦白)均衡支付(-6,-6),第二節(jié) 納什均衡,占優(yōu)戰(zhàn)略均衡重復(fù)剔除的占優(yōu)戰(zhàn)略均衡納什均衡,完全信息靜態(tài)博弈的幾點(diǎn)特性,同時(shí)出招,出招一次; 知道博弈結(jié)構(gòu)與游戲規(guī)則(共同知識(shí)); 不管是否溝

22、通過(guò),無(wú)法做出有約束力的 承諾(非合作),一、占優(yōu)戰(zhàn)略均衡,占優(yōu)戰(zhàn)略:不管對(duì)手戰(zhàn)略為何,該參與人可找到一最佳戰(zhàn)略。定義:在博弈G={N,(Si)i?N,(Ui)i?N}中,如果對(duì)所有的參與人i,si*是它的占優(yōu)戰(zhàn)略,那么所有參與人選擇的戰(zhàn)略組合(s1*,…,sn*)成為該對(duì)策的占優(yōu)戰(zhàn)略均衡。,案例1:囚犯困境,,,支付,嫌疑人B,嫌疑人A,“囚犯困境” 的擴(kuò)展,兩個(gè)寡頭企業(yè)選擇產(chǎn)量公共產(chǎn)品的供給軍備競(jìng)賽經(jīng)濟(jì)改革 結(jié)論

23、:一種制度安排,要發(fā)生效力。必須是一種納什均衡;否則,制度安排便不能成立。,價(jià)格大戰(zhàn),,,支付,百事可樂(lè),可口可樂(lè),案例2:智豬博弈,豬圈里圈兩頭豬,一頭大豬,一頭小豬。豬圈的一頭有一個(gè)豬食槽,另一頭安裝一個(gè)按鈕,控制著豬食的供應(yīng)。按一下按鈕會(huì)有10個(gè)單位的豬食進(jìn)槽,但誰(shuí)按按鈕誰(shuí)就要付出2個(gè)單位的成本。若大豬先到,大豬吃到9個(gè)單位,小豬只能吃1個(gè)單位;若同時(shí)到,大豬吃7個(gè)單位,小豬吃3個(gè)單位;若小豬先到,大豬吃6個(gè)單位,小豬吃4個(gè)單位。

24、支付如表。,案例2:智豬博弈,,,支付,小豬,大豬,智豬博弈的擴(kuò)展,股份公司承擔(dān)監(jiān)督經(jīng)理職能的大股東與小股東股票市場(chǎng)上炒股票的大戶(hù)與小戶(hù)市場(chǎng)中大企業(yè)與小企業(yè)在研發(fā)、廣告上的博弈公共產(chǎn)品的提供(富戶(hù)與窮戶(hù))改革中不同利益分配對(duì)改革的推動(dòng),二、重復(fù)剔除的占優(yōu)戰(zhàn)略均衡,絕對(duì)劣勢(shì)戰(zhàn)略:si是一絕對(duì)劣勢(shì)戰(zhàn)略當(dāng)且僅當(dāng)存在另一戰(zhàn)略si’?Si使得ui(si,s-i)< ui(si’,s-i) 對(duì)所有s-i?S-i均成立。( si’ 未必

25、是優(yōu)勢(shì)戰(zhàn)略)重復(fù)剔除的占優(yōu)戰(zhàn)略均衡:逐次刪去絕對(duì)劣勢(shì)戰(zhàn)略得到唯一的占優(yōu)戰(zhàn)略。,例:重復(fù)剔除的占優(yōu)戰(zhàn)略均衡,參與人2 L M R,參與人1,U,D,例 重復(fù)剔除的占優(yōu)戰(zhàn)略均衡,參與人2L M R,參與人1,U,D,M,例 重復(fù)剔除的占優(yōu)戰(zhàn)略均衡,參與人2L M

26、 R,參與人1,U,D,M,三、納什均衡,定義:指一戰(zhàn)略組合有以下特性:當(dāng)參與人持此戰(zhàn)略后,任一參與人均無(wú)誘因偏離這一均衡;s*=(s1*,…,sn*)=(si*,s-i*)是一納什均衡,當(dāng)且僅當(dāng)對(duì)所有參與人而言,ui (si*,s-i*)? ui (si’,s-i*)對(duì)所有si’?Si 均成立。簡(jiǎn)單而言,當(dāng)s1*是對(duì)s2*的最適反應(yīng),s2*也是s1*的最適反應(yīng)時(shí),(s1*,s2*)就是二人博弈的

27、納什均衡。命題1:納什均衡在占優(yōu)戰(zhàn)略重復(fù)剔除解法中不會(huì)被剔除命題2:重復(fù)剔除的嚴(yán)格占優(yōu)戰(zhàn)略均衡一定是納什均衡。,例 納什均衡求解,參與人2L M R,參與人1,U,D,M,作業(yè),乙 左 中 右,上中下,甲,一個(gè)兩人同時(shí)博弈的支付競(jìng)爭(zhēng)如下所示,試求納什均衡。是

28、否存在重復(fù)剔除占優(yōu)戰(zhàn)略均衡?,第三節(jié) 納什均衡應(yīng)用舉例,古諾(Cournot)寡頭模型沙灘賣(mài)冰豪泰林(Hotelling)價(jià)格競(jìng)爭(zhēng)模型公共地的悲劇,一、古諾寡頭模型,特點(diǎn):存在兩家廠商;同時(shí)行動(dòng)確定產(chǎn)量。通過(guò)預(yù)測(cè)另一家廠商的產(chǎn)量來(lái)選擇自己的利潤(rùn)最大化產(chǎn)量,尋求預(yù)測(cè)均衡。廠商1表示為:max p(y1+y2e)y1-c(y1),得出y1=f1(y2e),同理得出y2=f2(y1e),稱(chēng)為反應(yīng)函數(shù),兩條曲線的交點(diǎn)為古諾模型的解。,

29、古諾寡頭模型的納什均衡,反應(yīng)函數(shù) y1=f1(y2) y2=f2(y1)(y1*,y2*)是該對(duì)策的納什均衡解。,例題:古諾模型的解,假設(shè)p=a-(y1+y2),C1=y1c,C2=y2c則根據(jù)利潤(rùn)最大化的一階條件分別得到反應(yīng)函數(shù)y1=f1(y2)=(a-y2-c)/2,y2=f2(y1)=(a-y1-c)/2,求出均衡產(chǎn)量為(1/3(a-c),1/3(a-c)),為納什均衡,均衡利潤(rùn)為(1/9(a-c)2

30、,1/9(a-c)2),古諾模型的解:與壟斷市場(chǎng)的比較,假設(shè)為一壟斷企業(yè),則有: Max ?=y(a-y-c), 得到壟斷企業(yè)的最優(yōu)產(chǎn)量 y=1/2(a-c) ? y1+y2=2/3(a-c) 壟斷利潤(rùn)為?=1/4(a-c)2 ? 2/9(a-c)2寡頭競(jìng)爭(zhēng)的總產(chǎn)量大于壟斷產(chǎn)量的原因在于每個(gè)企業(yè)在選擇自己的最優(yōu)產(chǎn)量時(shí),只考慮對(duì)本企業(yè)利潤(rùn)的影響,而忽視對(duì)另一個(gè)企業(yè)的外部負(fù)效應(yīng)。,寡頭廠商與壟斷廠商的比較

31、,,,0 ¼ ½ ¾ 1,,,,,,二、沙灘賣(mài)冰,假設(shè)游客沿沙灘{0,1}間均勻分布,現(xiàn)有兩位賣(mài)冰者,他們會(huì)將攤位選在哪個(gè)位置?假設(shè)游客就近購(gòu)買(mǎi)。,生活中還有哪些類(lèi)似的例子?,三、豪泰林模型,寡頭企業(yè)競(jìng)爭(zhēng)戰(zhàn)略是價(jià)格伯川德(Bertrand)模型:產(chǎn)品同質(zhì),均衡價(jià)格等于邊際成本,類(lèi)似于完全競(jìng)爭(zhēng)市場(chǎng)均衡。豪泰林(Hotelling)模型:

32、存在產(chǎn)品差異,均衡價(jià)格不等于邊際成本,壟斷性提高,,假定長(zhǎng)度為1的線性城市,消費(fèi)者均勻分布在[0,1]區(qū)間內(nèi),分布密度為1;兩個(gè)商店1、2分別位于x=0,x=1,即城市的兩端;消費(fèi)者購(gòu)買(mǎi)商品的旅行成本與商店的距離成反比,單位距離的成本為t;住在x的消費(fèi)者在兩個(gè)商店之間是無(wú)差異的,需求D1=x,D2=1-x,x滿(mǎn)足:p1+tx=p2+t(1-x),解得x=(p2-p1+t)/2t。,豪泰林模型:以空間上差異為例,豪泰林模型:以空間上差異為

33、例,根據(jù)兩個(gè)商店的利潤(rùn)函數(shù),?1=(p1-c)x, ?2=(p2-c)(1-x)選擇使利潤(rùn)最大化的價(jià)格,得到一階條件,求得p1*=p2*=c+t,均衡利潤(rùn)?1=?2=t/2旅行成本越高,產(chǎn)品差異越大,均衡價(jià)格從而均衡利潤(rùn)也越高。原因:隨著旅行成本上升,不同商店出售的產(chǎn)品之間的替代性下降,每個(gè)商店對(duì)附近的消費(fèi)者的壟斷能力加強(qiáng),當(dāng)旅行成本為零時(shí),不同商店的產(chǎn)品之間具有完全的替代性,則為伯川德均衡結(jié)果。,四、公共地的悲劇,生物學(xué)家和生態(tài)

34、學(xué)家哈?。℅arrett Harden)在《科學(xué)》(1968年,第162卷)發(fā)表《公地的悲劇》??紤]一塊對(duì)所有的人都開(kāi)放的牧場(chǎng),在著的制度下,可以預(yù)期,每一個(gè)放牧的人都會(huì)在公地上放牧盡可能多的牲口。增加一頭牲口既有正效用,也有負(fù)效用。正效用是牲口的銷(xiāo)售收入,增加一頭為+1負(fù)效用使每增加一頭帶來(lái)的過(guò)度放牧的損失,每一個(gè)放牧著承擔(dān)-1/n放牧者合理的決策是增加牲口,直至馬瘦毛長(zhǎng),公地毀滅。,四、公共地的悲劇,資源沒(méi)有排他性產(chǎn)權(quán):草

35、地放牧、公海捕魚(yú)、小煤窯的過(guò)度開(kāi)發(fā);另一類(lèi)是人們向其中排放廢物的公地。草地放牧:n個(gè)農(nóng)民,每個(gè)擁有羊的數(shù)量為gi,G=?gi,v(G)代表每只羊的價(jià)值,與草地上放牧的總數(shù)G相關(guān),飼養(yǎng)量增加到一定程度,隨著數(shù)量繼續(xù)增加,羊的價(jià)值會(huì)下降,即v’(G)<0農(nóng)民的利潤(rùn)函數(shù)?i=giv(?gj)-gic最優(yōu)化的一階條件:??i/?gi=v(G)+giv’(G)-c=0增加一只羊有正效應(yīng)(羊的價(jià)值)、負(fù)效應(yīng)(新增羊使之前所有羊的價(jià)值下

36、降)個(gè)人邊際成本小于社會(huì)邊際成本,個(gè)人最優(yōu)決定的飼養(yǎng)總量大于社會(huì)最優(yōu)決定的飼養(yǎng)總量,五、斗雞博弈,,,1,2,支付,“斗雞博弈”的擴(kuò)展,夫妻間吵架警察與游行隊(duì)伍公共產(chǎn)品的供給(兩富戶(hù)修路),第四節(jié) 混合戰(zhàn)略納什均衡,混合戰(zhàn)略(mixed strategies),定義:?*=(?1*,…,?n*)=(?i*,?-i *)是一納什混合戰(zhàn)略均衡,當(dāng)且僅當(dāng)對(duì)所有參與人而言, ?i*是?-i*的最適反應(yīng),ui(?i*,?-i *)? ui(

37、?I’,?-i *),對(duì)所有?i’??i成立)。持混合戰(zhàn)略的前提是在均衡時(shí)兩種戰(zhàn)略的報(bào)酬會(huì)相等,是預(yù)期支付最大化的推導(dǎo)結(jié)果。,擲硬幣,參與人1:max Eu=q(p(-1)+(1-p)1)+(1-q)(p1+(1-p)(-1)) =-pq+q-pq+p-pq-1+q+p-pq =-4pq+2q+2p-1一階條件為零求得:p

38、=1/2,擲硬幣的分析,給定參與人1(q,1-q),參與人2的支付是:q+(-1)(1-q)(正面)=(-1)q+(1-q)(反面); 給定參與人2(p,1-p),參與人1的支付為: p(-1)+(1-p)(正面)=p+(-1)(1-p)(反面);求得(1/2,1/2)是納什混合戰(zhàn)略均衡 如果兩種戰(zhàn)略報(bào)酬不相等,那么就變?yōu)?純戰(zhàn)略(pure strategies) 了。,混合戰(zhàn)略均衡的博弈原則,兩博弈方不能讓

39、對(duì)方知道或猜到自己的選擇,因而必須在決策時(shí)利用隨機(jī)性;兩博弈方選擇每種策略的概率一定要恰好使對(duì)方無(wú)機(jī)可乘,即讓對(duì)方無(wú)法通過(guò)針對(duì)性地傾向某一策略而在博弈中占上風(fēng)。例:在擲硬幣的博弈中,參與人1選正面、反面的概率q,1-q,一定要使參與人2選正面的和反面的期望得益相等。,單純戰(zhàn)略與混合戰(zhàn)略的定義,G={N,S,U}是一個(gè)戰(zhàn)略式有限博弈,參與人i的戰(zhàn)略空間S中的任一元素si稱(chēng)為i的一個(gè)單純戰(zhàn)略(pure strategy);定義在Si上的

40、一個(gè)概率分布函數(shù)pi(si)代表了一個(gè)混合戰(zhàn)略(mixed strategy)——這個(gè)戰(zhàn)略的內(nèi)容是:參與人i以概率pi(sij)選擇單純戰(zhàn)略sij,而?pi(sij)=1。單純戰(zhàn)略是混合戰(zhàn)略的特例,因?yàn)槿我粏渭儜?zhàn)略si都可以理解為i以概率1選擇si,以0概率選取其他所有單純戰(zhàn)略。引入混合戰(zhàn)略,參與人的目標(biāo)需要修改為“最大化自己的期望支付”,Selton:小偷和守衛(wèi)的博弈,一小偷欲偷竊有一守衛(wèi)看守的倉(cāng)庫(kù),如果小偷偷竊時(shí)守衛(wèi)在睡覺(jué),則小

41、偷就能得手,偷得價(jià)值為V的贓物;如果小偷偷竊時(shí)守衛(wèi)沒(méi)有睡覺(jué),則小偷就會(huì)被抓住。設(shè)小偷被抓后要坐牢,負(fù)效用為-P,守衛(wèi)睡覺(jué)而未遭偷竊有S的正效用,因睡覺(jué)被竊要被解雇,其負(fù)效用為-D。而如果小偷不偷,則他既無(wú)得也無(wú)失,守衛(wèi)不睡意味著出一份力掙一分錢(qián),他也沒(méi)有得失。,,,小偷,守衛(wèi),支付,小偷與守衛(wèi)的博弈,小偷的混合策略,S到-D連線的縱坐標(biāo)是在橫坐標(biāo)對(duì)應(yīng)的小偷“偷”竊概率下的守衛(wèi)選擇“睡”的期望得益,即S(1-pt)+(-D)pt,加重對(duì)守

42、衛(wèi)的處罰在短期中的效果是使守衛(wèi)真正盡職,但在長(zhǎng)期中恰恰是會(huì)降低盜竊發(fā)生的概率(激勵(lì)的悖論),守衛(wèi)的混合策略,小偷的混合策略分布不受P的影響,因此政府加重對(duì)小偷的懲罰在長(zhǎng)期中并不能抑制盜竊,最多只能抑制短期的盜竊發(fā)生率,它的作用主要是使守衛(wèi)可以更多地偷懶,齊威王田忌賽馬,古代齊威王與大將田忌賽馬,田忌的謀士孫臏運(yùn)用計(jì)謀幫助田忌以弱勝?gòu)?qiáng)。比賽規(guī)則:田忌與齊威王各出三匹馬,一對(duì)一比賽三場(chǎng),每一場(chǎng)的輸方要賠1000斤銅給贏方。雙方的馬按實(shí)力都

43、可以分為上、中、下,但齊威王的上、中、下均優(yōu)于田忌的上、中、下。實(shí)際上,田忌的上馬、中馬要優(yōu)于齊威王的中馬、下馬。比賽結(jié)果:田忌連輸三場(chǎng);后孫臏建議,以上對(duì)中、以中對(duì)下、以下對(duì)上,結(jié)果以2:1贏得比賽。,前述為單方面運(yùn)用策略的故事,如果齊威王預(yù)料到田忌的做法,必然會(huì)改變各匹馬出場(chǎng)的次序。本博弈中博弈雙方的利益是完全對(duì)立的,是嚴(yán)格競(jìng)爭(zhēng)的零和博弈,不會(huì)有純策略納什均衡,必然是一個(gè)混合策略均衡。假設(shè)齊威王采取六種戰(zhàn)略的概率分別為pa,p

44、b,pc,pd,pe,pf(加總為1),則田忌采取六種戰(zhàn)略的期望得益相等,則得出齊威王與田忌均以1/6的相同概率隨機(jī)選擇各自的六個(gè)純策略,構(gòu)成本博弈唯一的混合策略納什均衡。,齊威王田忌賽馬,齊威王,,田忌,齊威王田忌賽馬,齊威王田忌賽馬,在上述混合策略下,齊威王的期望得益為1/6(3+1+1+1+1-1)=1;田忌的期望得益為1/6(1-3-1-1-1-1)=-1,即多次進(jìn)行這樣的賽馬,齊威王平均每次能贏田忌1000斤銅,這是因?yàn)辇R威王

45、三匹馬的總體實(shí)力略勝田忌三匹馬總體實(shí)力的緣故,混合策略反應(yīng)函數(shù),將博弈方的策略空間擴(kuò)展到包括混合策略,將納什均衡擴(kuò)展到包括混合策略納什均衡以后,求納什均衡反應(yīng)函數(shù)的分析方法也可以擴(kuò)展到求混合策略納什均衡。反應(yīng)函數(shù)即一博弈方對(duì)另一博弈方每種可能的決策內(nèi)容的最佳反映決策構(gòu)成的函數(shù)。在純策略的范疇內(nèi),反應(yīng)函數(shù)是各博弈方選擇的純策略對(duì)其他博弈方純策略的反應(yīng)。在混合策略的范疇內(nèi),博弈方的決策內(nèi)容為選擇概率分布,反應(yīng)函數(shù)就是一方對(duì)另一方的概率分布

46、的反應(yīng)。,擲硬幣,,,1,2,支付,q 1-q,1-p,p,當(dāng)2出正面的概率q?1/2,1出正面的概率為1,因?yàn)樗稣娴玫降念A(yù)期收益大于他出反面;當(dāng)2出正面的概率q?1/2,1出正面的概率為0,因?yàn)樗龇疵娴钠谕找娲笥谒稣妗?第五節(jié) 納什均衡的存在性與多重性,混合戰(zhàn)略納什均衡,純戰(zhàn)略納什均衡,重復(fù)剔除占優(yōu)均衡,占優(yōu)均衡,不同均衡概念之間的關(guān)系,納什均衡的存在性 每個(gè)有限戰(zhàn)略式

47、博弈(參與人與戰(zhàn)略數(shù)目均為有限)都有納什均衡存在,這均衡有可能是混合戰(zhàn)略均衡納什均衡的多重性 納什均衡不唯一,如性別戰(zhàn),案例 性別戰(zhàn),性別戰(zhàn):混合策略均衡,給定妻子分別以q,1-q的概率選擇時(shí)裝、足球,則丈夫選擇時(shí)裝、足球的期望收益相等,即1.q+0.(1-q)=0.q+3.(1-q),解得妻子選擇時(shí)裝、足球的概率分別為(3/4,1/4)給定丈夫分別以p,1-p的概率選擇時(shí)裝、足球,則妻子選擇時(shí)裝、足球的期望收益相等,即2.p

48、+0.(1-p)=0.p+1.(1-p),解得妻子選擇時(shí)裝、足球的概率分別為(1/3,2/3),當(dāng)妻子以(3/4,1/4)的概率分布隨機(jī)選擇時(shí)裝表演和足球,丈夫以(1/3,2/3)的概率隨機(jī)選擇時(shí)裝表演和足球時(shí),雙方都無(wú)法通過(guò)單獨(dú)改變策略,即單獨(dú)改變隨機(jī)選擇純策略的概率分布而提高利益,因此雙方的上述概率分布的組合構(gòu)成一個(gè)混合策略納什均衡。該混合策略納什均衡給妻子和丈夫各自帶來(lái)的期望收益分別為: q.p.2+q.(1-p).0+(

49、1-q).p.0+(1-q).(1-p).1=2/3; q.p.1+q.(1-p).0+(1-q).p.0+(1-q).(1-p).3=3/4雙方的期望收益均小于純策略時(shí)的期望收益。,性別戰(zhàn):混合策略均衡,夫妻之爭(zhēng)兩博弈方的反應(yīng)函數(shù),如果p?1/3,則妻子選擇時(shí)裝的期望得益小于選擇足球,因此妻子應(yīng)選擇足球,即q=0;如果p?1/3,則妻子選擇時(shí)裝的期望得益為大于選擇足球的得益,因此選時(shí)裝,即p=1,焦點(diǎn)均衡(focal poin

50、t),當(dāng)一個(gè)博弈有多個(gè)納什均衡時(shí),博弈論并沒(méi)有一個(gè)一般的理論來(lái)證明納什均衡結(jié)果一定會(huì)出現(xiàn)。在現(xiàn)實(shí)生活中,參與人可能使用某些被博弈模型抽象掉的信息來(lái)達(dá)到一個(gè)“焦點(diǎn)”均衡。這些信息可能與社會(huì)文化習(xí)慣、參與人過(guò)去博弈的歷史有關(guān)。例,在性別戰(zhàn)中,如果今天是丈夫的生日,(足球、足球)可能是一個(gè)焦點(diǎn)均衡;而如果是妻子的生日,(時(shí)裝、時(shí)裝)可能是一個(gè)焦點(diǎn)均衡。還有分蛋糕等。,課堂練習(xí):求納什均衡,市場(chǎng)進(jìn)入阻撓,威脅是可置信的嗎?,作業(yè)1,,春節(jié)

51、前夕,某小鎮(zhèn)上兩個(gè)商鋪主甲和乙同時(shí)看到一個(gè)賺錢(qián)機(jī)會(huì):去城里販一批鞭炮回來(lái)零售,購(gòu)貨款加上運(yùn)輸費(fèi)用共5000元,如果沒(méi)有競(jìng)爭(zhēng)對(duì)手,這批貨在小鎮(zhèn)上能賣(mài)6000元;但如果另一家商鋪同時(shí)在小鎮(zhèn)上賣(mài)鞭炮,價(jià)格下跌使得這批鞭炮只能賣(mài)4000元。請(qǐng)用戰(zhàn)略式表示支付矩陣;請(qǐng)找出納什均衡。,作業(yè)二,乙 左 中 右,上中下,甲,一個(gè)兩人同時(shí)博弈的支付競(jìng)爭(zhēng)如下所

52、示,試求納什均衡。是否存在重復(fù)剔除占優(yōu)戰(zhàn)略均衡?,第二章 完全信息動(dòng)態(tài)博弈,博弈的擴(kuò)展式表述子博弈精煉納什均衡子博弈精煉納什均衡舉例重復(fù)博弈和無(wú)名氏定理,第一節(jié) 博弈的擴(kuò)展式表述,完全信息動(dòng)態(tài)博弈,一般以擴(kuò)展型式來(lái)表示:G=(N,H,P,I,U),包括5要素:(1)局中人N;(2)歷史H:博弈樹(shù)是一個(gè)多環(huán)節(jié)與枝干的集合,從單一的起始環(huán)節(jié),直到終結(jié)環(huán)節(jié),代表博弈歷史;(3)對(duì)每個(gè)環(huán)節(jié)的分配法則P:將每個(gè)環(huán)節(jié)(除終結(jié)環(huán)節(jié)外)分配

53、給不同的局中人,并賦予行動(dòng)時(shí)可選的策略;(4)局中人行動(dòng)時(shí)的信息集合I;(5)對(duì)應(yīng)局中人可能選擇策略,各局中人在終結(jié)環(huán)節(jié)所得到的報(bào)酬U。,戰(zhàn)略式表述(strategic form representation)多用矩陣,2L S,L S,1,,擴(kuò)展式表述(extensive form representation)多用博弈樹(shù),戰(zhàn)略式與擴(kuò)展式,A,B,(進(jìn)入,進(jìn)入),進(jìn)入,

54、不進(jìn)入,(進(jìn)入,不進(jìn)入),(不進(jìn)入,進(jìn)入),(不進(jìn)入,不進(jìn)入),市場(chǎng)進(jìn)入博弈的標(biāo)準(zhǔn)式,市場(chǎng)進(jìn)入的擴(kuò)展式,在市場(chǎng)進(jìn)入博弈中:A有兩個(gè)行動(dòng):“進(jìn)入”、“不進(jìn)入”。由于是先行動(dòng)者,只有兩個(gè)戰(zhàn)略:選擇“進(jìn)入”或“不進(jìn)入”。 B有兩個(gè)行動(dòng):“進(jìn)入”、“不進(jìn)入”。但是,有4個(gè)戰(zhàn)略:,(1)若A選擇“進(jìn)入”,B選擇“進(jìn)入”,若A選擇“不進(jìn)入”,B選擇“進(jìn)入”,即(進(jìn)入,進(jìn)入)(2)若A選擇“進(jìn)入”,B選擇“進(jìn)入”,若A選擇“

55、不進(jìn)入”,B選擇“不進(jìn)入”,即(進(jìn)入,不進(jìn)入),(3)若A選擇“進(jìn)入”,B選擇“不進(jìn)入”,若A選擇“不進(jìn)入”,B選擇“不進(jìn)入”,即(不進(jìn)入,進(jìn)入)(4)若A選擇“進(jìn)入”,B選擇“不進(jìn)入”,若A選擇“不進(jìn)入”,B選擇“不進(jìn)入”,即(不進(jìn)入,不進(jìn)入),博弈樹(shù)的構(gòu)成,1.結(jié)(nodes):結(jié)包括決策結(jié)(decition nodes)和終點(diǎn)結(jié)(terminal nodes)兩類(lèi)。決策結(jié)是參與人采取行動(dòng)的時(shí)點(diǎn),終點(diǎn)結(jié)是博弈行動(dòng)路徑的終點(diǎn)

56、。 在博弈樹(shù)中,“誰(shuí)在什么時(shí)候行動(dòng)”用在決策結(jié)旁邊標(biāo)注參與人的辦法來(lái)表示。參與人的支付標(biāo)注在博弈樹(shù)終點(diǎn)結(jié)處。2.枝(branches):在博弈樹(shù)上,枝是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇。3.信息集(information sets):博弈樹(shù)上的所有決策結(jié)分割成不同的信息集。每一個(gè)信息集是決策結(jié)集合的一個(gè)子集。該子集包括所有滿(mǎn)足下列條件的決策結(jié):(1)每一個(gè)決策結(jié)都是同一參與人的決策

57、結(jié);(2)該參與人知道博弈進(jìn)入該集合的的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié)。,結(jié)nodes,信息集分單節(jié)信息集和多節(jié)信息集;如果用虛線匡起來(lái)表示2知道自己位于信息集內(nèi),但不知道是哪一點(diǎn),因?yàn)樗麤](méi)能觀察到對(duì)手的行動(dòng);如果博弈樹(shù)的所有信息集都是單結(jié)的,稱(chēng)為完美信息博弈,完美信息(perfect information)與不完美信息(imperfect information),,不完美信息:2不能區(qū)分1是采用了L還是S,完美信息

58、:2能區(qū)分1是選擇了L還是S,第二節(jié) 子博弈精煉納什均衡,子博弈子博弈精煉納什均衡求解方法:逆向歸納法承諾行動(dòng)與子博弈精煉納什均衡,一、子博弈(sub-game),子博弈定義:在一個(gè)擴(kuò)展型博弈中,如果一個(gè)博弈由它的一個(gè)決策結(jié)及其所有后續(xù)結(jié)構(gòu)成,并滿(mǎn)足(1)起始結(jié)是一個(gè)單結(jié)的信息結(jié);(2)子博弈保留了原博弈的所有結(jié)構(gòu),則稱(chēng)它為原博弈的一個(gè)子博弈(子博弈)。,,(1)起始結(jié)是一個(gè)單結(jié)的信息結(jié),(2)子博弈保留了原博弈的所有結(jié)構(gòu):子博

59、弈的信息集和支付向量都直接繼承自原博弈,在市場(chǎng)進(jìn)入博弈中,包含3個(gè)子博弈(包括原博弈)。而在囚徒博弈中,只有一個(gè)子博弈(?),二、子博弈精煉納什均衡,子博弈精煉納什均衡定義: 在博弈G中,如果s*=(s1,…,sn)是G的一個(gè)納什均衡,并且對(duì)所有可能的子博弈而言仍是一個(gè)納什均衡,則稱(chēng)s*=(s1,…,sn)為一個(gè)子博弈精煉納什均衡,市場(chǎng)進(jìn)入博弈的納什均衡,A,B,(進(jìn)入,進(jìn)入),進(jìn)入,不進(jìn)入,(進(jìn)入,不進(jìn)入),(不進(jìn)入,進(jìn)入),(

60、不進(jìn)入,不進(jìn)入),該博弈中有三個(gè)納什均衡:不進(jìn)入,(進(jìn)入,進(jìn)入)進(jìn)入,(不進(jìn)入,進(jìn)入)進(jìn)入,(不進(jìn)入,不進(jìn)入)前兩個(gè)均衡的結(jié)果(進(jìn)入,不進(jìn)入),即A進(jìn)入,B不進(jìn)入;第二個(gè)均衡結(jié)果是(不進(jìn)入,進(jìn)入),即A不進(jìn)入,B進(jìn)入,如果理論得到這樣的結(jié)果,無(wú)助于預(yù)測(cè)博弈參與人的行為。此外,納什均衡假定,每一個(gè)參與人選擇的最優(yōu)戰(zhàn)略是在所有其他參與人的戰(zhàn)略選擇給定時(shí)的最優(yōu)反應(yīng),即參與人并不考慮自己的選擇對(duì)其他人選擇的影響,因而納什均衡很難說(shuō)

61、是動(dòng)態(tài)博弈的合理解。,必須在多個(gè)納什均衡中剔除不合理的均衡解,即所謂“不可置信威脅”。子博弈精煉納什均衡是對(duì)納什均衡概念的最重要的改進(jìn)。它的目的是把動(dòng)態(tài)博弈中的“合理納什均衡”與“不合理納什均衡”分開(kāi)。正如納什均衡是完全信息靜態(tài)博弈解的基本慨念一樣,子博弈精煉納什均衡是完全信息動(dòng)態(tài)博弈解的基本概念。,①{不進(jìn)入,(進(jìn)入,進(jìn)入)}② {進(jìn)入,(不進(jìn)入,進(jìn)入)}③{進(jìn)入,(不進(jìn)入,不進(jìn)入)},前邊得到的三個(gè)納什均衡中,均衡①意味著當(dāng)A不進(jìn)

62、入時(shí),B選擇進(jìn)入;而當(dāng)A選擇進(jìn)入時(shí),B仍選擇進(jìn)入(B威脅無(wú)論如何都要進(jìn)入市場(chǎng))。,顯然,當(dāng)A選擇進(jìn)入時(shí),B仍選擇進(jìn)入是不合理的,如果A進(jìn)入市場(chǎng),B選擇“不進(jìn)入”比選擇“進(jìn)入”收益要更大,理性的B不會(huì)選擇進(jìn)入,而A知道B是理性的,因此也不會(huì)把該戰(zhàn)略視為B會(huì)選擇的戰(zhàn)略。因此,B的戰(zhàn)略(進(jìn)入,進(jìn)入)是不可置信威脅。,均衡③意味著當(dāng)A進(jìn)入時(shí),B選擇不進(jìn)入;而當(dāng)A選擇不進(jìn)入時(shí),B仍選擇進(jìn)入(B威脅無(wú)論如何都不進(jìn)入市場(chǎng))。顯然,當(dāng)A選擇不進(jìn)入時(shí),B

63、仍選擇不進(jìn)入是不合理的,B的戰(zhàn)略是不可置信的。,①{不進(jìn)入,(進(jìn)入,進(jìn)入)} ② {進(jìn)入,(不進(jìn)入,進(jìn)入)} ③{進(jìn)入,(不進(jìn)入,不進(jìn)入)},只有均衡②是合理的:如果A進(jìn)入,B不進(jìn)入;如果A不進(jìn)入,B進(jìn)入。因?yàn)锳是先行動(dòng)者,理性的A會(huì)選擇“進(jìn)入”(他知道B是理性的,B不會(huì)選擇“進(jìn)入”),而理性的B選擇“不進(jìn)入”。 觀察博弈樹(shù)上的三個(gè)均衡中,B的不可置信戰(zhàn)略中的反應(yīng),在第二階段B開(kāi)始行動(dòng)的兩個(gè)子博弈中不是最優(yōu);而合

64、理的納什均衡中,B的戰(zhàn)略在所有子博弈中都是最優(yōu)的,與A的第一階段可能選擇的行動(dòng)構(gòu)成該子博弈的納什均衡。,只有當(dāng)一個(gè)戰(zhàn)略規(guī)定的行動(dòng)規(guī)則在所有可能的情況下都是最優(yōu)的時(shí),它才是一個(gè)合理的、可置信的戰(zhàn)略。子博弈精煉納什均衡就是要剔除掉那些只在特定情況下是合理的而在其他情況下并不合理的行動(dòng)規(guī)則。 子博弈精煉納什均衡: 如果參與者的戰(zhàn)略在每一個(gè)子博弈中都構(gòu)成了納什均衡,則稱(chēng)納什均衡是子博弈精練的(澤爾滕,1965) 。,為簡(jiǎn)單起見(jiàn),假定博弈有兩個(gè)

65、階段,第一階段參與人1行動(dòng),第2階段參與人2行動(dòng),并且2在行動(dòng)前觀測(cè)到1的選擇。令A(yù)1是參與人1的行動(dòng)空間,A2是參與人2的行動(dòng)空間。當(dāng)博弈進(jìn)入第二階段,給定參與人1在第一階段的選擇為a1∈ A1 ,參與人2面臨的問(wèn)題是:,顯然參與人2的最優(yōu)選擇a2*依賴(lài)于參與人1的選擇a1。用a2*=R(a1)代表上述最優(yōu)化問(wèn)題的解(即2的反應(yīng)函數(shù))。因?yàn)閰⑴c人1應(yīng)該預(yù)測(cè)到參與人2在博弈的第二階段將按a2*=R(a1)的規(guī)則行動(dòng),參與人1在第一階段面

66、臨的問(wèn)題是:,令上述問(wèn)題的最優(yōu)解為a1*。那么,這個(gè)博弈的子博弈精煉納什均衡為{a1*,R2(a1)},均衡結(jié)果為{a1*,R2(a1*)}。(a1*,R2(a1*))是一個(gè)精煉均衡,因?yàn)閍2*=R2(a1)在博弈的第二階段是最優(yōu)的。除a2*=R2(a1)之外,任何其他的行為規(guī)則都不滿(mǎn)足精練均衡的要求。 上述思路就是逆向歸納法尋找子博弈精煉納是均衡的基本思路。,乙{左,左} {左,右} {右,左} {右,右},上下,甲

67、,納什均衡?子博弈精煉納什均衡,三個(gè)納什均衡:(上,{左,左})(下,{左,右})(下,{右,右})排除(上,{左,左}),(下,{右,右}),只有(下{左,右}) 是子博弈精煉納什均衡,三、求解方法:逆推法,逆向歸納法求解子博弈精煉納什均衡的過(guò)程,實(shí)質(zhì)是重復(fù)剔除劣戰(zhàn)略過(guò)程在擴(kuò)展式博弈上的擴(kuò)展:從最后一個(gè)決策結(jié)開(kāi)始依次剔除掉每個(gè)子博弈的劣戰(zhàn)略,最后生存下來(lái)的戰(zhàn)略構(gòu)成精煉納什均衡。如同重復(fù)剔除的占優(yōu)均衡要求“所有參與人是理性的”

68、是共同知識(shí)一樣,用逆向歸納法求解均衡也要求“所行參與人是理性的”是共同知識(shí)。,逆推法:例1,逆推法:例2,逆推法:例3,四、承諾行動(dòng)(commitment)與子博弈精煉納什均衡,納什均衡之所以不是精煉均衡,是因?yàn)椴豢芍眯诺耐{存在,如父母與子女之間的博弈。如果參與人在博弈前采取措施改變行動(dòng)空間或支付函數(shù),原來(lái)不可置信威脅就變得可置信,博弈的精煉均衡就會(huì)改變;將改變博弈結(jié)果而采取的措施稱(chēng)為“承諾行動(dòng)”完全承諾,如破釜沉舟、軍事博弈

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論