伊人久久大香线蕉成人|国产精品自在在线午夜精华在线|中文字幕乱码久久午夜|午夜福利免费区久久

<style id="av6lj"><delect id="av6lj"><source id="av6lj"></source></delect></style>

<menu id="7hibp"></menu>

歡迎來到速發(fā)表網(wǎng)！

關(guān)于我們登錄/注冊購物車(0)

搜索

期刊科普 SCI期刊投稿技巧學(xué)術(shù) 出書

首頁 > 優(yōu)秀范文 > 進(jìn)化博弈理論

進(jìn)化博弈理論樣例十一篇

時間：2024-04-16 16:05:05

序論：速發(fā)表網(wǎng)結(jié)合其深厚的文秘經(jīng)驗，特別為您篩選了11篇進(jìn)化博弈理論范文。如果您需要更多原創(chuàng)資料，歡迎隨時與我們的客服老師聯(lián)系，希望您能從中汲取靈感和知識！

進(jìn)化博弈理論

篇1

一、研究背景

云南綠大地生物科技股份有限公司（簡稱綠大地）創(chuàng)立于 1996 年 6 月， 2007 年 12 月，公司向社會公開發(fā)行股票在深圳證券交易所掛牌上市，成為國內(nèi)綠化苗木行業(yè)首家上市公司。2011 年 3 月中旬，綠大地公司公告稱，其董事長何學(xué)葵因涉嫌欺詐發(fā)行股票罪被公安機(jī)關(guān)逮捕。調(diào)查發(fā)現(xiàn)，公司涉嫌虛增資產(chǎn)、虛增收入、虛增利潤等多項違法違規(guī)行為。其實，在此之前，綠大地造假事件早已露出端倪，上市三年多來，公司頻繁更換高管人員和會計師事務(wù)所?？墒菃栴}如此之多的綠大地，為何能通過層層關(guān)口上市融資，并直至三年后才被揭穿呢？

從銀廣廈到綠大地，上市公司涉嫌財務(wù)造假背后總有會計師事務(wù)所如影隨形。本來，中介機(jī)構(gòu)的任務(wù)是將真正優(yōu)秀的公司輸送到市場中，可事實卻是中介機(jī)構(gòu)與上市公司串通起來蒙騙投資者。這是由于這種行為的成本與收益不對稱：與上市公司串通可以獲得很大的收益，而一旦東窗事發(fā)，處罰卻十分有限。顯然，造假成本小而收益大。針對這種會計信息失真現(xiàn)象，本文從動態(tài)博弈的角度出發(fā)，對這種現(xiàn)象進(jìn)行了分析，并提出了減少會計信息失真現(xiàn)象的建議。

二、博弈模型的建立與假設(shè)的提出

在會計信息的披露過程中，有披露方和監(jiān)管方這樣兩個參與者，其中會計信息的披露方主要指企業(yè)的管理層即經(jīng)營者，會計信息的監(jiān)管方指會計師事務(wù)所等外部監(jiān)督管理機(jī)構(gòu)（這里暫不討論股東這個角色）。每個博弈方都有兩個純策略可供選擇，對于披露方可以選擇披露虛假的會計信息即不誠信，也可以選擇披露真實的會計信息即誠信；對于監(jiān)管方則可以選擇實行監(jiān)管，也可以選擇不監(jiān)管。這里用I和H分別表示監(jiān)管方和披露方的策略集合，Ii和Hi分別表示第i個純策略（i=1，2），即I={I1，I2}={監(jiān)管，不監(jiān)管}，H={H1，H2}={不誠信，誠信}。同時可以作出如下假設(shè)：

假設(shè)1：披露真實的會計信息為企業(yè)帶來的效用是Y，而披露虛假的會計信息為企業(yè)帶來的效用是X（X>Y），其中偽造虛假會計信息的成本是a，這里a相對于X來說特別的小即X-a>Y，只有在這種條件之下，企業(yè)才有可能對會計信息進(jìn)行造假。

假設(shè)2：若披露虛假的會計信息，則監(jiān)管方遭受的損失是m，若披露真實的會計信息，則監(jiān)管方既無收益也無損失。如果監(jiān)管方發(fā)現(xiàn)企業(yè)有造假行為，則企業(yè)應(yīng)向監(jiān)管方交納f的罰款，而監(jiān)管方在監(jiān)管過程中需要付出c的成本。

假設(shè)3：如果披露方披露虛假會計信息，監(jiān)管方進(jìn)行監(jiān)管，就一定能查出該造假行為，且需滿足f-c>0，否則根據(jù)理性人的假設(shè)，監(jiān)管方不會實施監(jiān)管。同時也假定監(jiān)管方監(jiān)管的懲罰力度是很大的，實施的是有效監(jiān)管，使企業(yè)在被處以罰款之后的效用低于披露真實會計信息的效用，即X-a-f

從以上假設(shè)可以得到監(jiān)管方和披露方的得益矩陣（見表1）

三、會計信息披露與監(jiān)督的靜態(tài)博弈分析

基于上述假設(shè)可以得出，在靜態(tài)博弈分析中，如果監(jiān)管方選擇I1監(jiān)管，則披露方就會選擇H2披露真實會計信息即誠信；如果監(jiān)管方選擇I2不監(jiān)管，則披露方就會選擇H1披露虛假會計信息即不誠信；如果披露方選擇H1不誠信，則監(jiān)管方就會選擇I1監(jiān)管；如果披露方選擇H2誠信，則監(jiān)管方就會選擇I2不監(jiān)管。這樣博弈雙方就一直在博弈矩陣?yán)镅h(huán)往復(fù)下去，顯然這個博弈不存在占優(yōu)策略，但是納什均衡存在性定理告訴我們：每一個有限博弈至少存在一個納什均衡（純策略的或混合戰(zhàn)略的）。從以上分析可以看出這個博弈不存在純策略納什均衡，因此它必然存在一個混合策略納什均衡。

假定監(jiān)管方的混合策略為p={p，1-p}，披露方的混合策略為 Q={q，1-q}，這表示監(jiān)管方以P的概率選擇監(jiān)管，披露方以q的概率選擇不誠信即披露虛假的會計信息。這樣就可以推出博弈雙方的期望得益：

監(jiān)管方選擇監(jiān)管的期望得益值為：

Up=q（f-m-c）+（1-q）（-c）（1）

監(jiān)管方選擇不監(jiān)管的期望得益值為：

U1-p=q（-m）（2）

披露方選擇不誠信的期望得益值為：

Uq=p（X-a-f）+（1-p）（X-a）（3）

披露方選擇誠信的期望得益值為：

U1-q=PY+（1-p）Y（4）

在混合策略納什均衡中，應(yīng)該使得無論披露方選擇哪一種策略，監(jiān)管方選擇監(jiān)管和不監(jiān)管的期望得益都是相同的，同時，也應(yīng)該使無論監(jiān)管方選擇哪一種策略，披露方選擇不誠信和誠信的期望得益是相同的。因此可以得到以下兩個等式：

Up=U1-p，Uq=U1-q

計算可以得到P*=（X-a-Y）/1，q*=c/f，，這表示監(jiān)管方分別以概率P*和1-P*選擇“監(jiān)管”與“不監(jiān)管”，披露方分別以概率 q*和1-q*選擇“不誠信”和“誠信”，即監(jiān)管方和披露方博弈的唯一的混合策略納什均衡為{（（X-a-Y）/f，（f+a+Y-X）/f），（c/f，（f-c）/f）}。從中可以得出當(dāng)p>P*時，誠信是披露方的最佳策略，即q=0；當(dāng)pq*時，監(jiān)管方會選擇監(jiān)管，即p=1；當(dāng)q

四、會計信息披露與監(jiān)督的進(jìn)化博弈分析

在有限理性下人們不一定有能力找到納什均衡，每個博弈方通過把不同策略的得益與平均得益進(jìn)行比較，然后逐步調(diào)整策略。這與生物進(jìn)化過程很類似，在物種進(jìn)化過程中，生物調(diào)整自身行為很緩慢。在這里，假設(shè)由披露方和監(jiān)管方組成的大群體學(xué)習(xí)速度很慢，這樣就可以用復(fù)制動態(tài)來模擬博弈方的動態(tài)調(diào)整，在整個復(fù)制動態(tài)過程中，如果出現(xiàn)一種適應(yīng)性較高的策略，就會被大多數(shù)人采用，否則就會被淘汰。

在演化博弈分析框架下，監(jiān)管方博弈群體中采用監(jiān)管策略的比例為p，披露方博弈群體中采用不誠信策略的比例為q，因此，由方程（1）和（2）得到監(jiān)管方群體的平均得益UI為：

UI=pUp+（1-p）U1-p=pqf-pc-qm（5）

由方程（3）和（4）得到披露方群體的平均得益UH為：

UH=qUq+（1-q）U1-q=q（X-a-Y）-pqf+Y （6）

由方程（1）、（5）可以得到監(jiān)管方采用監(jiān)管策略比例的復(fù)制動態(tài)方程為：

從上述分析可以得出以下結(jié)論：

第一，適當(dāng)提高罰款額有助于降低披露方不誠信的可能性。

上述不等式說明監(jiān)管方監(jiān)管的可能性和披露方不誠信的可能性是罰款額的減函數(shù)。對于披露方而言，罰款額越高，越會選擇誠信即披露真實的會計信息，這與現(xiàn)實也是相符合的，一旦被發(fā)現(xiàn)會計信息造假，企業(yè)不僅要承擔(dān)因虛假會計信息帶來的損失，還要額外地支付罰款，這樣企業(yè)將會承擔(dān)更大的成本和風(fēng)險，因此披露方會更傾向于選擇誠信的策略。同時，對于監(jiān)管方來說，他們考慮到由于罰款額上升會使披露方不誠信的可能性降低，因此他們監(jiān)管的可能性也會降低；相反，較低的懲罰力度會使披露方產(chǎn)生不誠信的心理，使得監(jiān)管方監(jiān)管的可能性增強(qiáng)。

第二，降低監(jiān)管成本可以減小披露方不誠信的可能性。

這個不等式表明披露方不誠信的可能性會隨著監(jiān)管成本的降低而降低，是因為較低的監(jiān)管成本使得監(jiān)管方實施監(jiān)管的可能性增加，披露方考慮到監(jiān)管方的這種心理，自然就減少會計信息造假的可能性。所以，為了盡可能地減少會計信息失真的現(xiàn)象發(fā)生，監(jiān)管部門應(yīng)該采取一切可能的方法來降低監(jiān)管成本，有效遏制會計信息造假的發(fā)生。

第三，誠信遵從的改善是緩慢的，即監(jiān)管方監(jiān)管的概率p*較高時，披露方處于規(guī)避風(fēng)險的考慮，他不誠信的概率q*較低，同時，一旦監(jiān)管方覺察到會計信息造假的事件比較少時，也會放松監(jiān)管，即選擇監(jiān)管策略的可能性就會降低，這樣就會使得披露方偏向于選擇不誠信，提高不誠信的概率q*。這就表明，提高披露方的誠信遵從度是一個非常緩慢的過程，并非在短時間內(nèi)可以實現(xiàn)，為減少會計信息失真的現(xiàn)象，應(yīng)該盡量使得p>p*，從而使披露方不誠信的概率q保持在一個較低的水平上。

五、總結(jié)

本文從理論的角度分析了會計信息的披露和監(jiān)管過程中的靜態(tài)博弈和動態(tài)進(jìn)化博弈，克服了經(jīng)典博弈模型中要求參與者具有完全理性的缺點，而進(jìn)化博弈正是有限理性的研究框架，降低了參與者的理性程度，更貼近現(xiàn)實。除此之外，動態(tài)進(jìn)化博弈提供了各種可能的均衡狀態(tài)，并給出了均衡狀態(tài)下的方程，同時將罰款金額、監(jiān)管成本和造假成本納入動態(tài)分析過程，更符合現(xiàn)實，還得出了降低監(jiān)管成本和加大懲罰力度是減少會計信息失真的有效途徑。

【參考文獻(xiàn)】

［1］李敏.上市公司會計信息失真博弈分析［J］.合作經(jīng)濟(jì)與科技，2008（2）：80-81.

［2］徐煥章，管慧芳，劉麗華.基于博弈論的會計信息失真研究［J］.西安工程大學(xué)學(xué)報，2009（2）：126-130.

篇2

一、兩個簡單的例子

1.1 老鷹（Hawk）與鴿子(Dove)博弈

1.2 系統(tǒng)選擇博弈

二、進(jìn)化博弈理論的產(chǎn)生及其發(fā)展

2.1 理性的由來及其缺陷

2.2 心理學(xué)研究成果及有限理性概念的提出

2.3 進(jìn)化博弈理論的產(chǎn)生及其發(fā)展

三、進(jìn)化博弈理論的基本內(nèi)容

3.1 進(jìn)化博弈理論基本模型分類

3.2 進(jìn)化博弈理論基本均衡概念-----進(jìn)化穩(wěn)定策略

3.3 進(jìn)化博弈理論基本動態(tài)概念----模仿者動態(tài)

四、進(jìn)化博弈理論的應(yīng)用

五、傳統(tǒng)方法的缺陷及進(jìn)化博弈理論研究方法的現(xiàn)實性

5.1 新古典經(jīng)濟(jì)學(xué)均衡分析法的缺陷

5.2 經(jīng)典博弈理論的策略互動分析法及其缺陷

5.3 進(jìn)化博弈理論局部動態(tài)分析方法的現(xiàn)實性

5.3.1 局部動態(tài)分析法的均衡觀

5.3.2 局部動態(tài)法的時間觀

5.3.3 局部動態(tài)法的均衡選擇觀

5.3.4 局部動態(tài)法的特殊性

六、結(jié)論

參考文獻(xiàn)

摘要

本文從兩個簡單的博弈例子出發(fā)，以通俗的語言全面介紹了進(jìn)化博弈理論的理性基礎(chǔ)及其形成、發(fā)展、基本內(nèi)容和部分應(yīng)用，在此基礎(chǔ)上文章進(jìn)一步比較了新古典經(jīng)濟(jì)學(xué)、經(jīng)典博弈理論 ①及進(jìn)化博弈理論在研究方法上的不同之處，并特別強(qiáng)調(diào)了進(jìn)化博弈理論局部動態(tài)法的均衡觀、時間觀、均衡選擇觀及方法上的特殊性。進(jìn)化博弈理論的局部動態(tài)分析方法既是經(jīng)濟(jì)學(xué)研究方法的一次創(chuàng)新又是經(jīng)濟(jì)學(xué)直面現(xiàn)實的有力武器。

關(guān)鍵詞：沉默互動；社會互動；進(jìn)化穩(wěn)定策略；模仿者動態(tài)；均衡分析法；局部動態(tài)法

引言

為什么同樣一項經(jīng)濟(jì)制度在某個地方對經(jīng)濟(jì)發(fā)展有積極的推動作用而在另一個地方對經(jīng)濟(jì)發(fā)展卻起著消極的阻礙作用？為什么能夠有效降低交易費用的中介在一些地方會出現(xiàn)而在另一些地方卻不能出現(xiàn)？為什么同樣的管理方法在一個地方顯示出高效率而在另一地方卻不具有效率？諸如此類的問題，新古典經(jīng)濟(jì)學(xué)利用均衡分析法都無法給出令人滿意的答案。均衡分析法的最大缺陷是把經(jīng)濟(jì)系統(tǒng)中參與人看作是互不聯(lián)系的單個人（僅研究單個生產(chǎn)者或消費者的行為），不能把其所考察的問題放在一定的環(huán)境中去，該方法完全忽略了制度環(huán)境、社會環(huán)境及人文環(huán)境等對參與人行為的影響，單純考察某個條件與結(jié)果之間的一一對應(yīng)關(guān)系。因而，無法對現(xiàn)實中出現(xiàn)的諸多現(xiàn)象給予合理的解釋。博弈理論盡管把參與人之間行為互動關(guān)系納入到了模型之中，但依然沒能跳出新古典均衡分析法的基本框架，并且由于其對理性賦予更強(qiáng)的假定，使得該理論更加脫離現(xiàn)實。進(jìn)化博弈理論則一反常規(guī)，從一種全新的視角來考察經(jīng)濟(jì)及社會問題，它所提供的局部動態(tài)研究方法是從更現(xiàn)實的社會人出發(fā)，把其所考察的問題都置于一定的環(huán)境中進(jìn)行更全面的分析，因而，其結(jié)論更接近于現(xiàn)實且具有較強(qiáng)的說服力。進(jìn)化博弈理論屬于經(jīng)濟(jì)學(xué)的前沿理論，該理論從其理論框架建立到現(xiàn)在僅僅只有近三十年的歷史，但其在經(jīng)濟(jì)學(xué)、社會學(xué)、生態(tài)學(xué)等領(lǐng)域卻得到了廣泛的應(yīng)用，近年來已經(jīng)成為主流經(jīng)濟(jì)的研究方法之一。在我國由于歷史原因，對經(jīng)濟(jì)學(xué)的研究起步較晚，特別對進(jìn)化博弈這樣的前沿理論更是知者甚少，本文的主要目的是以通俗的語言介紹進(jìn)化博弈理論的相關(guān)內(nèi)容及其應(yīng)用，讓讀者對該理論有一個全面的了解。

本文的結(jié)構(gòu)如下：第一部分給出進(jìn)化博弈理論的兩個典型的例子；第二部分對進(jìn)化博弈理論的產(chǎn)生及其發(fā)展進(jìn)行闡述；第三部分對進(jìn)化博弈理論的基本內(nèi)容進(jìn)行簡要的介紹；第四部分概述進(jìn)化博弈理論的有關(guān)應(yīng)用；第五部分論述傳統(tǒng)的經(jīng)濟(jì)學(xué)研究方法的缺陷及進(jìn)化博弈理論研究方法的現(xiàn)實性；第六部分對進(jìn)化博弈理論的發(fā)展及理論前景進(jìn)行簡要的說明。

一、兩個簡單的例子

為了下文說明的方便，本文先給出進(jìn)化博弈理論中兩個具有代表性的例子，在此基礎(chǔ)上再進(jìn)一步給出該理論的基本內(nèi)容及其研究方法的基本特點。

1.1 老鷹（Hawk）與鴿子(Dove)博弈

假定一個生態(tài)環(huán)境中有老鷹與鴿子兩種動物，它們?yōu)榱松嫘枰獱帄Z有限的資源（如食物或生存空間等）而競爭。老鷹一般比較兇悍，必要時在斗爭中直到重傷。鴿子一般比較溫馴，競爭時在強(qiáng)敵面前常常退縮。競爭中獲勝者得到了生存資源就可以更好地繁衍后代，重傷者則不利于其后代生長，即會減少其后代的數(shù)量。如果群體中老鷹與鴿子相遇并競爭資源，那么老鷹就會輕而易舉地獲得全部資源，而鴿子由于害怕強(qiáng)敵退出爭奪，從而不能獲得任何資源（當(dāng)然不會受傷）；如果群體中兩個鴿子相遇并競爭生存資源，由于它們均膽小怕事不愿意戰(zhàn)斗，結(jié)果平分資源；如果群體中兩個老鷹相遇并競爭有限的生存資源，由于它們都非常勇猛而相互殘殺，直到雙方受到重傷而精疲力竭，結(jié)果雖然雙方都獲得部分生存資源但損失慘重，入不敷出。假定競爭中得到全部資源為50個單位（該數(shù)字也可以表示為生物的適應(yīng)度、繁殖成活率或后代數(shù)量）；得不到資源則表示其適應(yīng)度為零；雙方重傷則用來表示。于是老鷹、鴿子兩種動物進(jìn)行的資源競爭可以用一個對稱博弈來描述，博弈的支付矩陣如下：

操作依賴于該群體的初始狀態(tài)。如果初始時，該宿舍有多于4人使用操作系統(tǒng)，那么該宿舍所有學(xué)生最終都會使用該操作系統(tǒng)；否則所有學(xué)生最終會使用操作系統(tǒng)。

二、進(jìn)化博弈理論的產(chǎn)生及其發(fā)展

進(jìn)化博弈理論是經(jīng)濟(jì)學(xué)研究方法的一次創(chuàng)新，該理論從否定傳統(tǒng)理論賴以成立的基礎(chǔ)----理性人假定出發(fā)而建立起來一個新的分析框架，它結(jié)合了生態(tài)學(xué)、社會學(xué)、心理學(xué)及經(jīng)濟(jì)學(xué)的最新發(fā)展成果，從有限理性的社會人出發(fā)來分析參與人的資源配置行為。

2.1 理性的由來及其缺陷

經(jīng)濟(jì)學(xué)自從古希臘哲學(xué)中分離出來并成為一門系統(tǒng)的學(xué)問，是在亞當(dāng)•斯密1776年發(fā)表《國富論》之后。以斯密為代表的古典經(jīng)濟(jì)學(xué)關(guān)注的核心是資源的稀缺程度如何能被人類經(jīng)濟(jì)活動所減少，他們關(guān)注的重點不是資源配置問題而是國民財富的增長及國別差異的原因。1890年馬歇爾《經(jīng)濟(jì)學(xué)原理》的出版，標(biāo)志著新古典經(jīng)濟(jì)學(xué)的成形，馬歇爾之后，新古典經(jīng)濟(jì)學(xué)關(guān)注的核心逐漸轉(zhuǎn)向在給定稀缺程度下資源的最優(yōu)配置問題。稀缺資源的配置是需要人的參與，也就是說經(jīng)濟(jì)學(xué)研究的問題演變?yōu)殛P(guān)于經(jīng)濟(jì)中參與人如何把稀缺的資源配置到效率最高地方去的問題，強(qiáng)調(diào)個體行為在資源配置中的作用。經(jīng)濟(jì)中參與人的決策行為是通過高度復(fù)雜的思維活動作出的，為了更好地從微觀個體行為來解釋資源配置問題，新古典經(jīng)濟(jì)學(xué)借用了哲學(xué)中“理性”概念對復(fù)雜的人類行為過程進(jìn)行了抽象的假定。然而，理性一詞用于經(jīng)濟(jì)學(xué)時卻對其含義的理解與哲學(xué)中對其含義的理解已經(jīng)有了明顯的區(qū)別。哲學(xué)中的理性是指人類所特有的用以探索自然和社會奧秘的認(rèn)知能力，當(dāng)代偉大的哲學(xué)家康德在其著作《純理性批判》一書中指出，人類理性即認(rèn)知能力并不是萬能的，而是有限的。經(jīng)濟(jì)學(xué)中的理性則是指一種行為方式，具體地說即是經(jīng)濟(jì)中參與人對其所處世界的各種狀態(tài)及不同狀態(tài)對自己支付的意義都具有完全信息，并且在既定的條件下每個參與人都具有選擇使自己獲得最大效用或最大利潤的能力。

經(jīng)濟(jì)學(xué)家認(rèn)為理性是至高無上的，人們憑借理性就可以完全地認(rèn)識自然與社會。經(jīng)濟(jì)學(xué)中對理性的含義經(jīng)過這樣的處理以后，就使得經(jīng)濟(jì)學(xué)能夠充分運用數(shù)學(xué)理論發(fā)展的成果來進(jìn)行分析。為了應(yīng)用數(shù)學(xué)工具并更好地處理經(jīng)濟(jì)問題，傳統(tǒng)經(jīng)濟(jì)學(xué)家們從偏好，信念及理性三個方面來界定經(jīng)濟(jì)主體的特征，其中信念就是個體認(rèn)為不同結(jié)果將會出現(xiàn)的基于個體所獲信息之上的條件概率。偏好則是基于不同結(jié)果的信念之上的序。理性是根據(jù)上述偏好及信念，個體獲得最優(yōu)決策的程度以及個體根據(jù)已經(jīng)獲得的信息來修正其信念的能力。這三個特征使得經(jīng)濟(jì)學(xué)研究的對象由現(xiàn)實人轉(zhuǎn)向了理想化的對象，經(jīng)濟(jì)學(xué)越來越偏離了現(xiàn)實。

由理性概念而引致的缺陷首先表現(xiàn)在理性人具有無限的信息收集及處理能力的均衡觀，認(rèn)為經(jīng)濟(jì)系統(tǒng)常常處于均衡狀態(tài)，非均衡只是一種暫時的現(xiàn)象，當(dāng)受到外生因素擾動而使系統(tǒng)偏離均衡狀態(tài)時，系統(tǒng)會以線性的方式回歸均衡，這種機(jī)械式線性反應(yīng)的均衡觀來源于牛頓力學(xué)，由此而得出的比較靜態(tài)分析法完全忽視了系統(tǒng)受到非線性擾動及連續(xù)因素的影響。其次表現(xiàn)在由全知全能的理性人而引致的均衡跳躍觀，認(rèn)為經(jīng)濟(jì)系統(tǒng)達(dá)到均衡或者從一個均衡到另一個均衡是不需要時間的，認(rèn)為時間是可逆的，即經(jīng)濟(jì)變量與物理學(xué)的變量一樣，只要條件相同系統(tǒng)的均衡也就相同，市場和經(jīng)濟(jì)對于過去的記憶是短暫的或者是沒有的。這種應(yīng)用經(jīng)典牛頓力學(xué)分析方法來分析高度復(fù)雜的參與人經(jīng)濟(jì)行為使得其預(yù)測效果大打折扣。最后表現(xiàn)在其比較靜態(tài)分析方法上，傳統(tǒng)經(jīng)濟(jì)學(xué)的最基本分析方法----比較靜態(tài)分析法賴以成立的基礎(chǔ)是假定經(jīng)濟(jì)系統(tǒng)只受到外界一個個相互獨立、互不重疊的沖擊的影響，或者當(dāng)一個因素的影響消除之后，下一因素才開始對經(jīng)濟(jì)系統(tǒng)產(chǎn)生影響。我們知道現(xiàn)實世界是普遍聯(lián)系的，各種因素之間不可能相互獨立，系統(tǒng)中任何一個因素的變動都會引起其他因素的變動，這些因素之間相互作用的時間可能很短也可能很長，各因素對最終目標(biāo)會產(chǎn)生不同程度的影響。比較靜態(tài)法卻只見局部不見整體，企圖通過比較不同均衡來找出系統(tǒng)達(dá)到均衡的條件，因此得不出符合現(xiàn)實的結(jié)論，其研究方法上的局限性大大降低了其理論的現(xiàn)實意義。

2.2 心理學(xué)研究成果及有限理性概念的提出

隨著經(jīng)濟(jì)學(xué)家對理論研究的深入，特別近來實驗經(jīng)濟(jì)學(xué)的迅速發(fā)展，主流經(jīng)濟(jì)學(xué)賴以成立的基礎(chǔ)“理性人”假定及其基本的比較靜態(tài)均衡分析法越來越受到了人們的質(zhì)疑。相繼出現(xiàn)了許多其他的研究方法，其中在經(jīng)濟(jì)學(xué)中影響最大的就是心理學(xué)的研究方法。心理學(xué)應(yīng)用于經(jīng)濟(jì)分析有著非常曲折的歷史。事實上，斯密、馬歇爾、庇古、費雪爾和凱恩斯等一批古典經(jīng)濟(jì)學(xué)家都仔細(xì)地分析了偏好和信念的心理學(xué)基礎(chǔ)。但從1940’s開始，一方面受到薩繆爾森及希克斯等新一派基于理性假定經(jīng)濟(jì)學(xué)家的影響，心理分析在經(jīng)濟(jì)學(xué)中的地位慢慢地被降低了；另一方面理性模型也遇到了許多如Allais(1952)悖論等難以給出合理解釋的經(jīng)濟(jì)現(xiàn)象。于是1960’s開始，許多微觀經(jīng)濟(jì)學(xué)家再次運用心理學(xué)研究方法來解釋現(xiàn)實中的異?，F(xiàn)象，宏觀經(jīng)濟(jì)學(xué)也把經(jīng)驗法則和適應(yīng)性預(yù)期納入到其模型之中，正是在這一時期心理學(xué)家Simon(1957)提出了其著名的“有限理性”概念。然而，1970’s初隨著Robert Lucas等人提出的理性預(yù)期理論、Selten、Kreps等倡導(dǎo)的強(qiáng)調(diào)正確信念及貝葉斯修正的博弈理論及Stiglitz、Spence等研究的信息經(jīng)濟(jì)學(xué)理論相繼成為主流經(jīng)濟(jì)學(xué)的一部分，經(jīng)濟(jì)學(xué)界再一次掀起了排除滲透在經(jīng)濟(jì)學(xué)領(lǐng)域中心理學(xué)研究方法的熱潮，心理的研究方法在經(jīng)濟(jì)學(xué)界幾乎無立足之地，嚴(yán)格理性假定席卷整個經(jīng)濟(jì)學(xué)界。行為經(jīng)濟(jì)學(xué)的發(fā)起者Amos Tversky在經(jīng)濟(jì)學(xué)界根本找不到志趣相投者。1970’s末期，隨著心理學(xué)家Amos Tversky與Kahneman合作發(fā)表了一系列應(yīng)用心理分析方法來研究經(jīng)濟(jì)學(xué)問題的原創(chuàng)性文章，如1974年他們在Science發(fā)表的Judgment under uncertainty: Heuristics and biases，1979年他們合作在Econometrica發(fā)表Prospect theory: An analysis of decision under risk，慢慢消除了經(jīng)濟(jì)學(xué)界中存在的對心理學(xué)分析方法的偏見，此后應(yīng)用心理分析方法來解釋經(jīng)濟(jì)現(xiàn)象的文獻(xiàn)見諸于各種經(jīng)濟(jì)學(xué)期刊之中，心理分析方法也漸漸地成為了主流經(jīng)濟(jì)學(xué)的研究方法之一。

進(jìn)入1980’s，隨著經(jīng)典博弈理論、生態(tài)理論及心理學(xué)理論研究的深入發(fā)展，特別是心理學(xué)家西蒙把其在心理學(xué)領(lǐng)域研究的成果直接應(yīng)用經(jīng)濟(jì)分析并因此獲得了諾貝爾經(jīng)濟(jì)學(xué)獎，極大地激勵著經(jīng)濟(jì)及社會學(xué)家從現(xiàn)實人行為出發(fā)來解釋經(jīng)濟(jì)及社會現(xiàn)象。心理學(xué)研究表明人類認(rèn)知過程首先表現(xiàn)為人們通過一種“感知秩序”進(jìn)行學(xué)習(xí)活動，并形成分散的非同質(zhì)的知識，其中“感知秩序”是指人的理解力、知識和人類行動之間的關(guān)系；其次表現(xiàn)為個體通過學(xué)習(xí)所達(dá)到的理性程度的有限性，組織學(xué)習(xí)個體學(xué)習(xí)行為的整合而形成的多層次“理性結(jié)構(gòu)”，個體理性便會在一個累積性的組織或制度環(huán)境中得到塑造和提高并發(fā)揮作用，在這個過程中，個體學(xué)習(xí)行為總會受到組織、習(xí)慣和文化等制度性的限制和影響。西蒙認(rèn)為人類并不是完全理性而是有限理性的，因為人類認(rèn)知能力有著心理的臨界極限，人類進(jìn)行推理活動需要消耗大量的能量，推理也是一種相對稀缺的資源，另外決策者決策時需要大量的信息，而這些信息是不可能免費獲得的，獲得決策所需要的信息是需要大量成本的。考慮到參與人有限的知識水平、有限的推理能力、有限的信息收集及處理能力，經(jīng)濟(jì)主體的決策行為并非總是最大化的結(jié)果，其決策受到參與人所處的社會環(huán)境、過去的經(jīng)驗、日常慣例及其他人相似情形下的行為選擇等因素的影響。在有限理性條件下，由于參與人無法免費獲得決策所需要的全部信息，并且參與人即使獲得了決策所需要的全部信息也可能由于有限的計算能力而無法得出最優(yōu)決策。因此，參與人只能采取模仿、學(xué)習(xí)等簡單的直觀決策方法或一些固定的常規(guī)來進(jìn)行決策。人類的決策結(jié)果受到復(fù)雜的認(rèn)知過程的影響，不同的人或者同一個人在不同時間即使給出相同的條件也可能會得出不同的決策結(jié)果，即決策結(jié)果受到認(rèn)知過程的路徑影響。

2002年諾貝爾經(jīng)濟(jì)學(xué)獎得主之一心理學(xué)家丹尼爾·卡內(nèi)曼(Daniel Kahneman)將源于心理學(xué)的綜合洞察力應(yīng)用于研究在不確定條件下參與人的決策過程及行為結(jié)果并展示了人為決策是如何異于標(biāo)準(zhǔn)經(jīng)濟(jì)理論預(yù)測的結(jié)果。在1979年，他與有著深厚數(shù)學(xué)及哲學(xué)背景的心理學(xué)家特韋爾斯基（Tversky）提出了震撼經(jīng)濟(jì)學(xué)界的“前景理論”(Prospect theory)。他們的發(fā)現(xiàn)激勵了新一代經(jīng)濟(jì)學(xué)研究人員運用認(rèn)知心理學(xué)來研究經(jīng)濟(jì)學(xué)，使經(jīng)濟(jì)學(xué)的理論更加豐富。一個理論獲得諾貝爾經(jīng)濟(jì)學(xué)獎不僅是對獲獎?wù)哌^去成就的肯定，更主要說明了獲獎理論將會成為主流經(jīng)濟(jì)學(xué)未來的發(fā)展方向。2002年諾貝爾經(jīng)濟(jì)學(xué)獎授予給丹尼爾·卡內(nèi)曼標(biāo)志著經(jīng)濟(jì)學(xué)的研究對象從傳統(tǒng)的“經(jīng)濟(jì)人”轉(zhuǎn)向現(xiàn)實的“社會人”，經(jīng)濟(jì)學(xué)直面現(xiàn)實。如何從有限理性出發(fā)來研究參與人的行為，許多經(jīng)濟(jì)學(xué)家對之進(jìn)行了廣泛而深入的研究并提出了許多理論，在這些理論之中影響最大且受到了經(jīng)濟(jì)學(xué)界普遍接受的理論即進(jìn)化博弈理論。

2.3 進(jìn)化博弈理論的產(chǎn)生及其發(fā)展

進(jìn)化博弈理論源于對生態(tài)現(xiàn)象的解釋，1960年代生態(tài)學(xué)家Lewontin就開始運用進(jìn)化博弈理論的思想來研究生態(tài)問題。生態(tài)學(xué)家從動植物進(jìn)化的研究中發(fā)現(xiàn)，動植物進(jìn)化結(jié)果在多數(shù)情況下都可以用博弈論的納什均衡概念來解釋。然而，博弈論是研究完全理性的人類互動行為時提出來的，為什么能夠解釋根本無理性可言的動植物的進(jìn)化現(xiàn)象呢？我們知道動植物的進(jìn)化遵循達(dá)爾文“優(yōu)勝劣汰”生物進(jìn)化理論，生態(tài)演化的結(jié)果卻能夠利用博弈理論來給予合理的解釋，這種巧合意味著我們可以去掉經(jīng)典博弈理論中理性人假定的要求。另外，1960年代生態(tài)學(xué)理論研究取得突破性的進(jìn)展，非合作博弈理論研究成果也不斷涌現(xiàn)并日趨成熟，進(jìn)化博弈理論具備了產(chǎn)生的現(xiàn)實及理論基礎(chǔ)。

進(jìn)化博弈理論應(yīng)用于研究經(jīng)濟(jì)學(xué)問題在學(xué)術(shù)界曾經(jīng)引起極大的爭議，爭論的焦點在于理性假定。當(dāng)時由于理性概念在經(jīng)濟(jì)學(xué)界已經(jīng)根深蒂固。多數(shù)人認(rèn)為利用研究生態(tài)演化的進(jìn)化博弈理論來研究參與人的行為是不合適的。因為動植物行為是完全由其基因所決定的，而經(jīng)濟(jì)問題則涉及到具有邏輯思維及學(xué)習(xí)、模仿能力的理性參與人的行為，因此，借助于進(jìn)化博弈理論來研究遠(yuǎn)比動植物復(fù)雜的人類行為顯然是行不通的。但隨著心理學(xué)研究的發(fā)展及有限理性概念的提出，越來越多的經(jīng)濟(jì)學(xué)家應(yīng)用進(jìn)化博弈理論來解釋經(jīng)濟(jì)現(xiàn)象并獲得了巨大的成功，利用進(jìn)化博弈理論來研究并解釋經(jīng)濟(jì)現(xiàn)象的文獻(xiàn)大量出現(xiàn)于各種經(jīng)濟(jì)學(xué)期刊了。盡管如此，利用進(jìn)化博弈理論來解釋經(jīng)濟(jì)現(xiàn)象還是需要對該理論的基本分析框架作出相應(yīng)的調(diào)整。如果去掉參與人偏好、信念及理性假定等條件，那么參與人是如何作出決策的呢？進(jìn)化博弈理論在處理有限理性參與人決策問題時，常常假定參與人遵循某種比貝葉斯法則更簡單的行為規(guī)則，這種行為規(guī)則應(yīng)該告訴如何采取行動及如何根據(jù)經(jīng)驗來改變行為選擇，這樣參與人只要知道什么會發(fā)生，而不必知道為什么會發(fā)生。

1970年代，生態(tài)學(xué)家Maynard Smith and Price（1973）結(jié)合生物進(jìn)化論與經(jīng)典博弈理論在研究生態(tài)演化現(xiàn)象的基礎(chǔ)上而提出了進(jìn)化博弈理論的基本均衡概念----進(jìn)化穩(wěn)定策略（Evolutionarily stable stragegy ESS），目前學(xué)術(shù)界普遍認(rèn)為進(jìn)化穩(wěn)定策略概念的提出標(biāo)志著進(jìn)化博弈理論的誕生。此后，生態(tài)學(xué)家Taylor and Jonker（1978）在考察生態(tài)演化現(xiàn)象時首次提出了進(jìn)化博弈理論的基本動態(tài)概念----模仿者動態(tài)（Replicator Dynamics）。至此，進(jìn)化博弈理論有了明確的研究目標(biāo)。

1980年代以后，隨著新古典經(jīng)濟(jì)學(xué)及博弈論固有的缺陷逐漸被人們所認(rèn)識，有限理性概念得到了學(xué)術(shù)界的普遍認(rèn)可，加之進(jìn)化博弈理論在解釋生態(tài)現(xiàn)象時獲得的巨大成功，特別是經(jīng)濟(jì)學(xué)界于1992年在康奈爾大學(xué)召開的進(jìn)化博弈理論學(xué)術(shù)會議，正式確立了該理論的學(xué)術(shù)地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等經(jīng)濟(jì)學(xué)家從不同的角度對傳統(tǒng)的進(jìn)化博弈理論分析框架進(jìn)行拓展，并使之逐漸轉(zhuǎn)化為描述經(jīng)濟(jì)行為的理論。目前，進(jìn)化博弈理論的基本理論體系雖然已經(jīng)形成但還是相當(dāng)粗糙。因此，它仍然處于不斷發(fā)展和完善的階段，但該理論提供了比傳統(tǒng)理論更具現(xiàn)實性且能夠更準(zhǔn)確地解釋并預(yù)測參與人行為的研究方法，從而得到了越來越多的經(jīng)濟(jì)學(xué)家、社會學(xué)家、生態(tài)學(xué)家的重視，我們有理由相信該理論成為主流經(jīng)濟(jì)學(xué)的一部分已經(jīng)為時不遠(yuǎn)。

三、進(jìn)化博弈理論的基本內(nèi)容

進(jìn)化博弈理論結(jié)合經(jīng)典博弈理論及生態(tài)理論研究成果，并以有限理性的參與人群體為研究對象，利用動態(tài)分析方法把影響參與人行為的各種因素納入其模型之中，并以系統(tǒng)論的觀點來考察群體行為的演化趨勢。

進(jìn)化生態(tài)學(xué)與博弈論的結(jié)合至少已有三十幾年的歷史，初看起來使人覺得奇怪，因為博弈論常常假定參與人是完全理性的，而基因和其他的演化載體常常被假定是以一種完全機(jī)械的方式運動。然而一旦用參與人群體來代替博弈論中的參與者個人，用群體中選擇不同純策略的個體占群體中個體總數(shù)的百分比來代替博弈論中的混合策略，那么這兩種理論就達(dá)到了形式上的統(tǒng)一。盡管這兩種理論在形式上達(dá)到了統(tǒng)一，但進(jìn)化博弈理論與經(jīng)典博弈理論還是存在本質(zhì)區(qū)別。在進(jìn)化博弈理論中每個參與人都是隨機(jī)地從群體中抽取并進(jìn)行重復(fù)、匿名博弈，他們沒有特定的博弈對手 ④。在這種情況下，參與人既可以通過自己的經(jīng)驗直接獲得決策信息，也可以通過觀察在相似環(huán)境中其他參與人的決策并模仿而間接地獲得決策信息，還可以通過觀察博弈的歷史而從群體分布中獲得決策信息。對參與人來說，觀察群體行為的歷史即估算群體分布是非常重要的，首先，群體分布包含了對手如何選擇策略的信息。其次，通過觀察群體分布也有助于參與人知道什么是好的策略什么是不好的策略。參與人常常會模仿好的策略⑤ 而不好的策略則會在進(jìn)化過程中淘汰，模仿是學(xué)習(xí)過程中的一個重要組成部分，成功的行為不僅以說教的形式傳遞下來，而且也容易被模仿。參與人由于受到理性的約束而其行為是幼稚的（Naive），其決策不是通過迅速的最優(yōu)化計算得到，而是需要經(jīng)歷一個適應(yīng)性的調(diào)整過程，在此過程中參與人會受到其所處環(huán)境中各種確定性或隨機(jī)性因素影響。因此，系統(tǒng)均衡是達(dá)到均衡過程的函數(shù)，要更準(zhǔn)確地描述參與人行為就必須考察經(jīng)濟(jì)系統(tǒng)的動態(tài)調(diào)整過程，動態(tài)均衡概念及動態(tài)模型在進(jìn)化博弈理論中占有相當(dāng)重要的地位。

3.1 進(jìn)化博弈理論基本模型分類

進(jìn)化博弈理論的基本模型按其所考察的群體數(shù)目可分為單群體模型(Monomorphic Population Model)與多群體模型(Polymorphic Populations Model)。單群體模型直接來源生態(tài)學(xué)的研究，在研究生態(tài)現(xiàn)象時，生態(tài)學(xué)家常常把同一個生態(tài)環(huán)境中所有種群看作一個大群體，由于生物的行為是由其基因唯一確定的，因而可以把生態(tài)環(huán)境中每一個種群都程式化為一個特定的純策略。經(jīng)過這樣處理以后，整個群體就相當(dāng)于一個選擇不同純策略（純策略集的數(shù)目就相當(dāng)于群體中的種群數(shù)）的個體。群體中隨機(jī)抽取的個體兩兩進(jìn)行的都是對稱博弈，有些文獻(xiàn)中稱這類模型為對稱模型（Symmetry model）。嚴(yán)格地說，單群體時個體進(jìn)行的并不是真正意義上的博弈，博弈是在個體與群體分布所代表的虛擬參與人之間進(jìn)行。如第一部分的老鷹----鴿子博弈，該生態(tài)環(huán)境中有兩個種群老鷹與鴿子，它們代表兩個不同的純策略，用進(jìn)化方法進(jìn)行處理時認(rèn)為該生態(tài)群體中每個個體都有兩種可供選擇策略即老鷹策略與鴿子策略，此時的博弈并不是在隨機(jī)抽取的兩個個體之間進(jìn)行，而是每個個體都觀察群體狀態(tài)（選擇老鷹策略與鴿子策略個體數(shù)在群體中所占的比例），給定此狀態(tài)它就可以計算自己選擇不同策略所得的期望支付（嚴(yán)格地說這并不是期望支付，但為了說明的方便本文仍然借用該概念）進(jìn)而確定選擇哪一個策略不選擇哪一個策略，對物種而言這就意味著種群數(shù)量的增加或減少。

多群體模型是由Selten (1980)首次提出并進(jìn)行研究的，他在傳統(tǒng)單群體生態(tài)進(jìn)化模型中通過引入角色限制行為（Role Conditioned Behavior）而把對稱模型變?yōu)榱朔菍ΨQ模型。在非對稱博弈個體之間有角色區(qū)分，此時可以從大群體中區(qū)分出不同的小群體，群體中隨機(jī)抽取的個體之間進(jìn)行真正意義上的兩兩配對重復(fù)、匿名非對稱博弈，有時又稱之為非對稱模型（Asymmetry model）。如果我們把系統(tǒng)選擇博弈中的宿舍變成學(xué)校（整個學(xué)校相當(dāng)于一個大群體）而把十個人變成十個班（每一個班看成是一個小群體，且同一班的同學(xué)無角色區(qū)分即與單群體情形一樣），每個班的學(xué)生都有多種選擇，此時該校學(xué)生所進(jìn)行的計算機(jī)系統(tǒng)選擇博弈就是非對稱博弈。非對稱博弈模型并不是對單群體博弈模型的簡單改進(jìn)，由單群體到多群體涉及到一系列的如均衡及穩(wěn)定性等問題的變化。Selten(1980)證明了“在多群體博弈中進(jìn)化穩(wěn)定均衡都是嚴(yán)格納什均衡⑥ ”的結(jié)論，這就說明在多群體博弈中，傳統(tǒng)的進(jìn)化穩(wěn)定均衡概念就顯示出其局限性了。同時，在模仿者動態(tài)下，同一博弈在單群體與多群體時也會有不同的進(jìn)化穩(wěn)定均衡。

按照群體在演化過程中所受到的影響因素是確定性的還是隨機(jī)性的，進(jìn)化博弈模型可分為確定性動態(tài)模型和隨機(jī)性動態(tài)模型。確定性模型一般比較簡單并且能夠較好地描述系統(tǒng)的演化趨勢，因而，理論界對之進(jìn)行較多的研究。隨機(jī)性模型需要考慮許多隨機(jī)因素對動態(tài)系統(tǒng)的影響，一般比較復(fù)雜，但該類模型卻能夠更準(zhǔn)確地描述系統(tǒng)的行為，近年來理論界對之也進(jìn)行廣泛的探討[對隨機(jī)動態(tài)的詳細(xì)討論可以參閱這方面的經(jīng)典文獻(xiàn)Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 進(jìn)化博弈理論基本均衡概念-----進(jìn)化穩(wěn)定策略

進(jìn)化博弈理論的基本均衡概念---進(jìn)化穩(wěn)定策略⑦ [文獻(xiàn)2、5有詳細(xì)介紹]是由Maynard Smith and Price（1973）及Maynard Smith(1974)在研究生態(tài)演化問題時提出來的，其直觀思想是：如果一個群體（原群體）的行為模式能夠消除任何小的突變?nèi)后w，那么這種行為模式一定能夠獲得比突變?nèi)后w高的支付，隨著時間的演化突變者群體最后會從原群體中消失，原群體所選擇的策略就是進(jìn)化穩(wěn)定策略。系統(tǒng)選擇進(jìn)化穩(wěn)定策略時所處的狀態(tài)即是進(jìn)化穩(wěn)定狀態(tài)，此時的均衡就是進(jìn)化穩(wěn)定均衡。下面給出Maynard Smith and Price（1973）對進(jìn)化穩(wěn)定策略的定義（此后本文稱之為原初定義），用符號表示如下：

說是進(jìn)化穩(wěn)定策略，如果，存在一個<，不等式對任意都成立。其中A是群體中個體博弈時的支付矩陣；y表示突變策略；是一個與突變策略y有關(guān)的常數(shù)，稱之為侵入邊界（Invasion Barriers）；表示選擇進(jìn)化穩(wěn)定策略群體與選擇突變策略群體所組成的混合群體。實際上相當(dāng)于該吸引子對應(yīng)吸引域的半徑，也就說進(jìn)化穩(wěn)定策略考察的是系統(tǒng)落于該均衡的吸引域范圍之內(nèi)的動態(tài)性質(zhì)，而落于吸引域范圍之外是不考慮的，所以說它只能夠描述系統(tǒng)的局部動態(tài)性質(zhì)。至于系統(tǒng)是如何進(jìn)入吸引域的原初的進(jìn)化穩(wěn)定策略定義所沒有給予足夠的重視。

要準(zhǔn)確地理解進(jìn)化穩(wěn)定策略概念就必須正確理解突變者和侵入邊界的含義。我們可借助于前面的兩個例子來理解。在老鷹、鴿子博弈中，當(dāng)該生態(tài)環(huán)境中只有老鷹（或只有鴿子）時，這時系統(tǒng)已經(jīng)處于均衡狀態(tài)，但它們都是不穩(wěn)定的均衡，因為這兩個均衡都可以被突變者侵入。開始時，假定該生態(tài)環(huán)境處于老鷹均衡，如果由于某種原因而進(jìn)入鴿子時，那么隨著時間的演化，整個生態(tài)系統(tǒng)最終就會穩(wěn)定于一半為老鷹一半為鴿子的狀態(tài)，即混合策略納什均衡是進(jìn)化穩(wěn)定的。這說明該博弈中兩個純策略納什均衡是不穩(wěn)定的。因為，當(dāng)系統(tǒng)處于純策略所表示的狀態(tài)時，只要存在突變者系統(tǒng)就會離開這種狀態(tài)，所以它們都不是進(jìn)化穩(wěn)定的。相反混合策略納什均衡卻不一樣，即當(dāng)系統(tǒng)處于一半是老鷹一半是鴿子時，如果由于某種因素使得系統(tǒng)偏離該狀態(tài)，那么系統(tǒng)會自動恢復(fù)到原來狀態(tài)。另外，在系統(tǒng)選擇博弈中突變者、侵入邊界就更為明顯，所謂突變者即是指選擇進(jìn)化穩(wěn)定策略以外的策略者，且侵入邊界與不同的均衡有關(guān)。該博弈有兩個純策略納什均衡和一個混合策略納什均衡（），前一個均衡所對應(yīng)的侵入邊界就是，也就是說如果選擇操作系統(tǒng)的學(xué)生數(shù)占群體總數(shù)的比例大于（即學(xué)生數(shù)大于4），那么選擇操作系統(tǒng)的突變者就不可能侵入到該群體中，如果選擇操作系統(tǒng)的學(xué)生數(shù)占群體總的比例小于（即學(xué)生數(shù)小于4），那么選擇操作系統(tǒng)的突變者就會侵入到該群體中而原來選擇操作系統(tǒng)的學(xué)生會轉(zhuǎn)而學(xué)習(xí)操作系統(tǒng)。

最初進(jìn)化穩(wěn)定策略定義有比較苛刻的條件限制，如單群體、群體中個體數(shù)目無限大、系統(tǒng)只受到不連續(xù)且互不重疊沖擊的影響等。這些條件大大地限制該定義的應(yīng)用，隨著學(xué)術(shù)界對進(jìn)化博弈理論研究的深入，許多理論家們從不同的角度對最初定義進(jìn)行了拓展，如Selten 1980首次給出了適應(yīng)于描述多群體均衡的定義；Schaffer 1988首次給出了適應(yīng)于描述有限規(guī)模群體的均衡定義；Foster and Young（1990）首次給出了適應(yīng)于描述連續(xù)隨機(jī)系統(tǒng)的均衡定義等等（有關(guān)對進(jìn)化穩(wěn)定策略進(jìn)行拓展的討論見文獻(xiàn)[5]）。最初定義是在解釋生態(tài)現(xiàn)象時提出來的，如果進(jìn)行經(jīng)濟(jì)分析，時需要進(jìn)行相應(yīng)的改變。在分析生態(tài)現(xiàn)象時，把每一個種群的行為都程式化為一個策略，因此進(jìn)化的結(jié)果將會是突變種群的消失（消失的原因在于生物的行為是由其遺傳基因唯一確定的）。如果用于經(jīng)濟(jì)分析，那么進(jìn)化的結(jié)果將是那些選擇突變策略的個體最終會改變策略而選擇進(jìn)化穩(wěn)定策略（因為人類可以通過學(xué)習(xí)、模仿等來改變自己所選擇的策略）。

經(jīng)典博弈理論中的核心概念納什均衡即是指一種策略組合，在該策略組合下任何個人單獨偏離都不會變得比不偏離好。納什均衡是一個靜態(tài)概念，不能描述系統(tǒng)的動態(tài)性質(zhì)，用數(shù)學(xué)語言來說它是動態(tài)系統(tǒng)的不動點，納什的成功就是在于他應(yīng)用拓?fù)鋵W(xué)的不動點定理證明了納什均衡的存在性。進(jìn)化穩(wěn)定策略必定是納什均衡策略，它是納什均衡的精練，文獻(xiàn)[3]對此有詳細(xì)的介紹。在進(jìn)化穩(wěn)定策略的定義中引入突變者及侵入邊界使之能夠更好地描述系統(tǒng)的局部動態(tài)性質(zhì)。第一部分的兩個例子中，按照納什均衡的概念是無法得知兩個系統(tǒng)最終會選擇哪一個均衡，但利用進(jìn)化穩(wěn)定策略卻可以說明系統(tǒng)最終會穩(wěn)定哪一個均衡并可以分析系統(tǒng)達(dá)到不同均衡的條件，在某種程度上，較好地解決了多重均衡選擇問題。

3.3 進(jìn)化博弈理論基本動態(tài)概念----模仿者動態(tài)

進(jìn)化博弈理論來源于生態(tài)學(xué)的研究，該理論基本上從“優(yōu)勝劣汰”的進(jìn)化論觀點來看待群體行為的調(diào)整過程。一般的進(jìn)化過程都包括兩個可能的行為演化機(jī)制：選擇機(jī)制(Selection Mechanism)和突變機(jī)制（Mutation mechanism）。選擇機(jī)制是指本期中能夠獲得較高支付的策略，在下期被更多參與者選擇；突變是指參與者以隨機(jī)（無目的性）的方式選擇策略，因此突變策略可能獲得較高支付也可能獲得較低支付，突變一般很少發(fā)生。新的突變也必須經(jīng)過選擇，并且只有獲得較高支付的策略才能生存（Survive）下來。進(jìn)化博弈理論需要解決的關(guān)鍵問題就是如何描述群體行為的這種選擇機(jī)制和突變機(jī)制。博弈理論家對群體行為調(diào)整過程進(jìn)行了廣泛而深入的研究，由于他們考慮問題的角度不同，對群體行為調(diào)整過程的研究重點也就不同，因而提出了不同的動態(tài)模型，如Weibull(1995) 提出的模仿動態(tài)（Imitation Dynamics）模型，認(rèn)為人們常常模仿其他人的行為尤其是能夠產(chǎn)生較高支付的行為；Börgers and Sarin(1995，1997)等提出并應(yīng)用強(qiáng)化動態(tài)（Reinforcement Dynamics）來研究現(xiàn)實中參與人的學(xué)習(xí)過程；Skyrms (1986) 引入了意向動態(tài)（Deliberational Dynamics）模型對哲學(xué)中的理性問題進(jìn)行了討論；Swinkels(1993)提出了近似調(diào)整動態(tài)（Myopic Adjustment Dynamics）；Borgers and Sarin(1995)提出了刺激—反應(yīng)動態(tài)（Stimulus-Response Dynamics）等等。到目前為止，在進(jìn)化博弈理論中應(yīng)用得最多的還是由Taylor and Jonker(1978)在對生態(tài)現(xiàn)象進(jìn)行解釋時首次提出描述單群體動態(tài)調(diào)整過程的模仿者動態(tài)（Replicator Dynamics）。所謂模仿者動態(tài)是指使用某一策略人數(shù)的增長率等于使用該策略時所得的支付與平均支付之差。下面就給出Taylor and Jonker（1978）提出的模仿者動態(tài)的微分形式：

化的而且因素之間的互動作用也是需要時間的。因此，均衡只是一種暫時現(xiàn)象或者在多數(shù)情況下，系統(tǒng)根本不可能達(dá)到的現(xiàn)象，要更準(zhǔn)確地考察參與人的行為就必須運用系統(tǒng)論的觀點，把行為互動性、因素互動性及時間因素納入到其模型之中。

5.2 經(jīng)典博弈理論的策略互動分析法及其缺陷

考慮到新古典經(jīng)濟(jì)學(xué)沒有把參與人行為之間的互動關(guān)系納入到其模型之中，經(jīng)典博弈理論則在理性人假定的基礎(chǔ)上把參與人行為的互動關(guān)系納入到其模型之中進(jìn)一步考察了參與人的決策問題。在我國，對人類互動行為的研究至少可以追溯到三國時期田賽馬的故事，但作為一種正式理論提出來，一般認(rèn)為是始于馮·諾意曼和摩根斯藤（Von Neumann and O. Morgenstern, 1944）出版的《博弈論與經(jīng)濟(jì)行為》一書，直到納什（Nash 1950）在研究非合作博弈的基礎(chǔ)上提出著名的納什均衡（Nash Equilibrium）概念才使得博弈論成為一門完整的理論。經(jīng)過近五十年的發(fā)展，終于在1994年，三位杰出的博弈論大師：納什（John F. Nash）、澤爾藤（Rechard Selten）和海薩尼(John C. Harsanyi)獲得了經(jīng)濟(jì)學(xué)的最高榮譽——諾貝爾經(jīng)濟(jì)學(xué)獎，在全球經(jīng)濟(jì)學(xué)界再次掀起了對博弈論的研究熱潮。經(jīng)典博弈論為社會科學(xué)提供了一個新的研究視角，使我們能夠以全新的方法來處理各種沖突與合作的問題。博弈論作為一種理論工具，其應(yīng)用相當(dāng)廣泛。在信息經(jīng)濟(jì)學(xué)中得到了充分的應(yīng)用，1996年諾獎得主Mirrlees等、2001年諾獎得主Akerlof等都對信息經(jīng)濟(jì)學(xué)研究作出了卓越的貢獻(xiàn)。這充分說明了博弈論在經(jīng)濟(jì)學(xué)的地位可見一斑。

經(jīng)典博弈理論的核心概念----納什均衡就是由普林斯頓大學(xué)數(shù)學(xué)家納什在研究非合作博弈時提出來的。納什均衡即是指給定其他參與人選擇的情況下，每一個人單獨偏離均衡都不會變得比不偏離好，顯然納什均衡是一個靜態(tài)均衡概念。經(jīng)典博弈理論盡管把參與人的互動行為引入到其模型之中，并認(rèn)為現(xiàn)實中參與人不是孤立地作出自己的決策，每一個參與人的決策不僅依賴于其自身所面臨的條件及其所擁有的信息，而且也依賴于其他參與人的決策選擇。但該理論卻面臨著其自身無法克服的缺點。首先，博弈論中的互動是一種“沉默互動⑨ ”，這種互動不允許參與人之間存在任何形式的交流，即假定參與人都是一個個只會理性計算的孤立經(jīng)濟(jì)人而非社會人，一旦引入社會互動，許多博弈都無法進(jìn)行分析，也就是說經(jīng)典博弈理論中的互動并不“社會互動”而是孤立的“沉默互動”。其次，博弈論的基本均衡概念納什均衡要求博弈各方都是理性的，并且理性是共同知識，博弈時如果某一方選擇了非理，那么博弈就無法進(jìn)行下去。特別地該理論在利用后向歸納法（Backward Induction）對納什均衡進(jìn)行精練時，不但要求參與人完全理性，而且還要求參與人的行為滿足序貫理性（Sequential Rationality）要求。這一比理性更強(qiáng)的要求使得博弈論更加遠(yuǎn)離現(xiàn)實人。再次，在處理參與人所面臨的不確定性時，不僅要求各參與人知道世界的各種狀態(tài)，而且要求參與人知道每一種狀態(tài)所出現(xiàn)的概率，并且給定一個先念信念，當(dāng)出現(xiàn)任何新信息時，每個參與人都能夠應(yīng)用貝葉斯法則修正自己的先念信念，也就是說參與人不但具有很強(qiáng)的計算、推理能力，而且能夠在一個大的狀態(tài)空間上應(yīng)用貝葉斯法則解決相當(dāng)復(fù)雜的問題?，F(xiàn)實中多數(shù)情況下，參與人并不都具有這種計算、推理能力。最后，博弈論碰到了其最棘手的問題就是多重均衡的處理，當(dāng)博弈出現(xiàn)多重均衡特別是多重嚴(yán)格納什均衡時，盡管許多理論家提出了一些方法（Selten（1965）提出的子博弈精煉納什均衡概念，Selten（1975）提出的顫抖手精練納什均衡，Kerps—wilson(1982)提出的序貫均衡，Schelling（1960）提出的聚點均衡等）來處理多重均衡問題，但始終沒能獲得一致認(rèn)可的結(jié)論。

與新古典經(jīng)濟(jì)學(xué)相比，經(jīng)典博弈理論雖然在其模型中納入了行為的“沉默互動”關(guān)系，但該理論給出的研究方法仍然沒能跳出新古典經(jīng)濟(jì)學(xué)的均衡分析框架，這種只注重結(jié)果而忽略達(dá)到結(jié)果的過程的分析方法依然把對經(jīng)濟(jì)系統(tǒng)的影響因素都看作為一個個孤立因素，依然認(rèn)為影響因素與決策結(jié)果是一一對應(yīng)的關(guān)系，依然沒能把參與人所處社會環(huán)境等因素納入到其模型之中，因而不能準(zhǔn)確地描述現(xiàn)實中人的決策行為，其結(jié)論也僅僅具有理論意義而缺乏政策含義。

5.3 進(jìn)化博弈理論局部動態(tài)分析方法的現(xiàn)實性

進(jìn)化博弈理論利用達(dá)爾文“優(yōu)勝劣汰”的生物進(jìn)化論、經(jīng)典博弈理論并結(jié)合心理學(xué)的研究成果，從西蒙提出有限理性（Bounded Rationality）的參與人群體出發(fā)，通過對群體行為的研究進(jìn)一步得出參與人個體的行為。進(jìn)化博弈理論跨越了完全理性的“經(jīng)濟(jì)人”與有限理性的“社會人”的鴻溝，實現(xiàn)了經(jīng)濟(jì)學(xué)研究方法革命性的突破。與傳統(tǒng)均衡分析法相比，進(jìn)化博弈理論的局部動態(tài)分析方法在以下幾個方面獨具特色。

5.3.1 局部動態(tài)分析法的均衡觀

傳統(tǒng)的均衡分析方法認(rèn)為完全理性參與人能夠?qū)Νh(huán)境的任何變化作出迅速的最優(yōu)反應(yīng)，因而，經(jīng)濟(jì)系統(tǒng)是常常處于均衡狀態(tài)的，分析參與人的行為只需要研究均衡結(jié)果，并以此來預(yù)測經(jīng)濟(jì)人的行為，通過比較不同均衡結(jié)果來尋找系統(tǒng)達(dá)到均衡的條件。這種處理方法為了數(shù)學(xué)上處理的方便而撇開現(xiàn)實中“因素互動”而分別考察單個因素對均衡的影響，使得理論更加缺乏現(xiàn)實基礎(chǔ)。進(jìn)化博弈理論則完全摒棄傳統(tǒng)理論中非現(xiàn)實的“理性人”假定，直接從有限理性參與人群體出發(fā)而提出的一種全新的研究方法----局部動態(tài)法。局部動態(tài)法把經(jīng)濟(jì)系統(tǒng)達(dá)到均衡結(jié)果的過程納入到其模型之中，認(rèn)為經(jīng)濟(jì)系統(tǒng)達(dá)到均衡需要一個長期的漸進(jìn)過程，均衡結(jié)果依賴于達(dá)到均衡的過程，也就是說任何一個結(jié)果都是路徑依賴的，它與混沌經(jīng)濟(jì)學(xué)完全動態(tài)的研究方法具有某種程度的相似之處。

5.3.2 局部動態(tài)法的時間觀

傳統(tǒng)的均衡分析法并沒有納入因素互動關(guān)系并且理性計算是不需要時間的，所以得出經(jīng)濟(jì)系統(tǒng)常常是均衡的結(jié)論。進(jìn)化博弈理論的局部動態(tài)法一個顯著特征就是把參與人的決策過程時間及因素互動的時間納入到其基本模型之中，強(qiáng)調(diào)系統(tǒng)達(dá)到均衡的過程，并認(rèn)為經(jīng)濟(jì)系統(tǒng)由于受到各種互動行為及互動因素的影響，有些系統(tǒng)達(dá)到均衡可能只需要很短的時間，有些系統(tǒng)達(dá)到均衡可能需要很長的時間，有些系統(tǒng)可能無法達(dá)到均衡。時間因素對經(jīng)濟(jì)學(xué)研究有著非常重要的意義，如均衡分析法無法考慮宏觀經(jīng)濟(jì)政策中“時滯”使得許多實施時有效的政策在發(fā)生作用時卻出現(xiàn)了與原意相反的結(jié)果。時間是度量政策效率的一個很重要的因素，如果不考慮時間因素有些政策可能很有效率，但納入時間因素，一些需要太長時間才能使系統(tǒng)達(dá)到意愿均衡的政策可能根本就沒有效率。進(jìn)化博弈理論把時間納入到模型分析中并充分應(yīng)用數(shù)學(xué)中的相圖來描述經(jīng)濟(jì)系統(tǒng)達(dá)到均衡的路徑，這樣有利于決策者控制經(jīng)濟(jì)系統(tǒng)使之朝向既定的目標(biāo)前進(jìn)，也有利于決策者尋找能夠最大限度地促進(jìn)系統(tǒng)向意愿均衡轉(zhuǎn)化的因素，使系統(tǒng)盡快達(dá)到有效率的均衡。

5.3.3 局部動態(tài)法的均衡選擇觀

新古典經(jīng)濟(jì)學(xué)研究的邏輯有理性就有均衡，然后在既定均衡下通過對不同均衡的比較來尋找系統(tǒng)達(dá)到不同均衡的條件，即比較靜態(tài)法，最后結(jié)合條件找出希望達(dá)到的均衡，因此，該理論不存在真正意義的均衡選擇問題。經(jīng)典博弈理論提供的分析方法在多數(shù)情況下都存在其自身所無法處理的多重均衡問題。如老鷹與鴿子博弈及系統(tǒng)選擇博弈中多重均衡問題。進(jìn)化博弈理論的局部動態(tài)法引入突變因素就能夠較好地解決了多重均衡的選擇問題，在老鷹與鴿子博弈中，盡管全是老鷹（全是鴿子）都是均衡的，但這兩個均衡都極不穩(wěn)定即都不是進(jìn)化穩(wěn)定均衡，一旦有鴿子（老鷹）突變者進(jìn)入該系統(tǒng)就會使系統(tǒng)偏離，隨著時間的推移而使得系統(tǒng)趨向于混合策略進(jìn)化穩(wěn)定均衡即一半鴿子一半老鷹（該均衡是一個全局吸引子）；在系統(tǒng)選擇博弈中經(jīng)典博弈理論無法解釋系統(tǒng)最終會趨于哪一個均衡，局部動態(tài)法引入了突變因素就能夠很好地解決了均衡選擇問題，即系統(tǒng)最終會趨于哪一個均衡依賴于系統(tǒng)的初始狀態(tài)即路徑依賴。進(jìn)化博弈理論的基本均衡概念----進(jìn)化穩(wěn)定均衡描述的是當(dāng)經(jīng)濟(jì)系統(tǒng)一旦進(jìn)入到某一均衡的吸引域內(nèi)時，系統(tǒng)就會對其他的突變策略具有一定程度（即在突變邊界內(nèi)）的抵抗力。

5.3.4 局部動態(tài)法的特殊性

新古典經(jīng)濟(jì)學(xué)與經(jīng)典博弈理論均衡分析法都是以單個消費者、單個生產(chǎn)者、單個市場為研究對象來考察參與人的最優(yōu)決策行為，并由此研究整個社會的資源配置問題。然而它們卻碰到了如何由個體行為轉(zhuǎn)化到群體行為的困難，因為這種轉(zhuǎn)化過程涉及到各種互動因素的影響。一個明顯的例子是經(jīng)典博弈理論中囚徒困境博弈，在該博弈中兩個囚徒都從個體理性出發(fā)，但得到了集體非理性均衡的結(jié)論。也就是說，均衡分析法根本無法實現(xiàn)從個體行為向集體行為的過渡，在此框架內(nèi)尋找宏觀經(jīng)濟(jì)的微觀基礎(chǔ)的困難是非常大的。進(jìn)化博弈理論的局部動態(tài)法則從人的社會性出發(fā)，利用系統(tǒng)論的處理方法來看待參與人的決策行為。該理論直接以參與人的群體為其研究的邏輯起點，在考慮到影響參與人行為的社會因素、文化因素、民族習(xí)俗及個體生活習(xí)慣等因素的基礎(chǔ)上進(jìn)一步考察群體中有限理性個體的行為互動關(guān)系，很巧妙地避開由個體行為向集體行為轉(zhuǎn)化問題，因而能夠更加真實地反應(yīng)現(xiàn)實人的決策過程及其決策結(jié)果。

六、結(jié)論

進(jìn)化博弈理論是經(jīng)濟(jì)學(xué)領(lǐng)域的前沿理論，它來源于對生態(tài)現(xiàn)象的研究，雖然該理論應(yīng)用于經(jīng)濟(jì)分析的時間不長，但它為經(jīng)濟(jì)學(xué)研究提供了一個全新的分析方法，較好地克服了新古典經(jīng)濟(jì)學(xué)及經(jīng)典博弈理論中理性假定及多重均衡的困難。并且，應(yīng)用進(jìn)化博弈理論來研究經(jīng)濟(jì)系統(tǒng)能夠獲得比傳統(tǒng)理論更準(zhǔn)確的結(jié)果，能夠更加現(xiàn)實地解釋經(jīng)濟(jì)現(xiàn)象，因而在短期內(nèi)為多數(shù)經(jīng)濟(jì)學(xué)家所接受。從某種意義上說引入進(jìn)化博弈理論局部動態(tài)法來分析經(jīng)濟(jì)中參與人的行為是經(jīng)濟(jì)學(xué)研究方法的一次創(chuàng)新。

注釋： ①本文把源于馮·諾意曼和摩根斯藤經(jīng)納什發(fā)展而成的博弈理論稱之為經(jīng)典博弈理論。 ②即無性生殖，這樣假定的意思就是說后代繼承其母體的策略，并且永遠(yuǎn)不改變，當(dāng)然用于研究人類的行為時，需要作相應(yīng)的調(diào)整。 ③所謂近視調(diào)整即是指參與人不管未來怎么樣，只知道使當(dāng)前的支付最大化 ④ 經(jīng)典博弈理論中每一個參與人都有特定的博弈對象，并且，在重復(fù)動態(tài)博弈中，后行動者通過觀察先行動者的理而利用貝葉斯法則來修正自己的先念信念，然后，在此信念下選擇使自己獲得最大支付的策略。 ⑤好的策略即是指能夠獲得較高支付的策略。 ⑥所謂嚴(yán)格納什均衡即是嚴(yán)格占優(yōu)納什均衡。給定對手選擇的情況下，每個人都通過選擇嚴(yán)占優(yōu)的策略而組成的納什均衡。 ⑦事實上，這與Selten提出的顫抖手均衡概念具有相似性，所謂顫抖手均衡是指一個戰(zhàn)略組合，只有當(dāng)它在允許所有參與人都可能犯錯誤時仍是每一個參與人的最優(yōu)戰(zhàn)略的組合時才是一個均衡，其嚴(yán)格定義可以參閱張維迎的《博弈論與信息經(jīng)濟(jì)學(xué)》。其中的顫抖或者犯錯誤與進(jìn)化穩(wěn)定策略中的突變因素有差不多的含義，但它們之間存在本質(zhì)上的不同。 ⑧由模仿者動態(tài)方程進(jìn)行支付變換，可得。 ⑨這一點我們可以從博弈論一個著名的捐款----回贈實驗中看出，募捐者要求每一個人都自愿捐款，最終募捐者以3倍于捐款總額的錢平均分派給每個捐款者，為了使得博弈能夠分析下去，募捐者要求自愿捐款時每個人都不得與其他人討論，否則該博弈就無法進(jìn)行下去，因此，本文稱博弈論中的互動是一種沉默互動而非社會互動。這個實驗充分體現(xiàn)了古典經(jīng)濟(jì)學(xué)及博弈論研究對象上的一致性，即它們都是研究單個個體的行為而排除了人的一個重要特征----社會性。參考文獻(xiàn)

[1] 王則柯（1999）：《博弈論平話》，中國經(jīng)濟(jì)出版社。

[2] 張維迎（1999）：《博弈論與信息經(jīng)濟(jì)學(xué)》，上海三聯(lián)出版社。

[3] 張良橋，馮從文（2001）：《進(jìn)化穩(wěn)定均衡與納什均衡：兼談進(jìn)化博弈理論的發(fā)展》，《經(jīng)濟(jì)科學(xué)》，3，103-111。

[4] 張良橋（2001）：《理性與有限理性：論經(jīng)典博弈理論與進(jìn)化博弈理論之關(guān)系》，《世界經(jīng)濟(jì)》，8，74-78。

[5] 張良橋（2003）：《論進(jìn)化穩(wěn)定策略》，《經(jīng)濟(jì)評論》，2，70-74。

[6] 張良橋，郭立國（2003）：《論模仿者動態(tài)》，《中山大學(xué)學(xué)報自然科學(xué)版》，3。

[7] 楊小凱（2000）：《新興古典經(jīng)濟(jì)學(xué)和超邊際分析》，中國人民大學(xué)出版社。

[8] 青木昌彥, 奧野正寬(1999):《經(jīng)濟(jì)體制的比較制度分析》, 魏加寧等譯, 北京: 中國發(fā)展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

篇3

[中圖分類號] F270.7 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1673 - 0194（2013）12-0052-03

0 序言

低碳經(jīng)濟(jì)是為了為應(yīng)對全球氣候變化而提出的經(jīng)濟(jì)發(fā)展模式，核心是能源技術(shù)和減排技術(shù)創(chuàng)新、產(chǎn)業(yè)結(jié)構(gòu)和制度創(chuàng)新以及人類生存發(fā)展觀念的根本性轉(zhuǎn)變。因此，“高效率、低能耗、低污染、低排放”的經(jīng)濟(jì)模式對供應(yīng)鏈成員企業(yè)提出了更高的要求，實現(xiàn)供應(yīng)鏈的低碳化發(fā)展是一個重要的形式和途徑。如何使企業(yè)實施低碳供應(yīng)鏈管理的行為成為當(dāng)下必須解決的問題，由于傳統(tǒng)供應(yīng)鏈仍存在利潤空間，供應(yīng)鏈低碳化過程中必然出現(xiàn)傳統(tǒng)供應(yīng)鏈與低碳供應(yīng)鏈間的競爭與協(xié)作，煤炭和電力是兩種主要的能源形式，兩者同時又是碳排放較多的企業(yè)，因此研究煤電企業(yè)供應(yīng)鏈之間的低碳化演進(jìn)路徑具有較為重要的意義。

1 文獻(xiàn)綜述

現(xiàn)階段關(guān)于煤電企業(yè)供應(yīng)鏈的研究主要涉及煤電企業(yè)供應(yīng)鏈合作與沖突、煤電價格聯(lián)動博弈及煤電企業(yè)縱向聯(lián)盟博弈。包建華[1] （2002）提出可以通過建立戰(zhàn)略聯(lián)盟，獲取競爭優(yōu)勢，運用博弈論方法構(gòu)造了聯(lián)盟的利益分配模型，并給出了解；王曉曄[2]（2007）對煤電價格聯(lián)動進(jìn)行了博弈論分析；趙曉麗[3]（2008）研究了煤電企業(yè)供應(yīng)鏈合作沖突規(guī)制，認(rèn)為自我規(guī)制可以通過可自執(zhí)行協(xié)議模型和借鑒“關(guān)系性租金最大化”解決合作沖突問題；劉慷[4]（2009）建立了中國煤電企業(yè)縱向戰(zhàn)略聯(lián)盟的重復(fù)博弈模型，從構(gòu)建信用機(jī)制的角度分析約束煤、電企業(yè)縱向戰(zhàn)略聯(lián)盟穩(wěn)定性的內(nèi)外部因素。模型結(jié)果表明，煤炭、發(fā)電企業(yè)可建立長期戰(zhàn)略聯(lián)盟，實現(xiàn)煤、電上下游產(chǎn)業(yè)的協(xié)調(diào)發(fā)展，限制相關(guān)企業(yè)的道德風(fēng)險與機(jī)會主義行為；李麗[5]（2011）建立博弈模型對煤電企業(yè)是否聯(lián)營與煤電價格聯(lián)動的收益進(jìn)行定量分析，證明了煤電價格聯(lián)動方案使電力成本壓力得到緩解；張偉[6]（2009）進(jìn)行了煤炭產(chǎn)業(yè)鏈穩(wěn)定機(jī)制的博弈模型分析。

針對企業(yè)低碳供應(yīng)鏈研究尚處于概念提出和碳成本對供應(yīng)鏈性能影響方面，Bojarski[7]等（2009）采用LCA生命周期評估法衡量了整個供應(yīng)鏈在加進(jìn)環(huán)境因素后考慮的成本，降低了賦值主觀性，并給出了基于上述成本的供應(yīng)鏈設(shè)計模型和供應(yīng)鏈環(huán)境模型；Cholette[8]等（2009）基于紅酒分銷物流選擇的案例對碳及能線圖（energy profile）進(jìn)行分析，提出不同的供應(yīng)鏈結(jié)構(gòu)設(shè)計對于整體能源和碳排放有很大影響，Balan[9]等（2010）運用拉格朗日盒模型和歐拉盒模型對供應(yīng)鏈建模，計算碳排放量，運用解析有限差分法，基于一個最典型的供應(yīng)商、制造商、倉儲和物流提供商的模型，估算碳三維無限足跡，并依據(jù)從公共服務(wù)網(wǎng)站上獲得的基礎(chǔ)數(shù)據(jù)計算出供應(yīng)鏈中每一階段產(chǎn)生的碳排放數(shù)量，有效跟蹤碳產(chǎn)生途徑、為優(yōu)化供應(yīng)鏈碳排放建立了量化方法；錢宇[10]（2010）提到NIKE、IKEA及Boeing等公司都積極倡導(dǎo)低碳供應(yīng)鏈。

上述研究集中于煤電企業(yè)合作與沖突博弈及碳排放對供應(yīng)鏈的影響和低碳供應(yīng)鏈績效評價，而對企業(yè)供應(yīng)鏈低碳化進(jìn)程中出現(xiàn)的傳統(tǒng)供應(yīng)鏈與低碳供應(yīng)鏈并存的問題以及其演進(jìn)路徑缺乏研究，這表明企業(yè)供應(yīng)鏈低碳化理論方法體系尚不完整。因此，對煤電企業(yè)供應(yīng)鏈低碳演進(jìn)路徑進(jìn)行演化博弈分析，找出演進(jìn)路徑，為供應(yīng)鏈研究引入新的視角。

2 演化博弈理論及博弈模型構(gòu)建

2.1 演化博弈理論介紹

4 結(jié) 論

本文利用演化博弈理論對煤電企業(yè)低碳供應(yīng)鏈演進(jìn)路徑進(jìn)行了分析，結(jié)果表明企業(yè)由傳統(tǒng)供應(yīng)鏈向低碳供應(yīng)鏈演進(jìn)的動力主要取決于博弈雙方的支付矩陣、雙方所支付的另一方進(jìn)行低碳供應(yīng)鏈演進(jìn)的損失，只有當(dāng)雙方都采取低碳演進(jìn)策略時，整個煤電供應(yīng)鏈才會實現(xiàn)低碳化，而且其收益也越大。反之，系統(tǒng)運行處于不穩(wěn)定狀態(tài)，不利于煤電供應(yīng)鏈的可持續(xù)發(fā)展，但是對于雙方所支付的低碳供應(yīng)鏈演進(jìn)的損失及政府應(yīng)當(dāng)進(jìn)行的激勵和懲罰機(jī)制本文未進(jìn)行深入討論。

主要參考文獻(xiàn)

[1]包建華.煤電冶產(chǎn)業(yè)戰(zhàn)略聯(lián)盟及其利益分配的博弈分析[J].運籌與管理，2002，11（5）：106-110.

[2]王曉曄.煤電價格聯(lián)動的博弈論分析[J].西安電子科技大學(xué)學(xué)報：社會科學(xué)版，2007（5）：106-110.

[3]趙曉麗.煤電企業(yè)供應(yīng)鏈合作沖突規(guī)制模型[J].中國管理科學(xué)，2008（4）：106-110.

[4]劉慷.中國煤電企業(yè)縱向戰(zhàn)略聯(lián)盟的博弈分析[J]. 吉林工商學(xué)院學(xué)報，2009（5）：11-15.

[5]李麗.煤電一體化趨勢下煤電聯(lián)營的博弈分析[J].中國煤炭，2011（1）：29-32.

[6]張偉.煤炭產(chǎn)業(yè)鏈穩(wěn)定機(jī)制的博弈模型分析[J].煤炭經(jīng)濟(jì)研究，2009（11）：54-56.

篇4

中圖分類號：F42 文獻(xiàn)標(biāo)識碼：A

原標(biāo)題：基于進(jìn)化博弈理論對我國車載DVD行業(yè)的市場分析

收錄日期：2011年12月26日

一、我國車載DVD行業(yè)發(fā)展歷程概述

車載電子產(chǎn)品是一類新興的汽車電子產(chǎn)品，主要作用包括提高汽車的娛樂性、為駕駛員和乘客提供各類信息，以及提高汽車通信能力等。就目前來看，汽車上主要應(yīng)用的車載電子產(chǎn)品有：GPS、車載電視、車載DVD、車載MP3、車載音響、TPMS、車載通信系統(tǒng)、車載網(wǎng)絡(luò)系統(tǒng)、CarPC等。就車載DVD產(chǎn)品來看：在行業(yè)發(fā)展初期，產(chǎn)品價位高市場認(rèn)知度低，普及率較低；隨著時間的延續(xù)和經(jīng)濟(jì)的發(fā)展，汽車相關(guān)產(chǎn)業(yè)快速發(fā)展。同時，生產(chǎn)廠商的增加，產(chǎn)品數(shù)量的增大使車載DVD的價位逐漸下降，市場普及率逐漸提高。

二、我國車載DVD行業(yè)發(fā)展的經(jīng)濟(jì)學(xué)理論模型

（一）基本理論――有限理性和進(jìn)化博弈。在博弈理論中，將理性分為完全理性和有限理性。其中，完全理性是指那種具有完美的理性意識、行為準(zhǔn)確的理性經(jīng)濟(jì)人，而與之相對的有限理性則是指理性程度高但偶爾犯錯誤的正常人。進(jìn)化博弈就是有限理性博弈方的博弈，這種博弈對均衡穩(wěn)定性存在一定程度的偏差，但經(jīng)過一段時間的調(diào)整就可以獲得均衡的博弈。

（二）基本理論――最優(yōu)反映動態(tài)博弈與復(fù)制動態(tài)博弈。進(jìn)化博弈中的最優(yōu)反應(yīng)動態(tài)博弈是指那些能迅速調(diào)整策略的有限理性博弈方的動態(tài)策略調(diào)整，他們通常會采用針對上次博弈對方策略的最優(yōu)對策。復(fù)制動態(tài)博弈是對優(yōu)勢策略僅具有簡單模仿能力的有限理性博弈方所使用的動態(tài)策略調(diào)整機(jī)制，這一機(jī)制的核心是在群體中采用較為成功的策略（比平均水平較好的策略）的個體逐漸增加。

（三）進(jìn)化博弈典型模型――鷹鴿博弈（表1）

在鷹鴿博弈模型中，鷹代表戰(zhàn)爭，是市場中較為強(qiáng)勢的廠商經(jīng)常使用的策略。這類廠商在市場中或者占據(jù)較大市場份額，或者擁有較為雄厚的資本和自主品牌，多為某行業(yè)的龍頭老大或領(lǐng)軍企業(yè)；鴿代表和平，是較為平和的市場策略。一些進(jìn)入某一行業(yè)較晚的廠商或者產(chǎn)品處于成熟階段的廠商往往傾向于采取這一策略。模型中，V代表收益，是廠商執(zhí)行某一市場策略成功所獲取的利益；C代表成本，是策略失敗所付出的代價或成本，而博弈各方勝敗概率假設(shè)均為1/2。

三、基于進(jìn)化博弈理論對車載DVD行業(yè)的分析

車載DVD行業(yè)形成初期，市場上存在的廠商數(shù)量較少，產(chǎn)品品種有限，參加博弈的博弈方數(shù)量較少；而當(dāng)車載DVD產(chǎn)品逐漸為消費者所熟知，有越來越多的生產(chǎn)廠商進(jìn)入到這一市場來，瓜分市場份額，此時的博弈方也大幅增加，眾多廠商便可以分為兩個大的博弈群體：早期進(jìn)入市場的擁有相對較大市場份額的廠商和待市場較為成熟才進(jìn)入市場企圖瓜分市場份額的廠商，我們可以稱之為守擂者和攻擂者?；谝陨显颍囕dDVD行業(yè)發(fā)展歷程正好與上述鷹鴿博弈分析方法的適用背景相符合，因此可以運用進(jìn)化博弈中的鷹鴿博弈分析方法對我國車載DVD行業(yè)進(jìn)行分析：

（一）市場形成初期博弈分析

1、模型背景。車載DVD市場形成初期，競爭廠商數(shù)量較少，新產(chǎn)品上市價格較高，同時新產(chǎn)品前期成本主要為研發(fā)成本和生產(chǎn)成本。假設(shè)博弈方只有兩家廠商分別是廠商一和廠商二，收益V為8，成本C為4，博弈雙方勝敗的概率均為1/2。

2、建立模型

（1）鷹鴿博弈基本模型（表2）

（2）期望得益與平均期望得益。設(shè)X：采用“鷹”策略博弈方的比例；1-X：采用“鴿”策略博弈方的比例。所以，期望得益：

ux=x?2+（1－x）?8，u1-x=x?0+（1-x）?4

平均期望得益：

■=x?ux+（1-x）u1-x

=x［2x+8（1-x）］+（1-x）［4（1-x）］=4-2x2

隨著時間的推移，越來越多的廠商模仿鷹策略，想要賺取更多收益，所以有：

dx/dt=x?（ux-■）

=2x3-6x2+4x=2x（x－1）（x-2）

隨著復(fù)制動態(tài)過程的持續(xù)，采用兩種策略的博弈方比例不再發(fā)生變化，博弈達(dá)到穩(wěn)定狀態(tài)，此時dx/dt，即x=0，1，2。

根據(jù)微分方程的“穩(wěn)定性”定理可以求出進(jìn)化穩(wěn)定策略下達(dá)到穩(wěn)定狀態(tài)時“鷹”策略博弈方的比例。

設(shè)dx/dt＝F（x），隨著時間t增加，x的變動逐漸減小，達(dá)到穩(wěn)定狀態(tài)的x*使得F'（x*）＜0。由此，dx/dt＝F（x）=2x3-6x2+4x，得F'（x*）=6x2-12x+4，而穩(wěn)定狀態(tài)下dx/dt=0的得益x*=0，1，2，帶入F'（x*）。得F'（0）＝4＞0，F(xiàn)'（1）＝－2＜0，F(xiàn)'（2）＝4＞0。

（3）結(jié)論。在進(jìn)化穩(wěn)定策略下，達(dá)到穩(wěn)定狀態(tài)時的x*=1，說明鷹策略的博弈方數(shù)量穩(wěn)定在1的水平。

（二）產(chǎn)品市場成熟期博弈分析

1、模型背景。車載DVD市場逐漸成熟，競爭廠商數(shù)量迅速增多，產(chǎn)品價格逐漸降低，同時產(chǎn)品的生產(chǎn)成本降低，但是維護(hù)成本大幅度提高。來自外界巨大的競爭壓力使得廠商收益縮水幅度很大，而成本上升的卻很快。假設(shè)博弈方為兩個競爭集團(tuán)，分別代表前期進(jìn)入市場和后期進(jìn)入市場的兩個博弈方，稱之為“守擂者”和“攻擂者”。收益V為2，成本C為12，博弈雙方勝敗的概率仍均為1/2。

2、建立模型

（1）鷹鴿博弈基本模型（表3）

（2）期望得益與平均期望得益。期望得益與平均期望得益的計算方法同上。隨著時間的推移，越來越多的新廠商進(jìn)入市場，企圖瓜分市場份額。市場上的產(chǎn)品品種、品牌數(shù)量逐漸增加。

經(jīng)計算，有：

dx/dt=6x3-7x2+x=x（1-x）（1-6x）

隨著復(fù)制動態(tài)過程的持續(xù)，采用兩種策略的博弈方比例不再發(fā)生變化，博弈達(dá)到穩(wěn)定狀態(tài)，此時dx/dt＝0，即x=0，1，1/6。

設(shè)dx/dt＝F（x），隨著時間t增加，x的變動逐漸減小，達(dá)到穩(wěn)定狀態(tài)的x*使得F'（x*）＜0。由此，dx/dt＝F（x）=6x3-7x2+x，得F'（x*）=18x2-14x+1，而穩(wěn)定狀態(tài)下dx/dt=0的得益x*=0，1，1/6，帶入F'（x*）。得F'（0）＞0，F(xiàn)'（1）＞0，F(xiàn)'（1/6）＜0。

（3）結(jié)論。在進(jìn)化穩(wěn)定策略下，達(dá)到穩(wěn)定狀態(tài)時的x*=1/6，說明鷹策略的博弈方數(shù)量穩(wěn)定在1/6的水平。

四、結(jié)束語

經(jīng)過上述分析可知，車載DVD產(chǎn)品已進(jìn)入生命周期的成熟階段：產(chǎn)品品牌眾多，產(chǎn)量巨大。通過利用進(jìn)化博弈理論對其分析可對其發(fā)展脈絡(luò)有所了解，車載DVD行業(yè)內(nèi)廠商競爭激烈，新進(jìn)入廠商應(yīng)在產(chǎn)品創(chuàng)新與改善售后方面加大投入力度，以求從激烈的競爭中脫穎而出。

主要參考文獻(xiàn)：

篇5

企業(yè)內(nèi)部的知識有多種形式，如個人經(jīng)驗、產(chǎn)品信息、客戶信息、工作流程、各種文檔。企業(yè)知識共享，就是員工互相交流彼此的知識，使知識由個人的經(jīng)驗擴(kuò)散到企業(yè)的層面，從而提高企業(yè)的工作效率。知識共享在企業(yè)中產(chǎn)生的是一種知識放大效應(yīng)，它通過知識管理等手段，使企業(yè)的知識資源不斷得到整合與利用，從根本上推動企業(yè)競爭能力的提升。

進(jìn)化博弈理論與企業(yè)知識共享機(jī)制

對于企業(yè)知識共享機(jī)制問題，可以用博弈理論進(jìn)行研究。目前，國內(nèi)一些研究已對此做出了初步的探索，如用“囚徒困境”模型解釋不愿知識共享的問題，但是這些分析研究均是應(yīng)用經(jīng)典博弈理論進(jìn)行分析。經(jīng)典博弈理論從博弈方的完全理性出發(fā)，在信息充分的前提下找到了博弈的均衡解。然而對現(xiàn)實中的決策行為者來說，完全理性是很難滿足的高要求。當(dāng)社會經(jīng)濟(jì)環(huán)境和決策問題較復(fù)雜時，人的理性局限是非常明顯的。因此要保證博弈分析的理論和應(yīng)用價值，必須對有理性局限的博弈方之間的博弈進(jìn)行分析，進(jìn)化博弈論從有限理性的個體出發(fā)，以群體行為為研究對象，合理解釋了生物行為的進(jìn)化過程。生物進(jìn)化中生物性狀和行為特征動態(tài)變化過程的“復(fù)制動態(tài)”，在有限理性博弈分析中正是模擬有限理性博弈方學(xué)習(xí)博弈和調(diào)整策略過程最主要的動態(tài)機(jī)制之一，而生物進(jìn)化理論中具有在動態(tài)調(diào)整過程中達(dá)到，在受到少量干擾后仍能“恢復(fù)”的穩(wěn)健性均衡概念“進(jìn)化穩(wěn)定策略”，正是有限理性博弈分析最核心的均衡概念，或者說動態(tài)策略穩(wěn)定性概念。

一般來說，在企業(yè)內(nèi)部的知識共享行為上，行為主體的理性層次較低。這主要是因為這類決策是群體決策，而行為是企業(yè)行為。此時行為主體意識到錯誤和調(diào)整策略的能力較差，其行為變化更多的是一種緩慢進(jìn)化而不是快速學(xué)習(xí)與調(diào)整機(jī)制。因此可以用生物進(jìn)化的復(fù)制動態(tài)機(jī)制模擬，即進(jìn)化穩(wěn)定策略（ESS）。在重復(fù)博弈中，具備有限信息的個體根據(jù)其既得利益不斷地在邊際上對其策略進(jìn)行調(diào)整以追求自身利益的改善，不斷地用較滿足的事態(tài)代替較不滿足的事態(tài)，最終達(dá)到一種動態(tài)平衡。在這種平衡中，任何一個個體不再愿意單方面改變其策略，這種平衡狀態(tài)下的策略稱為進(jìn)化穩(wěn)定策略。因此，利用進(jìn)化博弈的方法分析企業(yè)知識共享機(jī)制更加接近于現(xiàn)實情況，也更有實際意義。

理論基礎(chǔ)和模型構(gòu)建

（一）理論基礎(chǔ)

假定兩類行為主體均采用純策略，令S是行為主體所有純策略的集合，(S)代表所有在t階段采用純策略s∈S的行為主體集合，定義狀態(tài)變量θt(S)表示在t階段采用純策略 s的行為主體的群體比例向量，于是有：

根據(jù)前面的假設(shè)，有限理性的行為主體有一定的統(tǒng)計分析能力和對不同策略收益的事后判斷能力，收益較差的行為人遲早會發(fā)現(xiàn)這種差異，并開始學(xué)習(xí)模仿另一類行為人，因此行為人的比例是隨時間而變化的，是時間的函數(shù)。上述比例隨時間變化的速度取決于行為主體的學(xué)習(xí)模仿速度。學(xué)習(xí)模仿速度取決于兩個因素：一是模仿對象數(shù)量的大?。捎孟鄳?yīng)類型的行為人的比例表示），因為這關(guān)系到觀察和模仿的難易程度；二是模仿對象的成功程度（可用模仿對象的策略收益超過平均收益的幅度表示），因為這關(guān)系到判斷差異的難易程度和對模仿激勵的大小。于是，有以下連續(xù)時間的動態(tài)模型：

這是一個模仿者復(fù)制動態(tài)方程，在本模型中，有如下的定理：

定理(Fudenberrg,1998)模仿者動態(tài)的一個穩(wěn)定穩(wěn)態(tài)是一個納什均衡，更一般地說，具有源于內(nèi)部路徑限制的任何穩(wěn)態(tài)都是納什均衡。反之，如果對于一個非納什均衡，存在一個σ＞0，所有內(nèi)部路徑最終將從該穩(wěn)態(tài)的σ鄰域內(nèi)被清除。

（二）模型構(gòu)建

假設(shè)與前提條件。

1.博弈方：假設(shè)該博弈方都是有限理性，且劃分為兩類，即同事群體1和同事群體2。分析的框架是反復(fù)在兩個群體中各隨機(jī)抽取一個成員配對進(jìn)行博弈。博弈方的學(xué)習(xí)和策略模仿局限在他們所在的群體內(nèi)部。這樣我們就可以分別對兩類群體進(jìn)行復(fù)制動態(tài)和進(jìn)化穩(wěn)定策略分析。

2.行為策略。博弈方都有兩種行為方式：共享；不共享。如果他們的知識都不愿共享，相互封鎖，那么個人的知識就會出現(xiàn)低水平重復(fù)，使他們各自獲得的利益不多，假設(shè)為0收益；如果有一個企業(yè)成員打破常規(guī)，進(jìn)行知識共享，那么他就獲得m(0.5＜m＜1)發(fā)展機(jī)會,但共享者是有學(xué)習(xí)成本z的;如果他們的知識都實行共享,就會獲得更多的發(fā)展機(jī)會p(m＜p＜1),此時各有學(xué)習(xí)成本z。

3.行為策略的采取比例。博弈方中可能采取“共享”與“不共享”的比例分別為x、1－x。

4.得益矩陣。用w表示參與人的收益。隨機(jī)博弈中雙方的得益矩陣如圖1所示。

企業(yè)知識共享行為的博弈分析

由得益矩陣可知，該博弈的納什均衡取決于其中P、m、z的具體水平或者說相對水平。根據(jù)上述假設(shè)，按照博弈的一般公式：

博弈方1中，“共享”類型參與人的收益為：

根據(jù)進(jìn)化穩(wěn)定策略的性質(zhì)，一個穩(wěn)定態(tài)必須對微小擾動具有穩(wěn)健性才能稱為進(jìn)化穩(wěn)定策略。也就是說，作為進(jìn)化穩(wěn)定策略的點x*，除了本身必須是均衡狀態(tài)外，還必須具有這樣的性質(zhì)，即如果某些博弈方由于偶然的錯誤偏離了它們，復(fù)制動態(tài)還會使x恢復(fù)到x*。在數(shù)學(xué)上，相當(dāng)于要求當(dāng)干擾使x出現(xiàn)低于x*時，必須大于0，當(dāng)干擾使x出現(xiàn)高于x*時，必須小于0。這就是微分方程的“穩(wěn)定性定理”。

當(dāng)0＜(m-x)/(1-P)＜1時，上述進(jìn)化過程復(fù)制動態(tài)的三個穩(wěn)定狀態(tài)都是合理的，因為都處于0≤x≤1的有效范圍。這時候復(fù)制動態(tài)方程的相位如圖2所示。

由圖2可以看出，x*=(m-z)/(1-P)是進(jìn)化穩(wěn)定策略。這意味著一旦企業(yè)內(nèi)少數(shù)成員開始共享，那么隨著獲得利益的機(jī)會增多，就有更多的成員進(jìn)行仿效，開始共享，直到組織中成員共享的數(shù)量比重為x*=(m-z)/(1-P)。如果超出這個比重，甚至所有的成員都進(jìn)行共享，那么就會出現(xiàn)有些成員不愿貢獻(xiàn)自己的知識讓他人共享，反而利用其他成員創(chuàng)造環(huán)境氛圍，從中牟利，出現(xiàn)“搭便車”的現(xiàn)象，最終仍然回到了x*=(m-z)/(1-P)的均衡比例。

隨著支付矩陣的不同取值，x*可能與其它的兩全解相等或者不存在第三個解，博弈退化為只有兩個穩(wěn)定態(tài)。

當(dāng)(m-z)/(1-P)＜0，也就是m由圖3不難看出，這時候復(fù)制動態(tài)的唯一穩(wěn)定的均衡點為x*=0，也就是說企業(yè)所有的成員都是不愿共享的。只要不是一開始所有成員都是共享型的極端情況，最終都會在長期的動態(tài)變化中趨于不共享。即使是所有成員都共享，只要在組織內(nèi)部有不共享的人出現(xiàn)，就會破壞共享學(xué)習(xí)的氛圍，破壞整個企業(yè)的現(xiàn)狀，企業(yè)去管理就會增加成本，這樣企業(yè)反而不去管，最終會趨向所有成員都不愿共享的均衡。

當(dāng)(m-z)/(1-P)＞1,也就是m-z＞1-P的情況。此時，復(fù)制動態(tài)的三個不動點中也只有x*=0和x*=1兩點符合要求。復(fù)制動態(tài)方程的相位如圖4所示。

由圖4可以看出，現(xiàn)在的進(jìn)化穩(wěn)定策略是x*=1，也就是所有的成員都共享，整個企業(yè)組織就是學(xué)習(xí)共享型的。在社會環(huán)境和成員的素質(zhì)都很好以及從學(xué)習(xí)中獲得的收益遠(yuǎn)遠(yuǎn)大于成本代價時，這樣的條件下是合理的。

通過對以上三種情況的分析，我們可以知道，企業(yè)知識共享機(jī)制是個長期的問題，無法以短期來解決。企業(yè)中的成員不是每個都是知識共享型的，而是存在著“搭便車”的現(xiàn)象，在有限理性的條件下，不是所有的企業(yè)都是知識共享型的，不是所有的企業(yè)都能做到長期性的知識共享。這也可以解釋我國有很多的企業(yè)在實施知識管理，但真正取得好的結(jié)果的卻并不多。

企業(yè)知識共享的行為演化機(jī)制

通過進(jìn)化博弈的參數(shù)分析，可以看出企業(yè)知識共享機(jī)制的進(jìn)化博弈包括如下幾種可能的行為演化機(jī)制。

企業(yè)知識共享機(jī)制的選擇機(jī)制，即在博弈中能夠獲得較高收益的策略，在以后演化過程中被更多的參與者選擇。通過進(jìn)化博弈的得益矩陣分析，使企業(yè)知識共享機(jī)制容易實現(xiàn)較高效率進(jìn)化策略均衡。只要調(diào)整好P、m和z的大小，就可以保證較高效率的企業(yè)知識共享機(jī)制順利進(jìn)行。具體來說是要求用更低的成本z，創(chuàng)造更多的發(fā)展機(jī)會P和m，企業(yè)就會促使更多的工作人員去實施知識共享。為此企業(yè)需要加大內(nèi)部不共享行為的機(jī)會成本，務(wù)必對企業(yè)內(nèi)部成員的知識自私行為進(jìn)行懲罰和壓制，以提高這種變異的門檻，使這種不愿知識共享的行為成為一種風(fēng)險很大收益很小的活動，從而壓縮不實現(xiàn)知識共享者的生存空間，避免企業(yè)內(nèi)部的知識共享機(jī)制向不利的方向演進(jìn)。

企業(yè)知識共享機(jī)制的放棄機(jī)制，即在博弈中獲得較低收益的策略，在以后演化過程中被更多的參與者放棄。在進(jìn)化博弈分析的第二種情況下，由于m企業(yè)知識共享機(jī)制的突變機(jī)制，即參與者以隨機(jī)（無目的性）的方式選擇策略，其中包括突變策略，參與者將選擇獲得較高收益的策略。通過進(jìn)化博弈的得益矩陣分析，使p-z 變大或1-m 變小，促使(p-z)-(1-m)增大，保證企業(yè)較易地實現(xiàn)較高相互支持、相互協(xié)作、相互溝通，鼓勵和促進(jìn)企業(yè)內(nèi)部的知識共享行為，褒揚部門、同事的團(tuán)隊精神，把知識共享變成一種自動機(jī)制，從而使企業(yè)內(nèi)部采取知識共享行為者獲得較高的收益，這樣使企業(yè)內(nèi)部采取少數(shù)不共享行為的人所占的比例越來越小，提高企業(yè)知識共享機(jī)制向理想方向進(jìn)化的可能性和比例，從而促進(jìn)企業(yè)知識共享機(jī)制向最理想的方向演進(jìn)。

參考文獻(xiàn)：

篇6

在行為金融學(xué)和進(jìn)化博弈論中都有關(guān)于“有限理性”概念，那么，這兩門學(xué)科中“有限理性”的內(nèi)涵是否一致，本文從這兩門學(xué)科的發(fā)展歷程來說明“有限理性”概念的區(qū)別和聯(lián)系。

行為金融學(xué)中的“有限理性”的內(nèi)涵

由于傳統(tǒng)的金融學(xué)是建立在理性人假設(shè)和有效市場假說兩大基石之上的，投資的目標(biāo)是收益最大化，投資者之間無差別，他們都是對風(fēng)險持厭惡態(tài)度的，并且面對不同資產(chǎn)的風(fēng)險態(tài)度始終是一致的。但是，隨著金融學(xué)研究的不斷深入，人們發(fā)現(xiàn)金融市場上存在著大量無法用傳統(tǒng)金融理論解釋的異?，F(xiàn)象；同時實驗經(jīng)濟(jì)學(xué)研究表明，投資者在不確定條件下進(jìn)行投資決策時并不總是理性的，隨著上世紀(jì)80年代心理學(xué)在研究人的非理方面的重大發(fā)現(xiàn)，金融學(xué)便借鑒了心理學(xué)、社會學(xué)等研究成果，對證券投資者的認(rèn)知偏差和有限理及其深層次的原因進(jìn)行了大量的研究，形成了創(chuàng)新的行為金融學(xué)。

行為金融理論從心理學(xué)對人類決策行為的研究成果出發(fā)，比較圓滿地解釋了金融市場上存在的一些無法用傳統(tǒng)金融理論闡述的異?，F(xiàn)象，比較切合實際的闡釋了投資者在不確定條件下的決策行為，并由此否定了傳統(tǒng)金融學(xué)中的投資者“完全理性”的假設(shè)，提出了“有限理性”的概念。

經(jīng)濟(jì)心理學(xué)家Slovic (1972)從行為學(xué)的角度出發(fā)研究了投資者的非完全理性決策的過程。諾貝爾獎得主Simon最早提出投資者“有限理性”的觀點。普林斯頓大學(xué)的Kahneman和斯坦福大學(xué)的Tversky (1979)的“期望理論”(prospect theory)認(rèn)為：投資者預(yù)期和感覺的變化而導(dǎo)致投資行為的變化不能簡單地從“理性”的角度來解釋。Shefrin (2000)指出：證券投資者總是試圖做出理性的決策，但是如果無法把握自己行為的后果或?qū)ν顿Y前景模糊不清時，其有限的能力和人類固有的行為模式就會不自覺地主宰著他們的行為。行為金融學(xué)家Debondt和Thaler(1985)認(rèn)為過度自信 (Over confidence)是人類最為穩(wěn)固的認(rèn)知偏差，它會使投資者的投資行為偏離理性的軌道，并在其經(jīng)典文獻(xiàn)“股票市場過度反應(yīng)嗎?”中正式提出了證券投資者的“過度反應(yīng)”的行為傾向。odean(1999)的研究發(fā)現(xiàn)投資者具有非理性的過度交易的行為特征。

進(jìn)化博弈論中“有限理性”的內(nèi)涵

上世紀(jì)50年代后，經(jīng)濟(jì)學(xué)家開始轉(zhuǎn)而強(qiáng)調(diào)個人理性，信息問題成為經(jīng)濟(jì)學(xué)家關(guān)注的焦點，同時也開始關(guān)注參與者的決策之間的相互影響，即所謂的時序問題。而博弈論在此階段剛好解決了這兩個方面的問題，從而使博弈論在經(jīng)濟(jì)中的應(yīng)用得到了快速的發(fā)展。博弈論是在考慮到?jīng)Q策主體行為互動情形下，研究理性人如何決策及決策的均衡問題的理論。但是，博弈論對理性人的理性要求過于苛刻，那種“共同知識”要求決策者近乎全知全能，并且碰到博弈的多重均衡時也無法確定究竟選擇哪一個均衡，這無疑是理論本身的局限。上世紀(jì)70年代以來，從進(jìn)化生物學(xué)發(fā)展起來的進(jìn)化博弈論，運用有限理性假設(shè)來解釋經(jīng)濟(jì)現(xiàn)象使博弈論重獲生機(jī)。進(jìn)化博弈論的核心思想在博弈中是用群體來代替?zhèn)€體作為局中人，用群體中選擇不同純策略個體比率來代替局中人的混合策略。特別是從該理論的基本概念―進(jìn)化穩(wěn)定策略(Evolutionarily Stable Strategy，ESS )提出以來，早已超出了生物進(jìn)化理論的使用范圍，現(xiàn)己被廣泛地應(yīng)用于經(jīng)濟(jì)領(lǐng)域、社會領(lǐng)域來解釋并預(yù)測人的群體行為。

行為金融學(xué)中的“有限理性”的表現(xiàn)

普遍的“售盈持虧”傾向

“售盈持虧”傾向，即投資者愿意賣出當(dāng)前盈利的股票并繼續(xù)持有虧損股票的心理傾向，行為金融理論稱之為“處置效應(yīng)”（disposition effect）。

趙學(xué)軍、王永宏（2001）實證研究發(fā)現(xiàn)，中國個體證券投資者的“售盈持虧”傾向比美國投資者更嚴(yán)重；呂嵐、李學(xué)（2002）通過賣盈比例/賣虧比例和持股時間檢驗表明，中國股市同樣存在處置效應(yīng)，與美國股市不同，中國股市的處置效應(yīng)在年末相對增強(qiáng)，中國個體證券投資者的處置效應(yīng)比中國機(jī)構(gòu)投資者的處置效應(yīng)更強(qiáng)烈；陳斌等（2002）通過問卷調(diào)查的結(jié)果顯示，在個體證券投資者處理套牢股票的方式方面，選擇“長期持有，直到解套”的投資者為數(shù)最多，選擇“不斷補(bǔ)倉拉低價位”的投資者數(shù)量次之，而選擇“忍痛割肉”者最少。上述對處置效應(yīng)的研究反映了中國個體證券投資者的損失厭惡（loss aversion）傾向，這會削弱投資者對投資風(fēng)險和股票未來收益狀況的客觀判斷。

總體上存在“過度自信”傾向

心理學(xué)家發(fā)現(xiàn)，人類往往過于相信自己的判斷能力，高估自己成功的機(jī)會，把成功歸因于自己的能力，而低估運氣和機(jī)會等外因在其中的作用，這種心理偏差被稱為“過度自信（overconfidence）”。

李心丹、王冀寧和傅浩（2002）采用統(tǒng)計分析方法，發(fā)現(xiàn)投資者進(jìn)行了一些并非能帶來收益最大化的交易，在排除合法避稅、流動性需求和平衡收益與風(fēng)險等三個可能影響因素后確定我國個體證券投資者進(jìn)行上述非理易的原因是對自己的能力過度自信，故我國個體證券投資者進(jìn)行投資決策時總體上存在“過度自信”傾向。

“過度自信傾向”對于投資者正確處理信息有直接和間接兩方面影響。直接影響是，如果投資者有過度自信傾向，那么他們就會過分依賴自己收集到的信息，而輕視公司財務(wù)報表的信息；間接影響是，具有過度自信傾向的投資者在處理各種信息時，重視那些能增強(qiáng)他們自信心的信息，而忽視那些有損其自信心的信息，以至于不愿承認(rèn)自己投資決策失誤，這會導(dǎo)致“售盈持虧”、對某些信息反應(yīng)過度（over-reaction）或反應(yīng)不足（under-reaction）、進(jìn)行大量盲目交易等非理。

顯著的“羊群行為”傾向

“羊群行為（herd behavior）”是一種特殊的非理，它是指投資者在信息不對稱的條件下，行為受到其他投資者的影響，模仿他人決策或者過度依賴輿論，而不考慮自己擁有的信息的行為。具體表現(xiàn)為大量的投資者在某段時期內(nèi)買賣相同或相近的股票，同時進(jìn)出證券市場。中國證券市場中存在著明顯的“羊群行為”，無論是機(jī)構(gòu)投資者還是個體投資者，羊群行為均表現(xiàn)十足。施東暉（2002）根據(jù)資本資產(chǎn)定價模型（CAPM）建立了用以檢驗羊群行為的回歸模型，并據(jù)此對中國證券市場進(jìn)行檢驗，結(jié)果表明，在政策干預(yù)頻繁和信息不對稱嚴(yán)重的市場環(huán)境下，存在一定程度的羊群行為。

證券市場上的“羊群行為”使投資者的買賣行為和證券價格變化具有聯(lián)動性和趨同性，從而導(dǎo)致個股價格變化和市場指數(shù)變化之間存在很強(qiáng)的相關(guān)性，引起大量的“跟風(fēng)”和“跟莊”行為的出現(xiàn)，而這些行為往往被某些別有用心的莊家所利用，所以在我國證券市場上，大部分中小投資者成為莊家獲取暴利的犧牲品。

進(jìn)化博弈論中“有限理性”的表現(xiàn)

選擇與突變

一般而言，進(jìn)化博弈模型主要是基于選擇(Selection)和突變(Mutation)這兩個方面而建立起來的。選擇是指本期中的贏者策略(獲得較高的支付)在下一時期將更為流行(由于有更多的后代、被競爭對手學(xué)習(xí)與模仿等方式而被更多的參與者采用)；突變一般很少發(fā)生，它指種群中的某些個體以隨機(jī)的方式選擇策略，那些獲得更高支付的變異策略經(jīng)過選擇后將變得流行，那些獲得更低支付的變異策略則自然消亡。進(jìn)化博弈模型的選擇形成機(jī)制通常有三種意義解釋：生態(tài)學(xué)意義上的適應(yīng)度(即后代數(shù)量)、個體意義上的反應(yīng)變更(試驗、刺激反應(yīng)等)和社會意義上的策略變更(學(xué)習(xí)與模仿等)。不管是哪種情形，進(jìn)化博弈的基本思想是適應(yīng)性，是不斷改進(jìn)的，即較好的策略將變得更為流行。

進(jìn)化穩(wěn)定策略

進(jìn)化穩(wěn)定策略是由Maynard Smith (1973)在考察種群中個體的適應(yīng)度由各個個體行為共同決定的環(huán)境下，個體對成功策略的選擇時提出來的。進(jìn)化穩(wěn)定策略的基本思想是：假設(shè)在一個全部選擇某一特定策略的大群體中，進(jìn)入一個選擇不同策略的小群體(變異或外來入侵等)，如果該突變小群體在混合群體的博弈中所得到的支付(適應(yīng)度)大于原群體中個體得到的支付，則該小群體能夠侵入大群體，在演化過程中該小群體將逐步壯大并可能取而代之成為大群體；反之，該小群體在演化過程中將自然消亡。如果一個群體能夠消除任何小群體的入侵，那么就稱該群體達(dá)到了一種進(jìn)化穩(wěn)定狀態(tài)，此時該群體選擇的策略就是進(jìn)化穩(wěn)定策略。

兩種“有限理性”表現(xiàn)的區(qū)別與聯(lián)系

行為金融學(xué)所表現(xiàn)出來的“有限理性”與進(jìn)化博弈論中的“有限理性”有差別，行為金融學(xué)側(cè)重于心理、習(xí)慣、社會風(fēng)俗方面等影響人類的一些固有行為模式（這些固有模式人類往往自己不知道，比如過度反應(yīng)和反應(yīng)不足，情緒，性格）對自身的經(jīng)濟(jì)行為的影響；而進(jìn)化博弈論的研究不側(cè)重于發(fā)現(xiàn)這些人類的固有行為模式，雖然進(jìn)化博弈論中的參與人也不知道這些固有模式，或者是無意識的，或者是在行為金融學(xué)發(fā)現(xiàn)人類固有行為模式的影響后，進(jìn)化博弈論中很少一部分的參與者嘗試著改變既有的策略，反而使自己的效用增大了，于是成為其他參與者可以模仿的對象，從而使采用不同策略的參與者的比例發(fā)生了變化。

那么，綜上所述，可以得出以下結(jié)論，行為金融學(xué)研究人類靜態(tài)的固有行為模式的影響，而進(jìn)化博弈論研究的是這些固有模式的演化過程與結(jié)果，這種演化過程是無意識的，是“自然選擇”的結(jié)果。

參考文獻(xiàn)：

1.Slovic, Paul.，psychology Study of Human Judgment：Implications For Investment Decision Making[J]，Journal of Finance , 1972

2.Kahneman and Tversky, Prospect theory：An Analysis of Decision Under Risk[J], Econometrica, 1979

3.DeBondt, & Thaler，Does the stock market overreact?[J] ，Journal of Finance, 1985

4.Odean, Terrance ，Do investors trade too much[J], American Economic Review,1999

5.Maynard Smith, G. Price, The logic of animal conflict[J]，Nature, 1973；246： 15-18

6.趙學(xué)軍，王永宏.中國股市慣性策略和反轉(zhuǎn)策略的實證分析[J].經(jīng)濟(jì)研究，2001（6）

7.呂嵐，李學(xué).中國股市投資者的處置效應(yīng).深圳證券交易所綜合研究所研究報告，2002

篇7

>> 基于進(jìn)化博弈論的金融創(chuàng)新與金融監(jiān)管動態(tài)博弈分析美國金融監(jiān)管與金融創(chuàng)新的博弈金融監(jiān)管與金融創(chuàng)新的博弈實證金融創(chuàng)新與金融監(jiān)管的動態(tài)博弈分析金融監(jiān)管協(xié)調(diào)機(jī)制的進(jìn)化博弈研究基于進(jìn)化博弈論的我國金融創(chuàng)新和金融監(jiān)管問題研究次貸危機(jī)―金融監(jiān)管與金融創(chuàng)新的博弈的必然結(jié)果論金融創(chuàng)新與金融監(jiān)管金融創(chuàng)新與金融監(jiān)管研究試論金融創(chuàng)新與金融監(jiān)管淺析金融創(chuàng)新與金融監(jiān)管的和諧發(fā)展金融博弈:創(chuàng)新與監(jiān)管金融監(jiān)管的思維變革與制度創(chuàng)新國際金融危機(jī)下的金融創(chuàng)新與金融監(jiān)管金融創(chuàng)新與金融監(jiān)管：互聯(lián)網(wǎng)金融的發(fā)展思辨* 我國互聯(lián)網(wǎng)金融環(huán)境下的金融創(chuàng)新與金融監(jiān)管金融創(chuàng)新與金融監(jiān)管：互聯(lián)網(wǎng)金融的發(fā)展思辨我國金融監(jiān)管的博弈分析互聯(lián)網(wǎng)金融監(jiān)管的博弈分析金融監(jiān)管覆蓋模式與金融創(chuàng)新關(guān)系研究常見問題解答當(dāng)前所在位置：l.

[5]參見《中國統(tǒng)計年鑒2012》.

[6]參見《中國經(jīng)濟(jì)普查年鑒2011》.

[7]參見劉揚.美國金融監(jiān)管改革對我國的啟示[J].經(jīng)濟(jì)縱橫，2011（1）.

[8]參見樓建波.從CDS看金融衍生品的異化與監(jiān)管——以瑞銀集團(tuán)訴Paramax案為例.《China Academic Journal Electronic Publishing House 2010》.

[9]包容MBS，ABS，CDO，CDO平方等一系列金融產(chǎn)品.具體參見張明《透視CDO：類型、構(gòu)造、評級與市場》、《國際金融研究》2008年第6期.

[10]參見何純.進(jìn)化博弈：對金融創(chuàng)新與金融監(jiān)管關(guān)系的辯證審視.《理論探討》總第376期第43頁.

[11]參見郭敏.淺議金融創(chuàng)新與金融監(jiān)管的博弈關(guān)系[J].《時代金融》2009（12）.

[12]參見現(xiàn)代博弈理論匈牙利大數(shù)學(xué)家馮·諾依曼和奧斯卡·摩根斯特恩合作出版的巨著《博弈論與經(jīng)濟(jì)行為》，1994年出版。指參與博弈的雙方，在嚴(yán)格競爭下，一方的收益必然意味著另一方的損失，博弈雙方的收益和損失相加總和永遠(yuǎn)為“零”，不存在合作的可能性.

[13]參見《新浪財經(jīng)》http：//.cn/g/20110322/23239575768.shtml.

篇8

一、問題的提出

學(xué)校是培育人才的搖籃，班級是學(xué)校的基本構(gòu)成單元。班級安全文化是指班級在教學(xué)、科研以及生活等領(lǐng)域所創(chuàng)造的理念、形象、設(shè)施與行為等的總和，班級安全文化建設(shè)是學(xué)校安全文化建設(shè)的基本立足點。學(xué)生是班級的主體，班級安全文化是全班學(xué)生共建共享的，一個班級的安全文化氛圍濃厚只是一枝獨秀，只有當(dāng)學(xué)校所有班級的安全文化不斷優(yōu)化，才能有助于學(xué)校安全文化的提升，為學(xué)生的學(xué)習(xí)和生活提供安全保障。徹底否定傳統(tǒng)博弈論賴以成立的基礎(chǔ)即“理性人假設(shè)”的進(jìn)化博弈理論從具有有限理性的“社會人”出發(fā)，分析參與人的行為從而建立起嶄新的分析框架。自從1973年生態(tài)學(xué)家史密斯和普賴斯引進(jìn)進(jìn)化穩(wěn)定策略，TaylorandJonker于1978年提出模仿者動態(tài)概念后，進(jìn)化博弈論被廣泛應(yīng)用于各學(xué)科。經(jīng)典的博弈論建立在完全理性的假設(shè)基礎(chǔ)上，在解釋現(xiàn)實行為方面具有明顯不足。而進(jìn)化博弈論用于解釋群體之間的行為是如何相互影響的動態(tài)變化過程，因而適用于班級安全文化建設(shè)的解釋性分析及探索性研究。

二、有限理性條件下學(xué)生之間的安全文化建設(shè)進(jìn)化博弈分析

學(xué)生作為行為主體，具有有限理性，在班級安全文化建設(shè)中的策略選擇也是可模仿學(xué)習(xí)的。運用進(jìn)化博弈原理對具有有限理性的學(xué)生間的相互行為及班級安全文化建設(shè)進(jìn)行分析，頗具理論及現(xiàn)實意義。

（一）基本假設(shè)

學(xué)生之間是無差異的，由學(xué)生組成的群體成員間進(jìn)行了隨機(jī)配對博弈，形成兩人對稱博弈，學(xué)生的策略選擇受其他學(xué)生的策略影響，策略的調(diào)整是一個緩慢的動態(tài)調(diào)整過程。

（二）模型構(gòu)建

第一，博弈參與者。根據(jù)進(jìn)化博弈原理，將隨機(jī)配對的兩名學(xué)生分別記作“學(xué)生1”和“學(xué)生2”。在班級安全文化建設(shè)中，學(xué)生有認(rèn)真參與和敷衍了事兩種選擇。第二，博弈方的行為策略。在班級安全文化建設(shè)中，學(xué)生采取的博弈策略有兩種：一是積極主動，另一種是敷衍應(yīng)付，分別記作“主動”和“敷衍”。第三，博弈得益。通過開展班級安全文化建設(shè)，假設(shè)兩名學(xué)生都能夠認(rèn)真學(xué)習(xí)安全知識和技能，可以在很大程度上避免和防范常見校園安全事故，即使遇到安全事件也能盡其所能成功應(yīng)對的概率為1，從而獲得一定的效用，記作V。假設(shè)兩名學(xué)生中，一名學(xué)生在班級安全文化建設(shè)中采取“主動”策略，安全素質(zhì)得以提高，從而獲得了安全文化建設(shè)效用，另一名學(xué)生選擇“敷衍”策略。嚴(yán)格來講，學(xué)校安全事故的發(fā)生具有偶然性，即兩名學(xué)生在防范和應(yīng)對校園安全事故時也有一定的成功概率，分別記作R和r。因此，采取“主動”策略的學(xué)生獲得的效用水平為V*R，采取“敷衍”策略的學(xué)生獲得的效用水平為r*V，且r≤R，0≤r≤1，0≤R≤1。假設(shè)在班級安全文化建設(shè)中，兩名學(xué)生都采取“敷衍”策略，則獲得的效用均為M，可正可負(fù)，在學(xué)校安全形勢比較穩(wěn)定的條件下，學(xué)生即使不積極主動參與班級安全文化建設(shè)，也不會有任何損失，此時M為正值。相反，校園安全事件的發(fā)生會造成一定的人身財產(chǎn)損失以及不良聲譽，此時M為負(fù)值。

（三）隨機(jī)配對的兩名學(xué)生

對稱博弈模型的納什均衡求解根據(jù)劃線法對博弈模型進(jìn)行分析，班級安全文化建設(shè)中“主動”的學(xué)生都能獲得較高的效用，即V*R≥M。根據(jù)班級安全文化建設(shè)實際，運用劃線法求解得：當(dāng)r≤R，V*R＞M時，“主動”是每名學(xué)生在任何情況下都不會改變的占優(yōu)策略，因此（認(rèn)真學(xué)習(xí)，認(rèn)真學(xué)習(xí)）成為隨機(jī)配對的兩名學(xué)生對稱博弈模型的唯一納什均衡。當(dāng)r≥R，V*R＜M，存在兩個納什均衡，即兩名學(xué)生會相互影響，（認(rèn)真學(xué)習(xí)，認(rèn)真學(xué)習(xí)）和（敷衍學(xué)習(xí)，敷衍學(xué)習(xí)），學(xué)生以一定的概率選擇參與班級安全文化建設(shè)策略，要么都“主動”，要么都“敷衍”。當(dāng)r≥R，認(rèn)真學(xué)習(xí)安全知識和技能，即“主動”參與班級安全文化建設(shè)的學(xué)生仍然不幸遇到安全事故，當(dāng)事故具有偶然性時，“主動”參與班級安全文化建設(shè)的學(xué)生會改變策略，轉(zhuǎn)為“敷衍”參與班級安全文化建設(shè)。

（四）有限理性條件下學(xué)生之間的安全文化建設(shè)進(jìn)化博弈分析

當(dāng)進(jìn)行班級安全文化建設(shè)，對學(xué)生開展安全教育和安全管理時，假定以y（t）表示選擇純策略———“主動”參與班級安全文化建設(shè)策略的學(xué)生人數(shù)在群體中所占的比重，則選擇“敷衍”策略的學(xué)生人數(shù)所占比重為1-y（t）。

三、結(jié)論及建議

通過構(gòu)建學(xué)生參與班級安全文化建設(shè)的進(jìn)化博弈模型并進(jìn)行分析求解，得到不同條件下兩種不同的進(jìn)化穩(wěn)定策略，從而得出學(xué)生在參與班級安全文化建設(shè)過程中，受其他同學(xué)的影響非常明顯，要么都“主動”，要么都“敷衍”。安全文化建設(shè)是一種居安思危、預(yù)防為主、防患于未然的系統(tǒng)工程，如同溫水煮蛙實驗。從學(xué)生參與班級安全文化建設(shè)的演化過程看，要改變目前多數(shù)學(xué)生都存在“敷衍”的現(xiàn)狀，應(yīng)注重對學(xué)生學(xué)習(xí)安全知識和技能的引導(dǎo)，強(qiáng)化安全防范意識，提高“主動”參與班級安全文化建設(shè)的效用。采取多種形式開展班級安全文化建設(shè)，對學(xué)生開展人性化的安全管理尤其是參與式管理，例如通過應(yīng)急演練、情境模擬等方式吸引學(xué)生參與，激發(fā)學(xué)生的學(xué)習(xí)力，提高學(xué)生安全素質(zhì)，提升班級安全文化建設(shè)實效。

參考文獻(xiàn)：

篇9

1、博弈理論的早期研究。一般認(rèn)為，對于博弈理論的最早研究可以追溯到18世紀(jì)初。瓦德格拉夫（Waldegrave）在1713年提出了兩人博弈的極小化極大混合策略解。古諾（Cournot）和伯特蘭德(Bertrand)分別在1838年和1883年提出了博弈論最經(jīng)典的模型，兩位學(xué)者分別從產(chǎn)量決策和價格決策分析壟斷的雙寡頭競爭模型，確定了在競爭之下各自的最優(yōu)反映函數(shù)。這些都是關(guān)于博弈問題的早期的零星研究。

2、博弈論發(fā)展的不同階段。一般認(rèn)為博弈論萌芽于20世紀(jì)20年代初。博弈論創(chuàng)立的標(biāo)志是馮?諾伊曼和奧?摩根斯坦（Morgenstern）在1944年的《博弈論與經(jīng)濟(jì)行為》這部著作，他們的貢獻(xiàn)現(xiàn)在看來主要是創(chuàng)立了博弈論研究的基本概念、二人零和博弈的完全解決和對合作博弈的貢獻(xiàn)?，F(xiàn)在應(yīng)用更為普遍的非合作博弈理論的創(chuàng)立，則是以納什（John Nash）1950年的博士論文《非合作博弈》為標(biāo)志，該文的主要貢獻(xiàn)是提出了納什均衡的概念。此后(20世紀(jì)70年代)，美國海薩尼（Harsanyi）和德國塞爾頓（Selten）的不完全信息博弈理論工作進(jìn)一步完善了非合作博弈理論。當(dāng)20世紀(jì)70年代經(jīng)濟(jì)學(xué)家開始將注意力由價格制度轉(zhuǎn)向非價格制度時，博弈論逐漸成為經(jīng)濟(jì)學(xué)的基石。

1944年，馮?諾伊曼（Von Neumann）和奧?摩根斯坦（Morgenstern）合著的《博弈論與經(jīng)濟(jì)行為》被認(rèn)為是博弈理論初步形成的標(biāo)志。該書在總結(jié)以往關(guān)于博弈的研究成果的基礎(chǔ)上，提出了博弈論的概念術(shù)語、一般框架和表述方法，提出了較系統(tǒng)的博弈理論。而且，在該書以前，博弈論主要是數(shù)學(xué)家們研究的課題，主要是一種數(shù)學(xué)理論而不是經(jīng)濟(jì)學(xué)理論?！恫┺恼撆c經(jīng)濟(jì)行為》極大地促進(jìn)了博弈論和經(jīng)濟(jì)學(xué)研究的聯(lián)系。從此，博弈論開始被經(jīng)濟(jì)學(xué)家們所接受，對博弈論的發(fā)展起了巨大的推動作用。雖然《博弈論與經(jīng)濟(jì)行為》的出版標(biāo)志著博弈論的初步形成，但是這個時候的博弈論還是比較幼稚的，研究的范圍也較小，總體影響也很小。研究的主要對象是少數(shù)類型的合作博弈和零和博弈。

20世紀(jì)的40年代末到50年代初，是博弈論的發(fā)展史上一個重要階段。越來越多的學(xué)者進(jìn)行了博弈理論的研究。1950年，納什（John Nash）在他的博士論文《非合作博弈》中，將博弈論擴(kuò)展到了非零和博弈，最終形成了非合作博弈理論的思想源泉，納什均衡概念的提出以及納什均衡存在性的納什定理的證明，發(fā)展了以納什均衡概念為核心的非合作博弈理論。納什均衡是對古諾模型和伯特蘭德模型中均衡概念的一般化，納什均衡的概念是有關(guān)均衡概念的最基本的概念，后來的子博弈精煉納什均衡，貝葉斯納什均衡、精煉貝葉斯納什均衡等概念的提出都是以納什均衡為研究出發(fā)點的。

20世紀(jì)50年代中后期一直到70年代也是博弈論發(fā)展歷史上較為重要的一個時期?！拔⒎志狻?、“強(qiáng)均衡”、“重復(fù)博弈”以及在此基礎(chǔ)上的完全信息動態(tài)博弈等概念就是在這一時期提出來的，而且在60年代初開始了博弈論在進(jìn)化生物學(xué)中的應(yīng)用的研究。這個時期產(chǎn)生的里程碑式的成果是海薩尼（Harsanyi）關(guān)于不完全信息博弈理論，他在1967-1968年的三篇關(guān)于不完全信息博弈理論的論文中，提出了關(guān)于不完全信息靜態(tài)博弈的“貝葉斯納什均衡”的概念，此外還在1973年提出了關(guān)于“混合策略”的不完全信息解釋，以及關(guān)于不完全信息動態(tài)博弈的嚴(yán)格“納什均衡”概念。同時這個時期也是進(jìn)化博弈論發(fā)展的重要階段，提出了“進(jìn)化穩(wěn)定策略”等概念。當(dāng)然，這個時期產(chǎn)生的博弈論成果還有很多，博弈論更多地應(yīng)用到經(jīng)濟(jì)學(xué)理論的研究當(dāng)中，為80-90年代博弈論的成熟以及經(jīng)濟(jì)學(xué)理論的博弈論革命起了很大的推動作用。

20世紀(jì)80-90年代到現(xiàn)在是博弈論走向成熟的時期，期間產(chǎn)生了大量的研究成果和文獻(xiàn),表明博弈論已經(jīng)作為一種一般的分析方法逐漸走進(jìn)了政治學(xué)、軍事學(xué)、生物學(xué)、統(tǒng)計學(xué)等多門學(xué)科中。尤其是在經(jīng)濟(jì)學(xué)中，博弈論占據(jù)了核心地位。這個時期，是對非合作博弈理論的進(jìn)一步深化，產(chǎn)生了博弈論基礎(chǔ)上的經(jīng)濟(jì)學(xué)分支，如信息經(jīng)濟(jì)學(xué)，以及一些關(guān)于特殊問題的理論，如拍賣理論、激勵理論。早在1983年，因一般均衡理論而得到諾貝爾經(jīng)濟(jì)學(xué)獎的德布魯(J?Debreu)表明，如果沒有博弈論中納什均衡的重要概念，也就沒有他對一般均衡的存在性的證明。到了90年代，克萊普斯(D?Kreps)、克魯格曼(P?Krugman)和格羅斯曼(S?Grossman)都是因為在博弈論上的貢獻(xiàn)而獲得了美國的克拉克獎(Clark Prize)，這是美國對40歲以下經(jīng)濟(jì)學(xué)家的最高獎。之后，博弈論兩度奪得諾貝爾經(jīng)濟(jì)學(xué)獎，1994年頒給納什(Nash)、海薩尼(John Harsanyi)和塞爾頓(Reinhard Selten)三位博弈論專家；2005年頒給羅伯特?奧曼(Robert J?Aumann)和托馬斯?謝林(Thomas C?Schelling )。

二、博弈的類型及其均衡概念

博弈理論有合作博弈和非合作博弈之分。合作博弈強(qiáng)調(diào)團(tuán)體理性，強(qiáng)調(diào)效率、公平和公正，非合作博弈更強(qiáng)調(diào)個體理性、個體的最優(yōu)決策。按照參與人行動的先后順序，博弈可以分為靜態(tài)博弈和動態(tài)博弈。完全信息博弈是指每個參與者對所有其他參與者的特征、策略空間和支付函數(shù)有準(zhǔn)確的知識；否則，就是不完全信息博弈。下圖是基于上述分類方法的博弈類型以及各自的均衡概念。

三、博弈論的研究趨勢及未來

篇10

一、進(jìn)化博弈理論介紹

進(jìn)化博弈論是以有限理性的博弈方作為博弈分析的基礎(chǔ)，研究的是博弈群體成員的策略調(diào)整過程、趨勢和穩(wěn)定性。其中，最重要的概念是“進(jìn)化穩(wěn)定策略（Evolutionary stable strategy――ESS）”和“復(fù)制動態(tài)方程”。

1.進(jìn)化穩(wěn)定策略（ESS）的數(shù)學(xué)描述

進(jìn)化穩(wěn)定策略ESS是這樣的一種策略，如果群體中所有成員都采用這種策略，而這種策略的好處為其它策略所不及，那么在自然的影響下，將沒有突變策略能侵犯這個群體。梅納德?斯密斯（Maynard Smith）在1982年給出了2×2博弈的ESS數(shù)學(xué)描述(見文獻(xiàn)[5])。

設(shè)某一種群中的某一個體，從其策略空間s中選用一種策略s1，當(dāng)它的對手采用另外一種策略s2，它的收益為E(s1,s2)。稱策略s1是一個ESS，

假如對所有的可選策略s2，滿足以下兩個條件之一：

(1)E(s1,s1)>E(s2,s1),即s1一定是一個關(guān)于它自己的最好策略。

(2)E(s1,s1)=E(s2,s1)，且E(s1,s2)>E(s2,s2)，即若s2是關(guān)于s1的一個等價可選策略，且s1是關(guān)于s2的一個最好策略，則s1一定是一個比s2關(guān)于它自己的最好策略。

若一個進(jìn)化博弈存在ESS，則稱該博弈存在進(jìn)化穩(wěn)定策略。

2.進(jìn)化博弈復(fù)制動態(tài)方程

“復(fù)制動態(tài)方程”是描述某一個特定策略在一個種群中被采納的比例的動態(tài)微分方程。由進(jìn)化原理可知，一種策略的收益比種群的平均收益高時，那么這種策略就會在種群中被模仿、學(xué)習(xí)和發(fā)展，即適者生存體現(xiàn)在這種策略的變化率。

可以用以下微分方程來表示:。其中，xk 表示種群中采用策略k的比例，u(k,s)表示采用策略k的期望收益， u(s,s)表示種群的平均期望收益；k表示不同的策略。

二、商業(yè)銀行與企業(yè)的博弈分析

為了方便起見，我們將所有的商業(yè)銀行簡稱為銀行，將借款的國有企業(yè)、非國有企業(yè)、居民和個體工商戶統(tǒng)稱為企業(yè)。銀行與企業(yè)間的博弈，實際上是銀行信貸經(jīng)理（假定完全代表銀行）與企業(yè)經(jīng)理（假定完全代表企業(yè)）之間的博弈。下面的討論中銀行信貸經(jīng)理是符合“經(jīng)濟(jì)人”假設(shè)的、有趨利避害傾向的人；銀行信貸經(jīng)理和企業(yè)都開始尋租。

1.商業(yè)銀行與國有企業(yè)的尋租行為的博弈分析

(1)基本假設(shè)：假設(shè)銀行貸出款項為L，進(jìn)行貸中檢查則會對銀行信貸經(jīng)理造成BL的聲譽損失，如果不進(jìn)行檢查當(dāng)貸款成為不良貸款，則會對其造成βL的損失（其中β為不進(jìn)行檢查，貸款成為不良貸款的概率）；如果銀行信貸經(jīng)理檢查出貸款企業(yè)有騙貸行為則會得到αSL（α為比例，SL為檢查出企業(yè)有逃債行為時對企業(yè)的罰款）的獎勵；如果企業(yè)經(jīng)理逃債被發(fā)現(xiàn)后對其造成的損失為NL；如果企業(yè)經(jīng)理逃債，則企業(yè)經(jīng)理向銀行信貸經(jīng)理做公關(guān)活動費用RL（由企業(yè)承擔(dān)），銀行信貸經(jīng)理接受就不再檢查這筆貸款，不接受就會檢查這筆貸款，如果銀行信貸經(jīng)理接受，企業(yè)經(jīng)理會因為與銀行關(guān)系改善而獲益TL萬元（純粹個人獲益）其中L,S,B,N,R,T均大于零，則我們可以得到收益矩陣如表1所示。

由于本博弈是一個非對稱博弈。現(xiàn)在存在兩個不同的博弈群體，一個是在博弈方1位置的銀行信貸經(jīng)理群體，一個是在博弈方2位置的國有企業(yè)經(jīng)理群體，每次博弈實際上都是前一個群體中的一個成員與后一個群體的一個成員進(jìn)行的。因此現(xiàn)在我們的分析框架是，反復(fù)在兩個群體中各隨機(jī)抽取一個成員配對進(jìn)行上述博弈，博弈方的學(xué)習(xí)和策略模仿局限在他們各自所在的群體內(nèi)部，策略調(diào)整的機(jī)制仍然是與兩人對稱博弈中相似的復(fù)制動態(tài)。

我們首先來看特殊情形，當(dāng)α=β＝0，即對銀行信貸經(jīng)理沒有獎懲措施時，此時上面的博弈存在Nash均衡（不檢查，逃債）。也就是說此時銀行信貸經(jīng)理存在檢查惰性。很明顯，在這一博弈中，受損失的是商業(yè)銀行，L萬元的貸款分文不能回收；受益的則是銀行信貸經(jīng)理、國有企業(yè)經(jīng)理和國有企業(yè)。即使銀行是國有商業(yè)銀行，這一過程也會造成社會福利的凈損失，因為銀行損失L萬元，其中銀行信貸經(jīng)理會分得RL萬元、國企經(jīng)理也會分得一部分，還有一部分在這一尋租、受租的過程中揮霍掉了，國有企業(yè)只分到L-RL-X萬元，其中X部分便是福利凈損失。因此，這種情況必須要避免，在下面的討論中我們假設(shè)αSL-RL-BL＞RL-βL,在此假設(shè)下，銀行信貸經(jīng)理的檢查惰性問題可以避免了。

在一般情形下，假設(shè)在博弈方1位置的銀行信貸經(jīng)理群體中采用檢查策略的人數(shù)比例是x，那么采用不檢查策略的比例為1-x；國有企業(yè)經(jīng)理群體中采用逃債策略的比例為y，那么采用不逃債策略的比例就為1-y。這樣，銀行信貸經(jīng)理群體中采用檢查、不檢查策略的期望收益和群體平均收益分別為：

此時的復(fù)制動態(tài)方程為：

國有企業(yè)經(jīng)理群體中采用逃債、不逃債策略的期望收益和群體平均收益分別為：

此時的復(fù)制動態(tài)方程為：

(2)討論。先討論在博弈方1位置的銀行信貸經(jīng)理群體的復(fù)制動態(tài)方程。根據(jù)該動態(tài)方程和進(jìn)化穩(wěn)定策略的性質(zhì)可知:當(dāng)這意味著所有x軸水平都是穩(wěn)定狀態(tài)，當(dāng)則分別是兩個穩(wěn)定狀態(tài)，其中當(dāng)即此時檢查為上策；當(dāng)時，即此時不檢查為上策。

再討論在博弈方2位置的國有企業(yè)經(jīng)理群體的復(fù)制動態(tài)方程。根據(jù)該動態(tài)方程和進(jìn)化穩(wěn)定策略的性質(zhì)可知:當(dāng)這意味著所有y軸水平都是穩(wěn)定狀態(tài)，當(dāng)則分別是兩個穩(wěn)定狀態(tài)，其中當(dāng)即此時逃債為上策；當(dāng)>0是ESS,即此時不逃債為上策。

2.商業(yè)銀行與非國有企業(yè)的尋租行為的博弈分析

(1)基本假設(shè)。由于私營企業(yè)經(jīng)理往往是企業(yè)的所有人，所以與上面的情形有很大差別。當(dāng)企業(yè)有逃債動機(jī)時，向銀行信貸經(jīng)理提供租金，如果銀行信貸經(jīng)理不接受而進(jìn)行檢查，則銀行信貸經(jīng)理會損失RL的租金和BL聲譽損失，同時會獲得獎金αSL萬元，私營企業(yè)經(jīng)理則會被處以SL萬元的罰款和承擔(dān)ML萬元的聲譽損失；如果銀行信貸經(jīng)理接受賄賂而選擇不檢查，則銀行信貸經(jīng)理的收益RL萬元，但會被罰款βL萬元，而私營企業(yè)經(jīng)理的收益L萬元的貸款和因與銀行關(guān)系改善而獲得的TL萬元收益。當(dāng)私營企業(yè)經(jīng)理沒有逃債的動機(jī)時，若銀行信貸經(jīng)理檢查，則銀行信貸經(jīng)理損失BL萬元的聲譽損失，企業(yè)沒有損失；若銀行信貸經(jīng)理不檢查，則銀行信貸經(jīng)理不會損失或收益什么，而企業(yè)則損失L萬元的貸款（機(jī)會成本）。則可以得到收益矩陣如表2所示。

假設(shè)條件同上面的一樣，我們可以得到當(dāng)α=β＝0，即對銀行信貸經(jīng)理沒有獎懲措施時，此時上面的博弈存在Nash均衡（不檢查，逃債）。也就是說此時銀行信貸經(jīng)理存在檢查惰性。因此在下面的討論中我們假設(shè)αSL-RL-BL＞RL-βL,在此假設(shè)下，銀行信貸經(jīng)理的檢查惰性問題可以避免了。

設(shè)銀行信貸經(jīng)理群體中采用檢查策略的人數(shù)比例是x，那么采用不檢查策略的比例為1-x；非國有企業(yè)經(jīng)理群體中采用逃債策略的人數(shù)比例為y，那么采用不逃債的比例就為1-y。這樣，銀行信貸經(jīng)理群體中采用的檢查、不檢查策略的期望收益和群體平均收益分別為：

此時的復(fù)制動態(tài)方程為：

非國有企業(yè)經(jīng)理群體中采用的逃債、不逃債策略的期望收益和群體平均收益分別為：

此時的復(fù)制動態(tài)方程為：

(2)討論。先討論在博弈方1位置的銀行信貸經(jīng)理群體的復(fù)制動態(tài)方程。根據(jù)該動態(tài)方程和進(jìn)化穩(wěn)定策略的性質(zhì)可知：當(dāng)這意味著所有x軸水平都是穩(wěn)定狀態(tài)，當(dāng)則和1分別是兩個穩(wěn)定狀態(tài)，其中當(dāng)即此時檢查為上策；當(dāng)即此時不檢查為上策。

再討論在博弈方2位置的非國有企業(yè)經(jīng)理群體的復(fù)制動態(tài)方程。根據(jù)該動態(tài)方程和進(jìn)化穩(wěn)定策略的性質(zhì)可知:當(dāng)這意味著所有y軸水平都是穩(wěn)定狀態(tài)，當(dāng)則分別是兩個穩(wěn)定狀態(tài)，其中當(dāng)x＜1是ESS,即此時逃債為上策；當(dāng),,即此時不逃債為上策。

三、分析與建議

1.分析

(1)當(dāng)企業(yè)的逃債比例大于某一數(shù)值（這一數(shù)值和對銀行信貸經(jīng)理檢查的獎懲力度負(fù)相關(guān)，與檢查時對銀行信貸經(jīng)理的負(fù)效用正相關(guān)）時，銀行信貸經(jīng)理的檢查的概率會慢慢增大到1，也就是說如果加大對銀行信貸經(jīng)理對檢查的獎懲力度，那么檢查的力度會加大，同時如果減少檢查對銀行信貸經(jīng)理帶來的負(fù)效用同樣會加大檢查的力度；反之，當(dāng)逃債的比例越低于這一數(shù)值時，銀行信貸經(jīng)理的檢查概率會慢慢減少到0。

(2)當(dāng)銀行信貸經(jīng)理的檢查比例大于某一數(shù)值（其大小與國有企業(yè)經(jīng)理從與銀行關(guān)系改善中的獲利率成正相關(guān)，與國有企業(yè)經(jīng)理的聲譽損失率成負(fù)相關(guān)）時，國有企業(yè)的逃債概率會慢慢減少到0；反之，當(dāng)檢查的比例越小于這一數(shù)值時，國有企業(yè)的逃債的概率會慢慢增大到1。

(3)當(dāng)加大對非國有企業(yè)的罰款率、聲譽損失率以及降低非國有企業(yè)經(jīng)理從與銀行關(guān)系改善中的獲利率可以有效的降低非國有企業(yè)的逃債的概率。

2.建議

(1)在銀行內(nèi)部制定更明確的權(quán)力制度和激勵約束制度，改變現(xiàn)在人人負(fù)責(zé)而又人人不負(fù)責(zé)的現(xiàn)狀。

(2)加大銀行內(nèi)部的監(jiān)督機(jī)制，形成交叉的監(jiān)督機(jī)制，能夠互相牽制、互相監(jiān)督，任何人的權(quán)限不能沒有限制。

(3)在社會上建立完善的信用體系，加大對無信用企業(yè)的聲譽損失和加大對無信用企業(yè)的懲罰力度。

(4)建立完善的法律制定，減少企業(yè)通過與銀行關(guān)系的改善而得到的獲利。

參考文獻(xiàn)：

[1]楊筱燕:金融尋租行為透視[J].煤炭經(jīng)濟(jì)研究，2001年第11期

[2]徐艷何澤榮:國有商業(yè)銀行經(jīng)營中的機(jī)會主義行為[J].財經(jīng)科學(xué)，2005年第5期

[3]董玉飛楊成良:我國信貸市場尋租活動探究[J].商業(yè)時代，2003年第17期

篇11

二、相關(guān)概念闡述

（一）影子銀行

影子銀行一詞來源于美國次貸危機(jī)爆發(fā)后，首次被Paul Mcculleys提出的。后來FBS（2011）正式指出，影子銀行是傳統(tǒng)銀行體系之外所涉及信用融資活動的機(jī)構(gòu)。這成為了國內(nèi)外學(xué)者接受度最大的界定。

我國對影子銀行的界定一直與體制外金融、民間金融、民營金融、地下金融等概念混用的現(xiàn)象。但是大家對影子銀行的基本認(rèn)知都包括未受國家法律規(guī)范，游離于監(jiān)管當(dāng)局監(jiān)管之外等等。有的學(xué)者還指出，除了金融機(jī)構(gòu)外，還應(yīng)包含金融創(chuàng)新產(chǎn)品、服務(wù)以及產(chǎn)品和服務(wù)適用的金融市場。不過由于本文討論的是兩個主體間的合作關(guān)系，故而本文所指的影子銀行即是游離于傳統(tǒng)銀行管理體系之外的非銀行金融機(jī)構(gòu)。

（二）有限理性

由于現(xiàn)實生活中許多現(xiàn)象無法用傳統(tǒng)金融學(xué)來解釋，故而后起之秀――行為金融學(xué)因合理解釋了這些金融現(xiàn)象被廣大學(xué)者所接受，行為金融學(xué)與傳統(tǒng)金融理論最大的不同之處就在于，行為金融學(xué)認(rèn)為是投資者不是完全理性人，而是有限理性人。他們總是會受到心理、環(huán)境、他人的影響而作出決定。投資行為不全是根據(jù)利益最大化原則，還包括安全最大化等等。

（三）進(jìn)化博弈模型

進(jìn)化博弈論博弈是一個動態(tài)的博弈過程，是有限理性博弈雙方群體在一定的前提下對當(dāng)前局面進(jìn)行選擇，在一個群體中得益較差的博弈方遲早會發(fā)現(xiàn)這種差異，并開始學(xué)習(xí)模仿得益較高的博弈方，后經(jīng)過自我體驗以及學(xué)習(xí)其他人的選擇，而不斷改變自己的策略。最終市場會根據(jù)“優(yōu)勝劣汰”的自然規(guī)律，形成一個穩(wěn)定的策略。這種類似于生物進(jìn)化論的動態(tài)博弈方式被稱為進(jìn)化博弈論。最終形成的策略成為進(jìn)化穩(wěn)定策略（ESS）。

本文基于進(jìn)化博弈論的研究方法，對傳統(tǒng)銀行和影子銀行二者的合作進(jìn)行預(yù)測，并判斷何時能夠達(dá)到二者自然選擇“合作”策略?；谶M(jìn)化博弈論的基本理論，我們假設(shè)傳統(tǒng)銀行和影子銀行都是有限的理性人，對兩個博弈方不再細(xì)分其內(nèi)部的個體，并且假設(shè)傳統(tǒng)銀行與影子銀行的最大的區(qū)分是是否受監(jiān)管當(dāng)局監(jiān)管。

三、影子銀行和傳統(tǒng)銀行合作問題的進(jìn)化博弈分析

我們粗略地假定我國金融市場中有傳統(tǒng)銀行機(jī)構(gòu)和影子銀行兩類機(jī)構(gòu)，而雙方面臨的選擇只有“合作”和“不合作”兩種策略，自我的選擇和其他群體的選擇都將影響自身與他人的收益。他們都將依據(jù)這種相對收益率不斷地調(diào)整自己的策略。兩個群體不斷地博弈交流，最終通過“物競天擇、適者生存”的進(jìn)化法則自發(fā)進(jìn)化到具有穩(wěn)定性的均衡狀態(tài)――進(jìn)化穩(wěn)定策略（ESS）。

1.博弈雙方的得益

我們先假設(shè)傳統(tǒng)銀行和影子銀行在非合作狀態(tài)下的收益分別為Rc和RY。我們假設(shè)，當(dāng)二者采取合作時，由于渠道拓寬，客戶量增大以及銷售效率提升，雙方的收益將會增加πc和πY，此時雙方存在一個合作的成本分別Cc和CY，且我們假定πc大于Cc，πY大于CY。根據(jù)上述假設(shè)，可以得到如表1所示的矩陣圖。我們發(fā)現(xiàn)，如果傳統(tǒng)銀行與影子銀行都是理性“經(jīng)濟(jì)人”時，表1的結(jié)果必然存在一個純戰(zhàn)略的納什均衡（合作、合作）；但是如果我們把前提假設(shè)放寬至“有限理性”，我們發(fā)展最后的進(jìn)化穩(wěn)定策略并非都是（合作，合作）

2.傳統(tǒng)銀行和影子銀行的期望得益及其動態(tài)微分方程

假定當(dāng)t時，x是傳統(tǒng)銀行群體中選擇合作策略的銀行占傳統(tǒng)銀行的且X∈（0，1），則選擇不合作策略銀行比例為1-x；同理，在影子銀行群體中，y是選擇合作策略的銀行占影子銀行的比例，且Y∈（0，1），則選擇不合作策略的銀行比例為1-y。

在傳統(tǒng)銀行群體中采取“合作”和“不合作”策略兩類博弈方的期望得益分別為μCHZ和μCNH，群體平均期望得益為μC：

3、基于傳統(tǒng)銀行群體和影子銀行復(fù)制動態(tài)微分方程的分析

從（7）式可知，傳統(tǒng)銀行群體中選擇“合作”策略博弈方的比例x的變化率與該類型博弈方的超額期望得益呈正相關(guān)關(guān)系，也與該類型博弈方的比例x呈正相關(guān)。

當(dāng)y=時，，傳統(tǒng)銀行中選擇 “合作 ”策略的銀行的比例的變化率為0，即采取“合作”策略的博弈方比例不會發(fā)生變化，此時傳統(tǒng)銀行群體處于穩(wěn)定狀態(tài)。當(dāng)，即采取“合作”策略的銀行獲得超額收益，那么，選擇“不合作”策略的銀行將逐漸發(fā)現(xiàn)并調(diào)整策略的策，選擇“合作”策略，選擇“合作”的比例x會向趨近1，此時是該群體復(fù)制動態(tài)下的一個ESS。當(dāng)，即采取“合作”策略的博弈方的期望得益小于群體平均得益。那么，選擇“合作”策略的銀行也會逐漸選擇“不合作”策略，采取“合作”策略的博弈方數(shù)量會逐漸減少，直到X=0 ，此時是該群體復(fù)制動態(tài)下的另一個ESS。下圖1給出了上述三種情況的動態(tài)變化的相位圖和穩(wěn)定狀態(tài)。

同理可知影子銀行群里的情況。當(dāng)，在影子銀行里選擇“合作”策略銀行比例y的變化率為0 ，即y不會發(fā)生變化，此時影子銀行群體處于穩(wěn)定狀態(tài)。當(dāng)0，即選擇“合作”的影子能夠獲得超額收益，此時采取“不合作”策略的銀行將會調(diào)整策略，最終選擇“合作”，之后y會向趨近1，當(dāng)y=1時，該群體處于進(jìn)化穩(wěn)定策略。當(dāng)，表示，選擇“合作”的影子銀行不能獲得超額收益，甚至所獲得的收益低于平均收益，故而采取“合作”策略的銀行數(shù)量會調(diào)整策略，y會向趨近0，此時是該群體復(fù)制動態(tài)下的另一個進(jìn)化穩(wěn)定策略。下圖2給出了上述三種情況的動態(tài)變化的相位圖和穩(wěn)定狀態(tài)。

4. 傳統(tǒng)銀行與影子銀行合作的進(jìn)化博弈系統(tǒng)復(fù)制動態(tài)分析將傳統(tǒng)銀行和影子銀行兩個特殊群體類型的比例變化復(fù)制動態(tài)的關(guān)系用一個坐標(biāo)平面圖表示，可得到下圖3：

相關(guān)范文

進(jìn)化博弈理論

熱門期刊

伊人久久大香线蕉成人|国产精品自在在线午夜精华在线|中文字幕乱码久久午夜|午夜福利免费区久久

<style id="av6lj"><delect id="av6lj"><source id="av6lj"></source></delect></style>

<span id="ezpqs"><source id="ezpqs"></source></span>

<strike id="ezpqs"></strike>

<div id="ezpqs"></div>

<b id="ezpqs"></b>