本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 8 X/ a! B7 g2 i# I1 M. G# _" Z
# F! {, d, a/ }. e
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% o& i7 i! t- Q7 F9 { 以下三个定义:* m8 w2 S, M, }0 |' q5 b
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 1 s3 ~, l& x" [* D* i
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 6 M- Z5 D3 j4 S0 S
所谓的双方优势策略则是指双方利益总和最大的策略。 - r0 C) J& I1 l5 V1 P2 c' @& E3 M) i7 u
[编辑本段]严格优势策略举例分析
' B1 u( V$ }& q" L! f6 ~% d+ J 一、经典的囚徒困境
2 l0 ~6 j; {3 ~ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 7 B! M9 k, y# u; T7 t) |5 q4 ?
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 b7 W9 z* e. C: q3 u
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( w6 r4 ]5 u; n, X, r 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
( B, o3 z, ~& q# q 若二人都互相检举(互相“背叛”),则二人同样判监2年。
% }- r* g+ i0 g6 u& H4 L 6 E3 U3 ?" A7 t/ z: Q
用表格概述如下:* @8 I0 r% O# x3 t8 L/ @
! F7 ^# B7 i2 D0 J, _! B3 r
甲沉默(合作) 甲认罪(背叛)
9 X/ H4 f% U$ ?* H" c1 ]乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
; x% }+ U) |, L) E4 t8 G乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
' _" e3 M R/ i4 _, T9 O) |/ M$ Z! N3 Q9 Q
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
; l( Z R0 O' ] 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 Y% |0 a7 Q& o2 R9 l; ~; d 若对方沉默、背叛会让我获释,所以会选择背叛。
2 J% A# t% p" @$ Z# F4 \ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 7 T& Z1 Z0 y/ t1 o0 X# a
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
! \9 v3 _4 c; u& r' D$ ]& r, ? 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! |( [, O! u/ E) [- T q0 N
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 h) m" a1 ~* O$ F$ h[编辑本段]二、智猪博弈理论
% |% D% I. c8 o0 P% }2 ` 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ' r% u- S; L: d9 _7 ^, R" A
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 4 g5 S& @! e8 `1 T- N
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & k+ ~8 E7 T1 E: G# ^2 L
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 V. F( ~# [* F) v4 I, o7 S, ]
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ' p* |# ~& I3 S; g
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 f6 n9 X) \0 y1 |; ]8 L
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 C+ Z+ Z% X' K& L
. |, X- \+ @: x* d" @三、关于企业价格策略
3 e$ m8 G- Y+ Q3 n. {& a* Y: D! a: F9 G+ s+ P
' p; N/ Z8 C. j 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
6 G. G' X ^ {: X 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 r1 @ T- \, s
以下三个定义:% R/ g! T7 B) Z' c( `2 G
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' B' o) \; D3 g0 ^( d* C 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 k! p9 A2 U6 v; _
所谓的双方优势策略则是指双方利益总和最大的策略。
) B* I& C2 G% C[编辑本段]严格优势策略举例分析
8 p$ C6 D T2 ]6 {' i, c& m; K 一、经典的囚徒困境 & C: D' k2 j; u+ z( D- F$ w
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
# {/ N( y/ p9 o8 y& V$ f) } 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
: G5 _+ n4 g/ ] 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 @, k: {' D8 ~# @ b) a
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 7 m+ z/ p$ a, W* [3 q
若二人都互相检举(互相“背叛”),则二人同样判监2年。4 _" ~. q( H, ~9 o4 N
2 k6 a* e4 c6 ~$ X0 l& ?
用表格概述如下:" ^1 w3 }$ s+ j
- _7 \/ H$ E% T! H
甲沉默(合作) 甲认罪(背叛)
' s$ O4 s" P( U1 H2 O$ Q0 d乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
! v, A) r$ \# `乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
! p' \- j4 Y( H d
2 ~3 Y3 i7 f4 K: m 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 2 I" E; { D3 G" Q5 ^( U8 t* a% |
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
3 y6 e0 j- y0 y* { 若对方沉默、背叛会让我获释,所以会选择背叛。 2 r% _, q+ a- T3 l
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 6 s+ t4 A" \8 D) ^& @$ t! c( S, F$ w0 J
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
& S3 u7 C6 h2 d' l 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
( m# X) ~! D" @. }( H" u5 e 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。) @! H5 y/ `) b2 S3 M
[编辑本段]二、智猪博弈理论7 L. K" ~" `7 ]8 i% Q8 r) _' V
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
: b2 `+ @$ i2 {" P$ \ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # O0 I; g/ y2 X
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 % m" }% R$ c' o) R' y Q0 z5 G$ B
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 z4 d6 b& F* M “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ( ~- c2 w$ F, h: {4 }
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
' y4 P" x- A0 Y) T7 G# q- `1 G 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 h& b' u( C: e; f% L6 t' S . d6 F3 ?5 }% T% N5 ^9 e
三、关于企业价格策略
6 x& c6 z" ?+ O1 J1 L" e5 w1 o0 l/ Q
1 b3 p. K) l5 c) O 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ' ]6 k( C7 W& y* ?% ]9 |6 g
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);* u4 V9 c5 F! c! H: v6 _& R
以下三个定义:
* ?3 K7 [3 ^, T- \, r5 Z 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
, X$ d; m6 }# { 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
) n+ y* J" Q3 C Y/ z& z C \ 所谓的双方优势策略则是指双方利益总和最大的策略。 3 V! S. Y* O) y9 [/ S; u
[编辑本段]严格优势策略举例分析# P+ ]9 u/ Y. u V" O
一、经典的囚徒困境 - @4 ~+ K' l( R2 E/ R0 T
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 2 T1 m& k4 @9 H" U2 T, A3 O
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' K" b6 ~; w7 H6 [+ d7 ^
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
3 F; m q# s' o" U" {7 K' t 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ C# w! t; F3 q6 ]# D$ F& u 若二人都互相检举(互相“背叛”),则二人同样判监2年。
: W0 g' ~+ z; v& O - |% x& P, E0 I' b( s
用表格概述如下:
6 E( ^7 N! h) a9 u6 \ \3 h( {! ~8 E; H6 j8 C8 d
甲沉默(合作) 甲认罪(背叛) 3 z2 Y" h. _2 J: I ^
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
3 n( m% ?. V7 y, a/ p6 ] p4 N乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 $ ?6 E, G) e% \6 Q+ U+ L
% {: e6 q4 Q; M 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; {) x3 u' T2 P2 B& ?0 l+ \6 R
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 5 q4 L; z6 ^% A% r$ }1 ^
若对方沉默、背叛会让我获释,所以会选择背叛。 , F- z6 S+ }+ ~$ M1 D( H9 ^
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) m! m7 ` l# M 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 L( j$ i( F f3 F8 U 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 E/ N: ]) _" \" D9 X
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
& F% M" d& u9 O8 U3 j q[编辑本段]二、智猪博弈理论' l- C+ t6 u1 r+ H
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
3 a# \- |! ^# E) b" g" | 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 H& c$ _" W: o% \8 J7 N+ Y" o- q: A9 I 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
/ A" W) D- F5 |: E3 a6 k 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
7 Z) E* U0 y1 S Z6 P! W “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! w# J* i+ @3 k3 i* ~6 p# U 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 5 g# [6 A# K9 {# f+ {; O+ e
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
( Z W0 m& b0 D _7 e - G3 m6 r% Q# h
三、关于企业价格策略
6 b6 o1 O+ S2 K/ Q
( b* H: P2 \! u
4 o/ y( {0 C% a7 s, N 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; t& D, U4 W" X7 P% F 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);& D2 L( y1 {7 x! n- n, ]
以下三个定义:
* D# h' ~# T$ g' v; W% M 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
7 S2 Q3 Z2 N, e8 } 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * J" }- R, N1 b' ]9 e9 K( h
所谓的双方优势策略则是指双方利益总和最大的策略。 t9 }1 Q2 O# s- o
[编辑本段]严格优势策略举例分析
- n& G: }; M5 c( {" s* o7 @ 一、经典的囚徒困境 * |6 b0 m) ^/ \ u; H( x
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 1 r; o* g! m& I' y: c
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
3 b) G4 s/ _% ?) ?$ [9 y 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
. B5 k y X9 T. E/ D& M' s/ W5 d 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 : z3 n+ t, D5 h _5 A
若二人都互相检举(互相“背叛”),则二人同样判监2年。3 z4 a9 ~9 l$ Q
5 _4 P: d: k6 i- R! J- U
用表格概述如下:
5 R b: ^: P( \5 f
3 A9 F$ z+ v" v" h6 Y6 ]8 o9 T- L 甲沉默(合作) 甲认罪(背叛) 7 u0 e! x5 p2 q8 ^; y/ X8 ]
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 * J' ?9 }/ y0 I
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 & V" V4 P4 ^* S' n
2 b( r' T \, J; `5 K$ }
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 6 K$ O0 {2 }& q& I; n* m/ i5 a
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ! _; N) t2 y0 ]& _! }
若对方沉默、背叛会让我获释,所以会选择背叛。 # s; w0 O, o& c* f, B
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
% t8 H7 H7 x# U4 v 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
: Y( h0 }2 Z( |6 `4 U% a5 N$ v: ~/ ~3 R 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; g F8 X1 `8 R4 m* [: T- [ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。1 r3 L- O7 |" `" E+ A: J1 q7 X: L5 i
[编辑本段]二、智猪博弈理论
, H- X& z3 B$ D2 T$ i3 x1 C 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 : ?& V( R3 M' p6 k
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
* E# l2 [; [' W8 E. z* h! u- ] 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* i: n- Y8 T5 |, z) B5 S 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( \8 N) `0 j; ^. I5 } “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) U3 v# e I4 H- m0 X6 N7 J
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
a) U: p }8 k0 o& { 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
0 s/ t8 }% D% P: C' m2 N* v& {+ F
- k m$ e+ ^5 ^0 z三、关于企业价格策略) a" Y6 w1 Q$ P
8 S% S6 W* t2 _0 T' Q/ z9 s
% S+ `" k0 v; w ^ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 9 S) X) F- g% \; \" Q' u* [6 r1 P
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |