关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 8 X/ a! B7 g2 i# I1 M. G# _" Z
# F! {, d, a/ }. e
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% o& i7 i! t- Q7 F9 {  以下三个定义:* m8 w2 S, M, }0 |' q5 b
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 1 s3 ~, l& x" [* D* i
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 6 M- Z5 D3 j4 S0 S
  所谓的双方优势策略则是指双方利益总和最大的策略。  - r0 C) J& I1 l5 V1 P2 c' @& E3 M) i7 u
[编辑本段]严格优势策略举例分析
' B1 u( V$ }& q" L! f6 ~% d+ J  一、经典的囚徒困境
2 l0 ~6 j; {3 ~  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 7 B! M9 k, y# u; T7 t) |5 q4 ?
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 b7 W9 z* e. C: q3 u
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( w6 r4 ]5 u; n, X, r  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
( B, o3 z, ~& q# q  若二人都互相检举(互相“背叛”),则二人同样判监2年。
% }- r* g+ i0 g6 u& H4 L  6 E3 U3 ?" A7 t/ z: Q
用表格概述如下:* @8 I0 r% O# x3 t8 L/ @
! F7 ^# B7 i2 D0 J, _! B3 r
    甲沉默(合作)  甲认罪(背叛)  
9 X/ H4 f% U$ ?* H" c1 ]乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
; x% }+ U) |, L) E4 t8 G乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
' _" e3 M  R/ i4 _, T9 O) |/ M$ Z! N3 Q9 Q
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
; l( Z  R0 O' ]  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 Y% |0 a7 Q& o2 R9 l; ~; d  若对方沉默、背叛会让我获释,所以会选择背叛。
2 J% A# t% p" @$ Z# F4 \  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 7 T& Z1 Z0 y/ t1 o0 X# a
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
! \9 v3 _4 c; u& r' D$ ]& r, ?  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! |( [, O! u/ E) [- T  q0 N
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 h) m" a1 ~* O$ F$ h[编辑本段]二、智猪博弈理论
% |% D% I. c8 o0 P% }2 `  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ' r% u- S; L: d9 _7 ^, R" A
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 4 g5 S& @! e8 `1 T- N
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & k+ ~8 E7 T1 E: G# ^2 L
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 V. F( ~# [* F) v4 I, o7 S, ]
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ' p* |# ~& I3 S; g
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 f6 n9 X) \0 y1 |; ]8 L
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。  C+ Z+ Z% X' K& L
  
. |, X- \+ @: x* d" @三、关于企业价格策略
3 e$ m8 G- Y+ Q3 n. {& a* Y: D! a: F9 G+ s+ P
  
' p; N/ Z8 C. j  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
6 G. G' X  ^  {: X  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 r1 @  T- \, s
  以下三个定义:% R/ g! T7 B) Z' c( `2 G
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' B' o) \; D3 g0 ^( d* C  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 k! p9 A2 U6 v; _
  所谓的双方优势策略则是指双方利益总和最大的策略。  
) B* I& C2 G% C[编辑本段]严格优势策略举例分析
8 p$ C6 D  T2 ]6 {' i, c& m; K  一、经典的囚徒困境 & C: D' k2 j; u+ z( D- F$ w
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
# {/ N( y/ p9 o8 y& V$ f) }  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
: G5 _+ n4 g/ ]  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 @, k: {' D8 ~# @  b) a
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 7 m+ z/ p$ a, W* [3 q
  若二人都互相检举(互相“背叛”),则二人同样判监2年。4 _" ~. q( H, ~9 o4 N
  2 k6 a* e4 c6 ~$ X0 l& ?
用表格概述如下:" ^1 w3 }$ s+ j
- _7 \/ H$ E% T! H
    甲沉默(合作)  甲认罪(背叛)  
' s$ O4 s" P( U1 H2 O$ Q0 d乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
! v, A) r$ \# `乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
! p' \- j4 Y( H  d
2 ~3 Y3 i7 f4 K: m  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 2 I" E; {  D3 G" Q5 ^( U8 t* a% |
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
3 y6 e0 j- y0 y* {  若对方沉默、背叛会让我获释,所以会选择背叛。 2 r% _, q+ a- T3 l
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 6 s+ t4 A" \8 D) ^& @$ t! c( S, F$ w0 J
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
& S3 u7 C6 h2 d' l  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
( m# X) ~! D" @. }( H" u5 e  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。) @! H5 y/ `) b2 S3 M
[编辑本段]二、智猪博弈理论7 L. K" ~" `7 ]8 i% Q8 r) _' V
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
: b2 `+ @$ i2 {" P$ \  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # O0 I; g/ y2 X
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 % m" }% R$ c' o) R' y  Q0 z5 G$ B
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 z4 d6 b& F* M  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ( ~- c2 w$ F, h: {4 }
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
' y4 P" x- A0 Y) T7 G# q- `1 G  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 h& b' u( C: e; f% L6 t' S  . d6 F3 ?5 }% T% N5 ^9 e
三、关于企业价格策略
6 x& c6 z" ?+ O1 J1 L" e5 w1 o0 l/ Q
  
1 b3 p. K) l5 c) O  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ' ]6 k( C7 W& y* ?% ]9 |6 g
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);* u4 V9 c5 F! c! H: v6 _& R
  以下三个定义:
* ?3 K7 [3 ^, T- \, r5 Z  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
, X$ d; m6 }# {  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
) n+ y* J" Q3 C  Y/ z& z  C  \  所谓的双方优势策略则是指双方利益总和最大的策略。  3 V! S. Y* O) y9 [/ S; u
[编辑本段]严格优势策略举例分析# P+ ]9 u/ Y. u  V" O
  一、经典的囚徒困境 - @4 ~+ K' l( R2 E/ R0 T
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 2 T1 m& k4 @9 H" U2 T, A3 O
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' K" b6 ~; w7 H6 [+ d7 ^
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
3 F; m  q# s' o" U" {7 K' t  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ C# w! t; F3 q6 ]# D$ F& u  若二人都互相检举(互相“背叛”),则二人同样判监2年。
: W0 g' ~+ z; v& O  - |% x& P, E0 I' b( s
用表格概述如下:
6 E( ^7 N! h) a9 u6 \  \3 h( {! ~8 E; H6 j8 C8 d
    甲沉默(合作)  甲认罪(背叛)  3 z2 Y" h. _2 J: I  ^
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
3 n( m% ?. V7 y, a/ p6 ]  p4 N乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  $ ?6 E, G) e% \6 Q+ U+ L

% {: e6 q4 Q; M  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; {) x3 u' T2 P2 B& ?0 l+ \6 R
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 5 q4 L; z6 ^% A% r$ }1 ^
  若对方沉默、背叛会让我获释,所以会选择背叛。 , F- z6 S+ }+ ~$ M1 D( H9 ^
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) m! m7 `  l# M  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 L( j$ i( F  f3 F8 U  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 E/ N: ]) _" \" D9 X
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
& F% M" d& u9 O8 U3 j  q[编辑本段]二、智猪博弈理论' l- C+ t6 u1 r+ H
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
3 a# \- |! ^# E) b" g" |  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 H& c$ _" W: o% \8 J7 N+ Y" o- q: A9 I  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
/ A" W) D- F5 |: E3 a6 k  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
7 Z) E* U0 y1 S  Z6 P! W  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! w# J* i+ @3 k3 i* ~6 p# U  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 5 g# [6 A# K9 {# f+ {; O+ e
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
( Z  W0 m& b0 D  _7 e  - G3 m6 r% Q# h
三、关于企业价格策略
6 b6 o1 O+ S2 K/ Q
( b* H: P2 \! u  
4 o/ y( {0 C% a7 s, N  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; t& D, U4 W" X7 P% F  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);& D2 L( y1 {7 x! n- n, ]
  以下三个定义:
* D# h' ~# T$ g' v; W% M  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
7 S2 Q3 Z2 N, e8 }  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * J" }- R, N1 b' ]9 e9 K( h
  所谓的双方优势策略则是指双方利益总和最大的策略。    t9 }1 Q2 O# s- o
[编辑本段]严格优势策略举例分析
- n& G: }; M5 c( {" s* o7 @  一、经典的囚徒困境 * |6 b0 m) ^/ \  u; H( x
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 1 r; o* g! m& I' y: c
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
3 b) G4 s/ _% ?) ?$ [9 y  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
. B5 k  y  X9 T. E/ D& M' s/ W5 d  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 : z3 n+ t, D5 h  _5 A
  若二人都互相检举(互相“背叛”),则二人同样判监2年。3 z4 a9 ~9 l$ Q
  5 _4 P: d: k6 i- R! J- U
用表格概述如下:
5 R  b: ^: P( \5 f
3 A9 F$ z+ v" v" h6 Y6 ]8 o9 T- L    甲沉默(合作)  甲认罪(背叛)  7 u0 e! x5 p2 q8 ^; y/ X8 ]
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  * J' ?9 }/ y0 I
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  & V" V4 P4 ^* S' n
2 b( r' T  \, J; `5 K$ }
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 6 K$ O0 {2 }& q& I; n* m/ i5 a
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ! _; N) t2 y0 ]& _! }
  若对方沉默、背叛会让我获释,所以会选择背叛。 # s; w0 O, o& c* f, B
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
% t8 H7 H7 x# U4 v  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
: Y( h0 }2 Z( |6 `4 U% a5 N$ v: ~/ ~3 R  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; g  F8 X1 `8 R4 m* [: T- [  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。1 r3 L- O7 |" `" E+ A: J1 q7 X: L5 i
[编辑本段]二、智猪博弈理论
, H- X& z3 B$ D2 T$ i3 x1 C  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 : ?& V( R3 M' p6 k
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
* E# l2 [; [' W8 E. z* h! u- ]  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* i: n- Y8 T5 |, z) B5 S  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( \8 N) `0 j; ^. I5 }  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) U3 v# e  I4 H- m0 X6 N7 J
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
  a) U: p  }8 k0 o& {  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
0 s/ t8 }% D% P: C' m2 N* v& {+ F  
- k  m$ e+ ^5 ^0 z三、关于企业价格策略) a" Y6 w1 Q$ P

8 S% S6 W* t2 _0 T' Q/ z9 s  
% S+ `" k0 v; w  ^  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 9 S) X) F- g% \; \" Q' u* [6 r1 P
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )