笔趣阁
会员书架
首页 >其他小说 >博弈论 > 导读

导读(第1 / 6页)

上一章 章节目录 加入书签 下一页
推荐小说:

博弈中合作的过程和规律

若这个博弈只进行一次便结束,那么它在数学上是没有最优解的。若博弈可进行多次,且两个参与者知晓博弈的次数,那么理性的他们在最后一次博弈中一定会选择相互背叛,这样才能实现自身利益最大化。如果是这样的话,他们在之前的博弈中是否合作都是无关紧要的,即使两人达成了一次合作,也是没有必要的。所以,参与者在知道博弈次数的情况下不会进行合作。

除了价格战博弈论、污染博弈论,现实中还有一种博弈论值得人们深思,这就是贸易战博弈论。一个国家在国际贸易方面往往有两个选项:一是保持贸易自由;二是实行贸易保护。贸易的自由和壁垒之间也能形成一个纳什均衡,这个均衡的代价是高昂的,它会使贸易双方采取不合作策略,陷入永无休止的贸易战当中。贸易战一旦打响,必定会使双方的利益都受到损害,所以这是一个双输的策略。例如,A国为了自身利益,采取进口贸易限制策略,提高关税,使出口国B的利益受到损害。B国为了防止利益受损,以同样提高关税的方式进行反击,最终两国利益都受损。相反,如果A国和B国能够达成合作,形成一种合作性均衡,两国都遵循互惠互利原则,减少或免除各自的关税,这样一来,双方都能从自由贸易中获利,与此同时,全球贸易的总收益也会不断增高。

但是,如果这类博弈是在多人之间进行的,同时每一个参与者都不知道具体的博弈次数,那么在这种情况下,参与者就会意识到这个问题,即在持续地选择合作时,每一个人都能持续且稳定地得到3分。若彼此持续不合作的话,每个人只能持续得到1分而已。通过这样的思考,参与者之间的合作动机就非常明显了。多次博弈的过程中,参与者未来的收益要比现在的收益增加一定的折现率,这个折现率越大,则未来的收益越重要。这个时候,参与者的最优策略就与别人采取的策略产生了联系。我们假设一个参与者第一次选择合作策略,之后一旦对方不合作,他便选择永不合作。与这种参与者进行博弈,一直与他合作下去当然是最有利的。我们再假设无论别人采取何种策略,这个参与者都选择合作,那么与这种参与者进行博弈,始终不与他合作才能获得最高的分数。同时,我们对于那些总是不合作的人往往会采取不合作的策略。

发展经济和环境污染是一对矛盾,一般来说,发展经济势必会造成环境污染。这种矛盾便造就了污染博弈。发展市场经济会带来污染问题,如果政府不加以管理,企业就会为了利润而牺牲环境。为了追求利润最大化,企业不会增加环保设备,为了生产产品而产生的污染物便难以处理,这将直接造成环境污染。若所有企业都坚持实施不顾环境污染,只为追求利润最大化的策略,就会步入纳什均衡状态。假设在这种状态中,一个企业愿意从利他的角度出发,购买环保设备,增加治理环境污染的成本,那么其总体生产成本也会水涨船高,成本一高,企业就会提高产品价格,导致产品失去市场竞争力,这样一来企业很难维持经营,甚至有可能破产。要打破这一魔咒,政府就要加强防污染管理,使企业在追求利润的同时也要兼顾环境保护。当所有企业都愿意在环境保护的基础上追求利润时,社会的整体效率就会提高,这又会反过来弥补企业在环保方面的投入,最后,不仅社会环境会变得更好,经济也能又好又快地发展。

阿克塞尔罗德根据这些思想制定了一个这样的实验:他邀请一群人来参加这个博弈游戏,得分规则与我们提到的A和B之间的合作博弈一样,但没有人知道这个游戏何时结束。阿克塞尔罗德要求每一个参与游戏的人把自己认为得分最高的策略编成计算机程序,然后让这些程序两两博弈循环进行下去,看一看究竟哪种策略的得分最高。

美国博弈论专家罗伯特·阿克塞尔罗德在研究合作型博弈时首先设定了两个前提条件,第一个条件是每个参与者都是理性的(自私的);第二个条件是没有外界因素干扰参与者的个人决策。这就意味着,在合作博弈中,每个参与者都会为了利益最大化进行决策。在这两个条件下,罗伯特·阿克塞尔罗德研究了以下三个关于合作的问题:一是博弈者为什么要合作;二是博弈者在什么时候合作,什么时候不合作;三是博弈者如何使别人与他合作。

每场博弈中都会涉及三大要素:参与者、策略、得失。在囚徒困境中,两个囚徒是博弈的参与者,他们选择的策略都是承认杀人事实,结果两人都赢得了中间宣判结果。而如果一名囚徒承认杀人事实,另一名囚徒不承认杀人事实,其结果是承认者获得减刑,否认者获得死刑。最后两个理性的囚徒在经过慎重考虑之后,都选择承认杀人事实,这样一来他们都获得了稳妥的保命结果。除了囚徒困境,我们还能在自私基因、智猪博弈等理论中找到这种均衡解。

这三个问题的研究意义深远,它们在社会实践中的合作问题上多有体现,比如贸易博弈中如何通过合作使博弈双方都能获得稳定收益的问题等。在博弈过程中,若参与双方都追求自身利益的最大化,就会损害群体利益。

博弈理论中存在一些对人的基本假定,比如它假定参与博弈的人必须是理性的,而理性就意味着他在博弈中是从自己的利益出发的,或者说他是自私的。理性的人在博弈过程中会将自身利益最大化作为目标,博弈论的研究也是建立在理性人之间的博弈之上的。约翰·纳什利用他创造的囚徒困境博弈故事清楚地说明了纳什平衡的存在,即在非合作博弈中存在一个均衡解,这个解可使博弈双方的利益都获得保障。

举例来说,若现在进行一场合作博弈,A、B分别代表博弈双方,两者都能自由进行无差别选择。现在,摆在两人面前的选择有两个:合作和不合作。我们用Y代表合作,用N代表不合作,并设定以下规则:若A和B都选择Y,两人都得3分;若A和B都选择N,两人都得1分;若一人选Y,另一人选N,选Y的人得0分,选N的人得5分。

实际上,企业之间的完全竞争所能达到的均衡是一种非合作博弈均衡,即纳什均衡。在这种稳定状态下,企业要销售产品,就会按照其他企业的定价来定价,消费者要购买产品也会参照各企业的定价来决定是否购买。企业的目标是实现利润最大化,消费者的目标是争取产品效用最大化。由于这是一种零和博弈,所以两者的利润之和是零。此时,企业所制定的产品价格就等于边际成本。企业之间处于完全竞争的状态时,非合作行为能保障社会的经济效率。如果企业进行合作并采用垄断价格,那么就可能影响社会经济效率。正是由于这个原因,世界贸易组织和各国政府才会反对企业垄断。

第一轮游戏总共有15个程序参加,包括阿克塞尔罗德自己制定的一半概率合作一半概率不合作的随机程序和14个主要考察对象设计的程序。在两两循环博弈进行了300次后,阿克塞尔罗德终止了游戏,最后的结果显示,加拿大学者罗伯布的一报还一报程序获得了最高得分。一报还一报程序的特点在于第一次对局采取合作策略,之后每次对局都以对手上一次的策略作为参考,即对手上一次选择合作,我这一次就选择合作,对手上一次选择不合作,我这一次就选择不合作。阿克塞尔罗德对得分较高的程序进行了分析,他发现得分排名靠前的程序一般有三个特点:一是具备善良性,即从来不主动背叛别人;二是具备可激怒性,即对于别人的背叛不能一直许以善意的合作,还要具备一定的报复;三是宽容性,即别人背叛了你一次,你不能无休止地进行报复,而要在别人选择合作的时候与其合作。

然而,商家之间的博弈是一种零和博弈,价格战一旦打起来,往往谁都没钱赚。博弈双方的利润之和正好是零,这意味着一方获利,必有一方受损。价格战的博弈永远不可能达到双赢或多赢的局面。价格战博弈属于一种恶性竞争,通常会导致多输局面,不过,其竞争的结果也会趋于稳定,达到一种纳什均衡。其结果可能有利于大多数消费者,但对企业来说却是一场灾难。因此,企业参与价格战无异于自杀。从价格战博弈中能够引申提出两个有价值的问题:第一是价格战达到纳什均衡后虽然是一个零利润的结局,但这个结局是有效率的,至少它不会破坏社会经济效率。第二是若企业之间不存在任何价格战,那么敌对博弈将会产生什么后果呢?这时,每个企业可能有两种考虑,它们首先可能考虑采用正常价格的策略,其次则是采用高价垄断策略。采用正常价格的结果是企业获利。如果每个企业都能在各自的领域内形成垄断,那么博弈双方的共同利润便会最大化。这时,它们通常会进行垄断经营,抬高产品价格。由这两种考虑,我们可以得出一个基本准则,即企业应该把战略建立在假设对手按照其最优策略行动的基础之上,或者假设自身处于利润最低的条件下,再制定应对策略。

阿克塞尔罗德没有满足已有的实验,他又邀请了更多的人重新做了相同的实验,并在游戏开始之前,向所有人公布了上一次实验的研究结果。这次实验的对弈程序多达63个,包括他的随机程序和62个研究对象的程序。经过一定数量的对局,这次实验的结果与上一次没有区别,最终一报还一报程序依然斩获了得分第一名。这次实验证明了一报还一报策略仍是最优解,同时也证明了排名靠前的程序都具有善良性、可激怒性、宽容性三个特点。63个程序的前15名中除了第8名程序是不善良的外,其余程序都是善良的;而在得分较低的后15名中,除了一个程序具有善良性外,其余都是不善良程序。另外,优秀程序具有可激怒性和宽容性也在实验中得到了证明。与此同时,阿克塞尔罗德在这次实验中还有新的发现,即优秀策略还具有清晰性,也就是说,优秀的程序通常只需要在几次对弈之后就能被清晰地辨识出来,而那些复杂的策略却并没有令人满意的得分。一报还一报策略显然就具备清晰性特点,在应用这一策略后,对手很容易发现其中的规律,并明白只有主动与对方合作才能赢得合作。

除了智能手机领域,各种家电的价格大战也不断上演。家电大战的受益者同样是消费者,每逢这种价格战时,人们似乎都会偷着乐。明明知道会亏本,为什么商家们还要不遗余力地压低价格,义无反顾地投入价格战呢?这其实就涉及博弈问题。对商家来说,其目的是自身利益最大化。压低价格虽然会使自身利益暂时受到损害,但能够吸引更多的消费者购买产品,达到薄利多销的目的,同时也能打出品牌知名度,实现品牌价值增值。另外,低价销售还可以极大迎合消费者的心理需求,使消费者在购买本品牌产品后形成长期惯性消费,为企业的后期布局打下基础。

如何找到一个最优策略

在这个例子中,对这个两人团体来说,最优的策略是两人都选Y。这样一来,每个人都能得到3分,团体得分就是6分。若两人都选择N,那么每人各得1分,团体得分是2分;若一人选Y,另一人选N,则选Y的人得0分,选N的人得5分,团体得分是5分。

博弈论的重要性不言而喻,它能左右你的生活,实现你的价值。若你想成为一个对社会有价值的人,你要学习博弈论;若你想在商场上叱咤风云、获得成功,你要学习博弈论;若你想赢得生活,成为可被人信赖的人,你也要学习博弈论。总之,博弈论已成为当今社会不得不了解、不可不学习的重要理论之一。

该博弈论通过得分矩阵可以清楚地描述个体理性与团体理性之间的矛盾。若个人在博弈中追求利益最大化,就会使群体利益受损,这就是这类博弈所体现的重要内涵。站在A的角度来考虑,可以发现,若B选Y, A在选N的情况下可以获得最大化利益,即5分;若A在B选择Y的前提下选择了Y,他可以得3分;若B选N, A也选择N,他只能得1分;若A在B选择N的前提下选择了Y,他只能得0分。A所能获得的可能得分从高到低分别是5分,3分,1分,0分。对A来说,要使自身利益最大化就是得5分;要使团体利益最大化就是得3分。其中的困境在于如何使每个人在选定策略后都能得到稳定的分数,同时还不让自己离利益最大化太远。个人得5分虽然可以实现其自身利益最大化,但整个团体的分数只有5分;若每人得3分,团体得6分,团体利益就能实现最大化,但个人只能获得3分,距离他们的最高目标5分还差一些。这就是个人理性和团体理性之间的矛盾。

博弈论是现代社会一个热门的研究课题,它不仅存在于运筹学中,也存在于经济学中。近些年,它在学术界的地位越来越重要,许多诺贝尔经济学奖都与对博弈论的研究相关。事实上,博弈论并不是高高在上的学术话题,它所涉及的应用领并不狭隘。在我们的学习、工作和生活之中,随处可见博弈论的身影,比如我们在学习时要与老师、同学博弈,在工作时要与上级、下属、客户、竞争对手博弈,在生活中要与家人、朋友博弈。博弈就在我们的身边,用博弈的方式去思考问题将会给我们带来不一样的思想体验。从某种程度上来说,博弈论意味着一种全新的思想或一种全新的理解分析的方法。

点击切换 [繁体版]    [简体版]
上一章 章节目录 加入书签 下一页