- 書名:《賽局意識》- Game Theory and the Art of Transforming Strategic Situations
- 目標:複習所學的賽局原理、「運用賽局理論創造策略優勢」
- 緣起:修完經濟系的賽局理論卻無法將學到的理論跟生活結合,因此想讀一些案例
如何改變賽局、取得優勢策略
- 許下策略
- 引入管制
- 合併或共謀
- 威脅報復
- 建立信任
- 培養關係
第一章:許下策略
經典的囚徒困境賽局
- 優勢策略(dominant strategy)自己的所有策略中,存在某一個策略 s,無論對方選什麼、這個 s 都會比我的另一個 s’ 還要好,則稱 s’ is strictly dominated by s。如果所有 s’ 都被我這個 s 給 S.D. 的話,那這個 s 就是 strictly dominant strategy。 (白話文:不管對方做什麼決定、你現在做的決定都是自己比較好的決定)
- 最佳反應(best response)在對方的策略給定 s’ 之下,我的某策略 s 比我的其他策略都還要好,則 s 就是針對 s’ 的最佳反應。
- 誘因方向(incentive arrow)就是課本教的大於符號,代表某個 s 比另一個 s’ 還要好。
- 因為無論給定的是對方認不認罪,我選擇認罪一定是在此條件下最好的結果。這造成兩人都達到優勢策略,因此選擇相較之下較差的「一起認罪」,出不了這個困境。
- 囚犯困境:對整體最好的狀況是兩個人都不認罪、這樣兩人都能做半年牢就出獄,可是最後卻到達均衡解兩個人都認罪,這是納許平衡無法對總體帶來最佳利益的例子。
- 我們現在俗稱「囚徒困境」只要個人誘因 v.s. 公共利益的衝突過大,大到人人都只追求私利、人人都受害,都算是囚徒困境。(e.g., 頂新黑心油,為了私利每一家工廠都決定跟上,造成社會大眾受害)
囚徒困境:低價戰(屬於 競爭性定價賽局,參考第三章 - 合併或共謀)
- 燦坤對上全國電子、中油卯上台塑、家樂福火拼大潤發…
- 最佳解:兩方合作,協議把價格訂高、兩人一起均分高營收
- 雖然雙方協議都不降價是最佳解,但無論是哪一家廠商,短期看對自己最有利的情況其實是「我降價,對方不降價」結果就是兩方都賠錢
囚徒困境:關稅戰
- 雖然最佳解是共同合作、訂一個降低關稅協定,但短期看對自己最有利的情況其實是「我提高關稅,對方不動」結果就是兩方都變成關稅壁壘
囚徒困境:軍備競賽
- 雖然最佳解是和平都講好削減武器,但短期看對自己最有利的情況其實是「我提升軍備,哪天想打就可以打」另一個原因則是「我也說不準對方會不會偷偷準備武器,我還是要準備好放著」結果就是兩方都花大錢買武器來遏止對方進攻
賽局樹: Sony 產品 PS2 案例
Sony 產品 PS2 具有先行者優勢,此時 Microsoft 的產品 Xbox 正要決定是否進入市場。對於微軟的最佳狀況是「微軟進入+Sony妥協」而對 Sony 最佳則是「微軟別進入,Sony壟斷」,對兩者同時為最差的結果則是「微軟進入、Sony大打價格戰」兩方都賠錢。
微軟應不應該進入市場(跟進,Me-too)?
微軟需先預測 Sony 的反應。如果 Sony 妥協則可以小賺錢,如果 Sony 開戰則會兩人都賠錢,如果不進入市場當然不賺不賠。需要注意的是,因為研發成本太高,所以只要一進入市場後,就不會停產而是一直賣下去,不管賠不賠都是盡量賣掉。
那麼,Sony 有可能打價格戰嗎?
不可能。假設 Sony 在微軟進入市場前,就先表態「我會跟你們打價格戰」並沒辦法說服微軟,因為如前面所述,微軟進入市場後就不可能被誘導而下架,所以 Sony 跟他打價格戰也只是雙方都虧而已。想也知道 Sony 不會真的開打。因此價格戰的誘因只剩下等到下個產品週期時嚇阻對手不要進場。但如果現在就賠掉太多錢,下個產品可能連開發都沒錢了。
因此,Sony 不會先發制人,只能選擇讓微軟跟它共存。這種賽局樹很重視誰先出招(回溯平衡!!),結果跟先後順序有關,就是上課教的 Sequential Game (Dynamic Game)。
複習:納許均衡、回溯均衡、承諾均衡
- 納許均衡(nash equilibrium)某組策略組合使得每個人在其他所有人的策略之下,他的策略都是當前的最佳反應,則這組組合稱為納許均衡。(白話文:先參考其他人決定後,再來做對我最有利的決定。例如自由選擇左駕右駕,發現大家都右駕那你當然也會右駕。)
- 納許均衡不一定到處都可使用,例如有先後順序的 Sequential Game 就不行(因為需要修正才能用)但我們可以用另外兩種均衡來處理這種「有人先出招」的均衡
回溯均衡
- 核心假設:後動者必然對先行者的行為作出 best response。
- 要找 依序行動(sequential move)賽局的回溯均衡,要使用賽局樹來代表賽局以及移動順序。簡單來說就是從樹葉向根回推。
- 在範例中,因為壟斷者是建廠比較快的人(先行者)所以根節點畫的決策是壟斷者而不是進場者
- 其實就是上課教的 sequential game 解法
假設磁碟市場目前被一家名為「壟斷者 A」的企業壟斷,然後有一家「進場者 B」想要來瓜分市場。壟斷者有個前提是,因為經驗足夠所以他的建立新廠速度大於進場者。其他條件均相同。
- 假設沒人想動,則變成 1 個廠,就是 A 自己原本那一個工廠,A 通吃
- 假設 B 想多蓋一個,則變成 2 個廠,現在 A, B 要瓜分獲利
- 假設 A 想多蓋一個,則變成 2 個廠,A 通吃但成本變高
- 假設 A, B 都想多蓋,則變成 3 個廠,供過於求雙方都賠錢
我們可以做出以下報酬矩陣:
畫出兩人的 best response 會發現左下象限是納許均衡,也就是兩人瓜分市場,但這絕不會發生,因為 A 不會這麼笨。回想前面的假設(壟斷者蓋廠速度更快)壟斷者 A 可以搶在進廠者B 之前開始蓋,身為後進者的 B 一但看到 A 要開始蓋,他就不會繼續蓋了(不然就虧錢,因為會有 3 個廠)這會進入右上象限。對 A 來說,當然右上更好,雖然他花錢多蓋一個廠,可是他又能壟斷了。這是一個納許均衡不是最佳解的例子。
回溯均衡通常不會像上面那樣用報酬矩陣分析,而是用賽局樹。我們追蹤後動者可能如何反應先行者的舉動(i.e., 從樹葉往前推)。當先行者預料後動者可能的反應時,再決定他要如何出招(i.e., 推完樹葉後,再從根往後推)。詳細作法如圖所示。
承諾均衡
- 回溯均衡的核心假設是,後動者必然對先行者的行為作出 best response。
- 也就是:「如果 A 承諾多建一個廠,則進入者就被嚇到不敢建廠」
- 但如果進入者 B 先喊話,讓 A 相信他無論如何都會建一個廠,來瓜分市場呢?
-
這樣就變成 A 嚇到不敢建廠了。(要不然三廠並存,A 就虧了,只好乖乖跟他瓜分兩廠)
- 這就是雖然先行者可以先出招,但後動者有絕對的承諾力量,這稱為承諾均衡。
定義比較
- 「回溯均衡」適用於有行動次序的賽局,先行者會先推算後動者的最佳反應、然後做出對自己最有利的行動,並預期後動者會針對他的行動做反應
- 承諾均衡」適用於有承諾行動的賽局,後動者會先推算先行者的最佳反應、然後做出對自己最有利的承諾,並預期先行者會針對他的行動做反應
- 關鍵都是「承諾是否被完全相信」
第二章:引入管制
有時囚徒困境會掉入很差的結果,但因為雙方都是做出優勢策略所以又不得不做。此時外力介入(引入管制的話)可以讓這個很差的結果不再是優勢策略,而是轉移到另一個次差的結果。總體來說還是好的。
案例:菸商不打廣告反而賺更多?
以往菸商花很多錢買電視廣告,也證實可行:當多家菸商競爭時,最佳解就是落在所有人都做廣告,因為任一方不做廣告都會被電翻。這個情形維持一直到後來廣告太扯、造成國家出面反應,決定訂定「公共衛生吸菸法」開始進行反菸宣導(引入管制)。此時菸商發現如果繼續用廣告、而國家也繼續反菸的話,這樣扣掉之後的結果是虧錢的。因此菸商和政府討論,以後我們不打廣告、而且還多在包裝上印反菸宣導,而國家則是依照要求停播反菸宣導。
有時結果會掉入囚徒困境(大家都打廣告、結果扣掉反菸宣導的成本反而人人都虧錢),但因為雙方都是做出優勢策略所以又不得不做。此時外力介入(禁止廣告菸品)可以讓這個很差的結果不再是優勢策略,而是轉移到另一個次差的結果(大家都不花錢打廣告、也不再有政府的阻擋)。總體來說還是比原本好。
案例:「終結被輕忽疾病」之修正案
以往的藥廠以營利為目的,沒有人想要開發新藥去解決那些遭到輕忽的熱帶疾病,因為對股東沒有好處、還不如去開發更好賺的藥品。因為對所有藥廠來說,賺錢都是優勢策略所以不得不做,沒人有錢去做慈善。英國國會的「終結被輕忽疾病」修正案獎勵製藥公司開發新藥來對抗抗被輕忽疾病,如果開發出來就能獲得「優先審查權」,這個權利價值上億,因為這代表你開發的新藥可以很快速的上市、不需要排冗長的隊等審查通過。最後結果是好的:現在的藥廠在開發新藥時,除了已開發國家的常見疾病、他們也更願意優先考慮被輕忽疾病。
第三章:合併與共謀
競爭性競價賽局
- 兩家競爭公司賣相同商品。他們都寧訂低價來獲得最大份額市場(最佳結果)而不是以高價來分享市場(次佳結果)
- 由於兩家都寧願用低價,不論對方做什麼、雙方都有他自己的優勢策略:愈低越好
- 結果就是,當他們都採用優勢策略訂定低價時,結果都比雙方都訂高價還差,甚至雙方都越壓越低,這是一個囚徒困境。
反托拉斯主義
- 為了解決這種價格戰,有某方可能會提出「合併」 兩家公司,就能立刻使他們壟斷整個市場。
- 但如此集中的權力受到政府反彈。羅斯福總統曾提出「打擊托拉斯」作為主要政策。
- 托拉斯為什麼不好?因為這些人把其他小廠商逐出市場後,就能恣意抬高價格、傷害消費者。
- 比較好的做法是,不要有獨大的、但可以有好幾家小的各自組一組,變成成對的廠商競爭。共謀不一定是壞事。
卡特爾化(cartelization,壟斷、企業合併、聯盟)利用合併參賽者來照顧集體利益,脫離惡性競爭的囚徒困境。
第四章:威脅報復
案例:墨西哥僵局 Mexican Standoff (相互保證毀滅賽局)
兩個亡命之徒在酒館前,拔出左輪手槍決一死戰,但兩人抽出槍之後卻都只是僵在那裡、沒有扣板機,為什麼會落到這個平衡?
假設兩人都非常準,一射出就是射中心臟,雖不馬上致死但也是必死無疑。假設 B 不開槍,那 A 如果開槍,A 就能當第一。但假設 B 開槍,那 A 如果開槍後、雖然也死了但至少不會喪失榮譽,因為兩人都並列第一而死去。因此對兩人來說,開槍都是優勢策略。
這就陷入了囚徒困境,因為即使你先射中對方、對方被射中也不會馬上死、而是先反射性的在你心臟射一槍、然後兩人一起死。很明顯的,兩人一起死不是最好結果,因為深知對方的準度,開槍射對方就是射自己。這就是「威脅報復」之所以可突破囚徒困境的原因,因為知道會遭到報復,所以原本的囚徒困境被破壞,而是選了另一個最後結果來看其實更好(兩人都活、兩人都沒開槍)的結果。
註:相互保證毀滅賽局屬於一種「動態賽局」,他們即時發生、而且對方能馬上反應。
案例:美蘇冷戰(相互保證毀滅賽局)
美國與蘇聯就是相互保證毀滅賽局的案例,因為兩方都有核武,而且他屬於動態賽局、因為一發射就會被雷達偵測、此時對方必定會也射一發跟你同歸於盡、並不會考慮人性。也因此兩方雖然都有優勢策略,也就是直接射一發核彈、力求先發制人,但因為馬上就會遭到報復,所以會僵在那裡(兩方都活、兩方都沒發射核彈)。
第五章:建立信任
案例:爸爸的甜點與蔬菜困境
晚餐時間,爸爸有兩個目標,主要目標是讓小孩吃光蔬菜、次要目標是讓小孩不要吃甜點,怕蛀牙。而小孩也有兩個目標,主要目標是吃到甜點,次要目標則是不要吃蔬菜。
這是一個囚徒困境,因為兩方都有優勢策略,爸爸的是「不給甜點」小孩的則是「不吃蔬菜」。但這樣會落到雙方都是第三佳的結果,我們有辦法突破困境、至少轉移到都是次佳的結果嗎?
建立信任能夠突破這個囚徒困境。假設爸爸以往都言而有信、已經獲得小孩的信任,爸爸提出「假如你們乖乖吃蔬菜、吃完我就給你們吃甜點」,那小孩會怎麼做決定?這個假設一提出後,報酬矩陣就只剩下兩個象限:「吃蔬菜、也吃甜點」、「不吃蔬菜、也不吃甜點」。因為小孩優勢策略是吃甜點,所以成功達到目標選項。
這個案例的重點是,為了讓此提案有效,孩子必須相信父親的諾言。例如利用發誓、或是爸爸說謊要帶他們去迪士尼之類的承諾,來讓孩子相信這個諾言至高無上的地位。
第六章:培養合作關係
案例:黑幫的緘默守則
美國的「共濟會」兄弟會組織,是一個非常殘忍但是團結的黑手黨,警方一直無法干擾他們組織的運作,對內部毫無了解。促成合作的兩個力量是:1. 內心渴望合作與夥伴認同、2. 殘忍逞罰不合作者。
- 前者的力量就是「真愛」很好的詮釋,雖然放棄愛並不會造成實體上的逞罰,但因為雙方內心都想合作,所以可以維持真愛的關係。
- 其中的 1. 比 2. 更為重要。假如共濟會只有 2. 的話,也絕不可能運作得好。因為每個人都不相信關係能持久,假設共濟會明天就倒了,老大再也沒有威嚴,那我今天逃跑、他也沒有人力會來追殺我。那我何不直接背叛你呢?
這兩個原則讓囚徒困境被成功突破,從原本的囚徒困境:「所有人都認罪」,轉移到「所有人都不認罪」。有了這些鐵則、成功讓他們拖這麼久才被警方攻陷。