賽局意識

書名：《賽局意識》- Game Theory and the Art of Transforming Strategic Situations
目標：複習所學的賽局原理、「運用賽局理論創造策略優勢」
緣起：修完經濟系的賽局理論卻無法將學到的理論跟生活結合，因此想讀一些案例

如何改變賽局、取得優勢策略

許下策略
引入管制
合併或共謀
威脅報復
建立信任
培養關係

第一章：許下策略

經典的囚徒困境賽局

優勢策略（dominant strategy）自己的所有策略中，存在某一個策略 s，無論對方選什麼、這個 s 都會比我的另一個 s’ 還要好，則稱 s’ is strictly dominated by s。如果所有 s’ 都被我這個 s 給 S.D. 的話，那這個 s 就是 strictly dominant strategy。（白話文：不管對方做什麼決定、你現在做的決定都是自己比較好的決定）
最佳反應（best response）在對方的策略給定 s’ 之下，我的某策略 s 比我的其他策略都還要好，則 s 就是針對 s’ 的最佳反應。
誘因方向（incentive arrow）就是課本教的大於符號，代表某個 s 比另一個 s’ 還要好。
因為無論給定的是對方認不認罪，我選擇認罪一定是在此條件下最好的結果。這造成兩人都達到優勢策略，因此選擇相較之下較差的「一起認罪」，出不了這個困境。
囚犯困境：對整體最好的狀況是兩個人都不認罪、這樣兩人都能做半年牢就出獄，可是最後卻到達均衡解兩個人都認罪，這是納許平衡無法對總體帶來最佳利益的例子。
我們現在俗稱「囚徒困境」只要個人誘因 v.s. 公共利益的衝突過大，大到人人都只追求私利、人人都受害，都算是囚徒困境。（e.g., 頂新黑心油，為了私利每一家工廠都決定跟上，造成社會大眾受害）

囚徒困境：低價戰（屬於競爭性定價賽局，參考第三章 - 合併或共謀）

燦坤對上全國電子、中油卯上台塑、家樂福火拼大潤發…
最佳解：兩方合作，協議把價格訂高、兩人一起均分高營收
雖然雙方協議都不降價是最佳解，但無論是哪一家廠商，短期看對自己最有利的情況其實是「我降價，對方不降價」結果就是兩方都賠錢

囚徒困境：關稅戰

雖然最佳解是共同合作、訂一個降低關稅協定，但短期看對自己最有利的情況其實是「我提高關稅，對方不動」結果就是兩方都變成關稅壁壘

囚徒困境：軍備競賽

雖然最佳解是和平都講好削減武器，但短期看對自己最有利的情況其實是「我提升軍備，哪天想打就可以打」另一個原因則是「我也說不準對方會不會偷偷準備武器，我還是要準備好放著」結果就是兩方都花大錢買武器來遏止對方進攻

賽局樹： Sony 產品 PS2 案例

Sony 產品 PS2 具有先行者優勢，此時 Microsoft 的產品 Xbox 正要決定是否進入市場。對於微軟的最佳狀況是「微軟進入+Sony妥協」而對 Sony 最佳則是「微軟別進入，Sony壟斷」，對兩者同時為最差的結果則是「微軟進入、Sony大打價格戰」兩方都賠錢。

微軟應不應該進入市場（跟進，Me-too）？

微軟需先預測 Sony 的反應。如果 Sony 妥協則可以小賺錢，如果 Sony 開戰則會兩人都賠錢，如果不進入市場當然不賺不賠。需要注意的是，因為研發成本太高，所以只要一進入市場後，就不會停產而是一直賣下去，不管賠不賠都是盡量賣掉。

那麼，Sony 有可能打價格戰嗎？

不可能。假設 Sony 在微軟進入市場前，就先表態「我會跟你們打價格戰」並沒辦法說服微軟，因為如前面所述，微軟進入市場後就不可能被誘導而下架，所以 Sony 跟他打價格戰也只是雙方都虧而已。想也知道 Sony 不會真的開打。因此價格戰的誘因只剩下等到下個產品週期時嚇阻對手不要進場。但如果現在就賠掉太多錢，下個產品可能連開發都沒錢了。

因此，Sony 不會先發制人，只能選擇讓微軟跟它共存。這種賽局樹很重視誰先出招（回溯平衡！！），結果跟先後順序有關，就是上課教的 Sequential Game (Dynamic Game)。

複習：納許均衡、回溯均衡、承諾均衡

納許均衡（nash equilibrium）某組策略組合使得每個人在其他所有人的策略之下，他的策略都是當前的最佳反應，則這組組合稱為納許均衡。（白話文：先參考其他人決定後，再來做對我最有利的決定。例如自由選擇左駕右駕，發現大家都右駕那你當然也會右駕。）
納許均衡不一定到處都可使用，例如有先後順序的 Sequential Game 就不行（因為需要修正才能用）但我們可以用另外兩種均衡來處理這種「有人先出招」的均衡

回溯均衡

核心假設：後動者必然對先行者的行為作出 best response。
要找依序行動（sequential move）賽局的回溯均衡，要使用賽局樹來代表賽局以及移動順序。簡單來說就是從樹葉向根回推。
在範例中，因為壟斷者是建廠比較快的人（先行者）所以根節點畫的決策是壟斷者而不是進場者
其實就是上課教的 sequential game 解法

假設磁碟市場目前被一家名為「壟斷者 A」的企業壟斷，然後有一家「進場者 B」想要來瓜分市場。壟斷者有個前提是，因為經驗足夠所以他的建立新廠速度大於進場者。其他條件均相同。

假設沒人想動，則變成 1 個廠，就是 A 自己原本那一個工廠，A 通吃
假設 B 想多蓋一個，則變成 2 個廠，現在 A, B 要瓜分獲利
假設 A 想多蓋一個，則變成 2 個廠，A 通吃但成本變高
假設 A, B 都想多蓋，則變成 3 個廠，供過於求雙方都賠錢

我們可以做出以下報酬矩陣：

wechatimg144

畫出兩人的 best response 會發現左下象限是納許均衡，也就是兩人瓜分市場，但這絕不會發生，因為 A 不會這麼笨。回想前面的假設（壟斷者蓋廠速度更快）壟斷者 A 可以搶在進廠者B 之前開始蓋，身為後進者的 B 一但看到 A 要開始蓋，他就不會繼續蓋了（不然就虧錢，因為會有 3 個廠）這會進入右上象限。對 A 來說，當然右上更好，雖然他花錢多蓋一個廠，可是他又能壟斷了。這是一個納許均衡不是最佳解的例子。

wechatimg143

回溯均衡通常不會像上面那樣用報酬矩陣分析，而是用賽局樹。我們追蹤後動者可能如何反應先行者的舉動（i.e., 從樹葉往前推）。當先行者預料後動者可能的反應時，再決定他要如何出招（i.e., 推完樹葉後，再從根往後推）。詳細作法如圖所示。

承諾均衡

回溯均衡的核心假設是，後動者必然對先行者的行為作出 best response。
也就是：「如果 A 承諾多建一個廠，則進入者就被嚇到不敢建廠」
但如果進入者 B 先喊話，讓 A 相信他無論如何都會建一個廠，來瓜分市場呢？
這樣就變成 A 嚇到不敢建廠了。（要不然三廠並存，A 就虧了，只好乖乖跟他瓜分兩廠）
這就是雖然先行者可以先出招，但後動者有絕對的承諾力量，這稱為承諾均衡。

定義比較

「回溯均衡」適用於有行動次序的賽局，先行者會先推算後動者的最佳反應、然後做出對自己最有利的行動，並預期後動者會針對他的行動做反應
承諾均衡」適用於有承諾行動的賽局，後動者會先推算先行者的最佳反應、然後做出對自己最有利的承諾，並預期先行者會針對他的行動做反應
關鍵都是「承諾是否被完全相信」

第二章：引入管制

有時囚徒困境會掉入很差的結果，但因為雙方都是做出優勢策略所以又不得不做。此時外力介入（引入管制的話）可以讓這個很差的結果不再是優勢策略，而是轉移到另一個次差的結果。總體來說還是好的。

案例：菸商不打廣告反而賺更多？

以往菸商花很多錢買電視廣告，也證實可行：當多家菸商競爭時，最佳解就是落在所有人都做廣告，因為任一方不做廣告都會被電翻。這個情形維持一直到後來廣告太扯、造成國家出面反應，決定訂定「公共衛生吸菸法」開始進行反菸宣導（引入管制）。此時菸商發現如果繼續用廣告、而國家也繼續反菸的話，這樣扣掉之後的結果是虧錢的。因此菸商和政府討論，以後我們不打廣告、而且還多在包裝上印反菸宣導，而國家則是依照要求停播反菸宣導。

有時結果會掉入囚徒困境（大家都打廣告、結果扣掉反菸宣導的成本反而人人都虧錢），但因為雙方都是做出優勢策略所以又不得不做。此時外力介入（禁止廣告菸品）可以讓這個很差的結果不再是優勢策略，而是轉移到另一個次差的結果（大家都不花錢打廣告、也不再有政府的阻擋）。總體來說還是比原本好。

案例：「終結被輕忽疾病」之修正案

以往的藥廠以營利為目的，沒有人想要開發新藥去解決那些遭到輕忽的熱帶疾病，因為對股東沒有好處、還不如去開發更好賺的藥品。因為對所有藥廠來說，賺錢都是優勢策略所以不得不做，沒人有錢去做慈善。英國國會的「終結被輕忽疾病」修正案獎勵製藥公司開發新藥來對抗抗被輕忽疾病，如果開發出來就能獲得「優先審查權」，這個權利價值上億，因為這代表你開發的新藥可以很快速的上市、不需要排冗長的隊等審查通過。最後結果是好的：現在的藥廠在開發新藥時，除了已開發國家的常見疾病、他們也更願意優先考慮被輕忽疾病。

第三章：合併與共謀

競爭性競價賽局

兩家競爭公司賣相同商品。他們都寧訂低價來獲得最大份額市場（最佳結果）而不是以高價來分享市場（次佳結果）
由於兩家都寧願用低價，不論對方做什麼、雙方都有他自己的優勢策略：愈低越好
結果就是，當他們都採用優勢策略訂定低價時，結果都比雙方都訂高價還差，甚至雙方都越壓越低，這是一個囚徒困境。

反托拉斯主義

為了解決這種價格戰，有某方可能會提出「合併」兩家公司，就能立刻使他們壟斷整個市場。
但如此集中的權力受到政府反彈。羅斯福總統曾提出「打擊托拉斯」作為主要政策。
托拉斯為什麼不好？因為這些人把其他小廠商逐出市場後，就能恣意抬高價格、傷害消費者。
比較好的做法是，不要有獨大的、但可以有好幾家小的各自組一組，變成成對的廠商競爭。共謀不一定是壞事。

卡特爾化（cartelization，壟斷、企業合併、聯盟）利用合併參賽者來照顧集體利益，脫離惡性競爭的囚徒困境。

第四章：威脅報復

案例：墨西哥僵局 Mexican Standoff （相互保證毀滅賽局）

兩個亡命之徒在酒館前，拔出左輪手槍決一死戰，但兩人抽出槍之後卻都只是僵在那裡、沒有扣板機，為什麼會落到這個平衡？

假設兩人都非常準，一射出就是射中心臟，雖不馬上致死但也是必死無疑。假設 B 不開槍，那 A 如果開槍，A 就能當第一。但假設 B 開槍，那 A 如果開槍後、雖然也死了但至少不會喪失榮譽，因為兩人都並列第一而死去。因此對兩人來說，開槍都是優勢策略。

這就陷入了囚徒困境，因為即使你先射中對方、對方被射中也不會馬上死、而是先反射性的在你心臟射一槍、然後兩人一起死。很明顯的，兩人一起死不是最好結果，因為深知對方的準度，開槍射對方就是射自己。這就是「威脅報復」之所以可突破囚徒困境的原因，因為知道會遭到報復，所以原本的囚徒困境被破壞，而是選了另一個最後結果來看其實更好（兩人都活、兩人都沒開槍）的結果。

註：相互保證毀滅賽局屬於一種「動態賽局」，他們即時發生、而且對方能馬上反應。

案例：美蘇冷戰（相互保證毀滅賽局）

美國與蘇聯就是相互保證毀滅賽局的案例，因為兩方都有核武，而且他屬於動態賽局、因為一發射就會被雷達偵測、此時對方必定會也射一發跟你同歸於盡、並不會考慮人性。也因此兩方雖然都有優勢策略，也就是直接射一發核彈、力求先發制人，但因為馬上就會遭到報復，所以會僵在那裡（兩方都活、兩方都沒發射核彈）。

第五章：建立信任

案例：爸爸的甜點與蔬菜困境

晚餐時間，爸爸有兩個目標，主要目標是讓小孩吃光蔬菜、次要目標是讓小孩不要吃甜點，怕蛀牙。而小孩也有兩個目標，主要目標是吃到甜點，次要目標則是不要吃蔬菜。

wechatimg142

這是一個囚徒困境，因為兩方都有優勢策略，爸爸的是「不給甜點」小孩的則是「不吃蔬菜」。但這樣會落到雙方都是第三佳的結果，我們有辦法突破困境、至少轉移到都是次佳的結果嗎？

建立信任能夠突破這個囚徒困境。假設爸爸以往都言而有信、已經獲得小孩的信任，爸爸提出「假如你們乖乖吃蔬菜、吃完我就給你們吃甜點」，那小孩會怎麼做決定？這個假設一提出後，報酬矩陣就只剩下兩個象限：「吃蔬菜、也吃甜點」、「不吃蔬菜、也不吃甜點」。因為小孩優勢策略是吃甜點，所以成功達到目標選項。

這個案例的重點是，為了讓此提案有效，孩子必須相信父親的諾言。例如利用發誓、或是爸爸說謊要帶他們去迪士尼之類的承諾，來讓孩子相信這個諾言至高無上的地位。

第六章：培養合作關係

案例：黑幫的緘默守則

美國的「共濟會」兄弟會組織，是一個非常殘忍但是團結的黑手黨，警方一直無法干擾他們組織的運作，對內部毫無了解。促成合作的兩個力量是：1. 內心渴望合作與夥伴認同、2. 殘忍逞罰不合作者。

前者的力量就是「真愛」很好的詮釋，雖然放棄愛並不會造成實體上的逞罰，但因為雙方內心都想合作，所以可以維持真愛的關係。
其中的 1. 比 2. 更為重要。假如共濟會只有 2. 的話，也絕不可能運作得好。因為每個人都不相信關係能持久，假設共濟會明天就倒了，老大再也沒有威嚴，那我今天逃跑、他也沒有人力會來追殺我。那我何不直接背叛你呢？

這兩個原則讓囚徒困境被成功突破，從原本的囚徒困境：「所有人都認罪」，轉移到「所有人都不認罪」。有了這些鐵則、成功讓他們拖這麼久才被警方攻陷。

如何改變賽局、取得優勢策略

第一章：許下策略

經典的囚徒困境賽局

囚徒困境：低價戰（屬於競爭性定價賽局，參考第三章 - 合併或共謀）

囚徒困境：關稅戰

囚徒困境：軍備競賽

賽局樹： Sony 產品 PS2 案例

微軟應不應該進入市場（跟進，Me-too）？

那麼，Sony 有可能打價格戰嗎？

複習：納許均衡、回溯均衡、承諾均衡

回溯均衡

承諾均衡

定義比較

第二章：引入管制

案例：菸商不打廣告反而賺更多？

案例：「終結被輕忽疾病」之修正案

第三章：合併與共謀

競爭性競價賽局

反托拉斯主義

第四章：威脅報復

案例：墨西哥僵局 Mexican Standoff （相互保證毀滅賽局）

案例：美蘇冷戰（相互保證毀滅賽局）

第五章：建立信任

案例：爸爸的甜點與蔬菜困境

第六章：培養合作關係

案例：黑幫的緘默守則

References:

82年生的金智英

Grit

Negotiation

TSMC - Morris Chang

Introduction to IC industry

Statement Dog - Growth Stock

Fundamental Analysis - Disney

Predictable Irrelational (2)

Predictable Irrelational (1)

Financial Statement Analysis

賽局意識

如何改變賽局、取得優勢策略

第一章：許下策略

經典的囚徒困境賽局

囚徒困境：低價戰（屬於 競爭性定價賽局，參考第三章 - 合併或共謀）

囚徒困境：關稅戰

囚徒困境：軍備競賽

賽局樹： Sony 產品 PS2 案例

微軟應不應該進入市場（跟進，Me-too）？

那麼，Sony 有可能打價格戰嗎？

複習：納許均衡、回溯均衡、承諾均衡

回溯均衡

承諾均衡

定義比較

第二章：引入管制

案例：菸商不打廣告反而賺更多？

案例：「終結被輕忽疾病」之修正案

第三章：合併與共謀

競爭性競價賽局

反托拉斯主義

第四章：威脅報復

案例：墨西哥僵局 Mexican Standoff （相互保證毀滅賽局）

案例：美蘇冷戰（相互保證毀滅賽局）

第五章：建立信任

案例：爸爸的甜點與蔬菜困境

第六章：培養合作關係

案例：黑幫的緘默守則

References:

Related Posts

82年生的金智英

Grit

Negotiation

TSMC - Morris Chang

Introduction to IC industry

Statement Dog - Growth Stock

Fundamental Analysis - Disney

Predictable Irrelational (2)

Predictable Irrelational (1)

Financial Statement Analysis

囚徒困境：低價戰（屬於競爭性定價賽局，參考第三章 - 合併或共謀）