豬頭的生活日誌: 3月 2019

2019年3月2日星期六

TTA統計數據圖表 (續) - 分數指標

一般在討論遊戲策略時，通常還是使用主觀意識居多，其實若能從客觀的數據層面來看，應該更具有參考價值。現在大數據/AI/機器學習正夯，圍棋都做到超越人類了，關於遊戲的策略分析，應該也會越來越多這方面的進展吧。

承接前一篇，這篇使用不一樣的database，使用的是同學Jingking收集的BGO 3萬多場(共計8萬多個人次)的線上對戰資料 (相關網址)，上萬筆的TTA對戰資料算是相當珍貴的資料。不過我覺得稍微可惜的是，這個資料的時期可能比較早，或許當時多數玩家還比較習慣舊版的思路，從牌的使用次數大致可以看到這樣的趨勢。

在前一篇文章中，我使用「勝率」(獲勝次數/使用次數) 做為一個評斷牌值的參考依據。但當想套用同樣方式去檢視這個資料庫的大數據時，卻發現每一張牌的「勝率」太過接近，不容易明顯看出牌的好壞。因此我自己定義一個「分數」的算法，其計算方式雖然大致還是以「勝率」為基礎，但把各個牌之間的差距拉開一些，data visualizaion時效果可能好些。(詳細說明見下段，懶得看的話可以跳過下段)

具體來說，若是單看勝率，會發現每張牌算起來勝率怎麼都在四成左右。因此再仔細去把這個數據拆分成2人局/3人局/4人局 (幸好Excel都可以做簡單的數據分析)，又會發現：各個牌在2人局的勝率都接近50%、3人局都接近33%、4人局都接近25%。想想就會覺得其實頗合理的，假設玩家的強弱完全是隨機分布，那麼即使一個領袖偏強，但在大量場次累計下來，以兩人局為例，這個領袖的勝率還是會接近50%。當然，偏強的牌還是會略高過50%，偏弱的牌會略低於50%，只是差距不明顯。為了有助於資料視覺化時將差距拉大，並同時考慮2人/3人/4人局時不同的勝率標準線，自己定義「分數」的計算公式為 { (2人局勝率-50) + (3人局勝率-33) + (4人局勝率-25) } / 3 。此處採取3者單純計算平均，未採取加權平均 (權重可設為分別的場次數)，是因為我從數據直觀看起來，覺得加權平均可能對於分數的影響不會很大，亦即在2/3/4人局時牌的優劣變化不大。

根據這樣定義的分數，會有正值與負值。而大部分牌的分數會接近0，代表相對中性，代表使用這張牌的勝率接近平均值。從這次的統計結果來看，我自己覺得分數在5以上的，大致可以認定為強牌。

一、領袖與奇觀

做為與前篇的對照，一樣先從領袖的使用情形看起。圖表中，每個領袖的兩個直條分別代表使用次數(深綠色，對應到左縱軸)以及分數(淺綠色，對應到右縱軸)。

2019年3月2日 星期六

TTA統計數據圖表 (續) - 分數指標

一、領袖與奇觀

2019年3月2日星期六