2019年3月2日 星期六

TTA統計數據圖表 (續) - 分數指標

  一般在討論遊戲策略時,通常還是使用主觀意識居多,其實若能從客觀的數據層面來看,應該更具有參考價值。現在大數據/AI/機器學習正夯,圍棋都做到超越人類了,關於遊戲的策略分析,應該也會越來越多這方面的進展吧。

  承接前一篇,這篇使用不一樣的database,使用的是同學Jingking收集的BGO 3萬多場(共計8萬多個人次)的線上對戰資料 (相關網址),上萬筆的TTA對戰資料算是相當珍貴的資料。不過我覺得稍微可惜的是,這個資料的時期可能比較早,或許當時多數玩家還比較習慣舊版的思路,從牌的使用次數大致可以看到這樣的趨勢。

  在前一篇文章中,我使用「勝率」(獲勝次數/使用次數) 做為一個評斷牌值的參考依據。但當想套用同樣方式去檢視這個資料庫的大數據時,卻發現每一張牌的「勝率」太過接近,不容易明顯看出牌的好壞。因此我自己定義一個「分數」的算法,其計算方式雖然大致還是以「勝率」為基礎,但把各個牌之間的差距拉開一些,data visualizaion時效果可能好些。(詳細說明見下段,懶得看的話可以跳過下段)

  具體來說,若是單看勝率,會發現每張牌算起來勝率怎麼都在四成左右。因此再仔細去把這個數據拆分成2人局/3人局/4人局 (幸好Excel都可以做簡單的數據分析),又會發現:各個牌在2人局的勝率都接近50%、3人局都接近33%、4人局都接近25%。想想就會覺得其實頗合理的,假設玩家的強弱完全是隨機分布,那麼即使一個領袖偏強,但在大量場次累計下來,以兩人局為例,這個領袖的勝率還是會接近50%。當然,偏強的牌還是會略高過50%,偏弱的牌會略低於50%,只是差距不明顯。為了有助於資料視覺化時將差距拉大,並同時考慮2人/3人/4人局時不同的勝率標準線,自己定義「分數」的計算公式為  { (2人局勝率-50) + (3人局勝率-33) + (4人局勝率-25) } / 3 。此處採取3者單純計算平均,未採取加權平均 (權重可設為分別的場次數),是因為我從數據直觀看起來,覺得加權平均可能對於分數的影響不會很大,亦即在2/3/4人局時牌的優劣變化不大。

  根據這樣定義的分數,會有正值與負值。而大部分牌的分數會接近0,代表相對中性,代表使用這張牌的勝率接近平均值。從這次的統計結果來看,我自己覺得分數在5以上的,大致可以認定為強牌。


一、領袖與奇觀


  做為與前篇的對照,一樣先從領袖的使用情形看起。圖表中,每個領袖的兩個直條分別代表使用次數(深綠色,對應到左縱軸)以及分數(淺綠色,對應到右縱軸)。