2019年3月2日 星期六

TTA統計數據圖表 (續) - 分數指標

  一般在討論遊戲策略時,通常還是使用主觀意識居多,其實若能從客觀的數據層面來看,應該更具有參考價值。現在大數據/AI/機器學習正夯,圍棋都做到超越人類了,關於遊戲的策略分析,應該也會越來越多這方面的進展吧。

  承接前一篇,這篇使用不一樣的database,使用的是同學Jingking收集的BGO 3萬多場(共計8萬多個人次)的線上對戰資料 (相關網址),上萬筆的TTA對戰資料算是相當珍貴的資料。不過我覺得稍微可惜的是,這個資料的時期可能比較早,或許當時多數玩家還比較習慣舊版的思路,從牌的使用次數大致可以看到這樣的趨勢。

  在前一篇文章中,我使用「勝率」(獲勝次數/使用次數) 做為一個評斷牌值的參考依據。但當想套用同樣方式去檢視這個資料庫的大數據時,卻發現每一張牌的「勝率」太過接近,不容易明顯看出牌的好壞。因此我自己定義一個「分數」的算法,其計算方式雖然大致還是以「勝率」為基礎,但把各個牌之間的差距拉開一些,data visualizaion時效果可能好些。(詳細說明見下段,懶得看的話可以跳過下段)

  具體來說,若是單看勝率,會發現每張牌算起來勝率怎麼都在四成左右。因此再仔細去把這個數據拆分成2人局/3人局/4人局 (幸好Excel都可以做簡單的數據分析),又會發現:各個牌在2人局的勝率都接近50%、3人局都接近33%、4人局都接近25%。想想就會覺得其實頗合理的,假設玩家的強弱完全是隨機分布,那麼即使一個領袖偏強,但在大量場次累計下來,以兩人局為例,這個領袖的勝率還是會接近50%。當然,偏強的牌還是會略高過50%,偏弱的牌會略低於50%,只是差距不明顯。為了有助於資料視覺化時將差距拉大,並同時考慮2人/3人/4人局時不同的勝率標準線,自己定義「分數」的計算公式為  { (2人局勝率-50) + (3人局勝率-33) + (4人局勝率-25) } / 3 。此處採取3者單純計算平均,未採取加權平均 (權重可設為分別的場次數),是因為我從數據直觀看起來,覺得加權平均可能對於分數的影響不會很大,亦即在2/3/4人局時牌的優劣變化不大。

  根據這樣定義的分數,會有正值與負值。而大部分牌的分數會接近0,代表相對中性,代表使用這張牌的勝率接近平均值。從這次的統計結果來看,我自己覺得分數在5以上的,大致可以認定為強牌。


一、領袖與奇觀


  做為與前篇的對照,一樣先從領袖的使用情形看起。圖表中,每個領袖的兩個直條分別代表使用次數(深綠色,對應到左縱軸)以及分數(淺綠色,對應到右縱軸)。



  A時期依舊可以看到拉比的威力,是同期唯一分數衝破5這個門檻的領袖。其他領袖雖然使用次數也都不少,但分數大致都在0的附近,小亞的使用次數雖然非常多,但分數其實接近0,相當中性,與我個人的認知頗符合。A期領袖當中的大帝/凱薩/摩西甚至是負分,不過小負分我也不會特別在意,認定為還是偏向中性。

  1期領袖則可觀察到普遍分數會比A期的高。除了米開小負分,大汗接近0,其他4隻都是在3分上下,可以推論:1期領袖實力平均而且實力高過A期(除了拉比)。而我認為這邊米開/大汗/貞德的分數甚至都有更高的空間,因為這3隻的能力與舊版有差異,我猜想在新版初上線時,習慣舊版的玩家將思路套進來會有些運用不當的地方。這點從貞德使用的次數竟然這麼少(同時期排倒數第2名),亦可以推知一二。

  2期領袖的使用次數還是毫不意外的雙天王領先,羅伯斯第3,在不同來源的數據中皆是看到這樣相同的趨勢。值得留意的是,使用了破兩萬次的拿哥,其分數卻是非常接近0。我自己會給兩種解釋:第一,拿哥其實並沒有那麼強,特別是在新版中;第二,拿哥太好用,導致大家看到都想抓來用,演變成不論什麼玩家什麼情況看到就想抓來打,出場率太高,也就可以視為拿哥是大量分布在各個程度的玩家以及各種遊戲當前局勢中,一旦成為這種近乎盲目抓打的態勢,其勝率自然就會很接近平均值,即分數會接近於0。2期最高分的領袖是牛頓,分數有接近5,另一方面,2期也出現了接近負5分的領袖 - 巴哈。

  3期領袖,一看過去就看到一個超級大負分 - 甘地,這也符合前一篇的論點,甘地確實偏弱,我看以後3期大家就當甘地不存在好了。又或許這分數代表的意義是,本來就是岌岌可危的玩家才會考慮拿甘地,而局勢不穩自然最後就有高機率會輸掉。3期把甘地拿掉的話,其他5個領袖的使用次數倒是非常接近,表示遊戲設計的不錯,讓玩家覺得這5個領袖都會有可以應用的時機。其中愛因斯坦鶴立雞群,是唯一分數破5分的,可謂3期的天王,關於小愛的高分後面會再提到。

  接著看奇觀。


  A期的結果可以說與前一篇文章非常吻合。新版剛出來時,金字塔仍是被認為最強的奇觀,出場次數突破兩萬次,但實際分數卻接近0,是非常中性的奇觀,當然不會說弱,但我想絕對談不上強或是破壞平衡。而大圖的分數則是接近5分 (上圖中是因為3期奇觀分數太高,才導致大圖的分數看起來好像沒那麼突出)。出場次數與大圖很接近的空花,分數卻是負分,或許該是時候捨棄對它的喜愛了。而一向風評不好的巨石像,分數更是慘到突破負5。

  1期一樣是大教堂大學穩居前兩名(不論是場次還是分數),大教堂的分數超過6。有點意外的是,長城竟然是小負分,比泰姬陵慘,或許長城還是穩定度不太好,是個應用面較狹窄、上下界較大的奇觀。開心能在上一篇及這一篇看到一致的結果,也就差不多可以給出結論,A期最好的是大圖,1期最好的是大教堂,大學則是次之。

  2期這邊,克宮就有表現比較好了,差不多是5分,前一篇3人局比賽統計那個,實在是克宮出場數太少,樣本數太低本來就不準。克宮是2期出場數最少,但分數最高的,還蠻符合預想中的樣子。鐵塔依然是穩,出場數最多,分數也有4分多。鐵路的出場數這麼多,應該是玩家還習慣舊版,分數是接近0的中性。遠洋則是有點慘的負分,我想這也是屬於上下界較大的奇觀,而且如前篇所說,新版的平衡影響跟農業影響,使得農業這條科技的重要性增加了,相當於讓遠洋扣了一些分數。

  3期這邊,我是覺得參考價值比較低了。分數幾乎都是破10以上,我覺得已經不太是代表奇觀本身的強度意義。這邊大概只能看做,有資源有行動去完成奇觀的人,本來就是屬於沒被戰爭打死、基建穩、科技高、城市建築發展順利等等,導致有完成奇觀的人勝率高。快速看一下統計結果,空飛的場次最多分數也最高,速食店則是分數最低。


二、內政科技牌


  而由於這筆資料不僅包括領袖與奇觀,還有其他內政牌的使用統計,我對於這些數據也很有興趣,因此對於各個科技牌做了統計,以下分3個時期來看。


  1期的灌溉/鐵/煉金這3門基建科技,毫不意外的出場次數破表,均突破四萬大關。另一個突破四萬的則是騎士,這個我想就比較是舊版思維了,在新版中不需要拿1期騎士的局其實不少,主要原因當然是黑卡可以當防禦,次要原因是新成吉思汗的能力,以及兩人局2時期仍有2個騎兵可拿。而這4大熱門牌,可以看到分數都是接近0 (甚至是小負分),非常中性,或許也可以讓大家思考,雖然這些牌看起來都是好,但或許必要程度也沒有那麼高,在1期腦力有限的情況,僅挑其中幾個做就可以,況且使用2期牌來做基建或是軍力,其實實力會更堅強。

  另外想提的是特別高分及特別低分的牌。1期牌當中唯一分數突破5分的牌是法典,雖然個人不太常用這張(前期腦力吃緊),但我想早期的1白點使用仍是很有彈性的,這其實也讓我開始思考是不是自己太過排斥法典,或許可以多加嘗試。另一方面,負分突破5分的則是麵包與馬戲,這個本來也就少見人蓋,負到這種程度的牌,我想大部分情況看到時就自動忽略它吧。1期政體可以看到使用的人很少,與我經常革命1期政體的習慣不同。個人覺得君主制實在不應該用這麼少次,而神權雖然較為侷限,但場次竟然還少於麵包、磚石建築,神權其實跟金字塔、巴巴都有很好的搭配相性。


  2期用最多的牌是砲兵,非常容易理解,畢竟是2期才出現的兵種。農/礦/腦3類基建牌的次數都有突破兩萬次,可以視為玩家在補齊自己內政的缺口,而這些牌依然都是分數接近0。競技場仍是負分牌,但只是小負分了,畢竟3笑臉相當實用。2期的城市建築唯一突破5分的是新聞學,這個倒是令我相當意外。我並不討厭圖書館類型,但我沒有覺得新聞學有這麼強,而且我偏向習慣走實驗室這條,這個統計給了我一些未來努力蓋新聞學的動力。另外我覺得這或許也跟這3萬場遊戲很少使用1期政體有關,在政體換得慢時,2個科技建築可能很快就緊繃了,當有多餘人口想要尋求更高腦力時,圖書館就是個不錯的突破口,通常2期中段會有足夠人力與資源做這件事,使得新聞學在這個時候成為很適當的城市建築 (回想自己玩舊版時,確實也頗喜歡這個時候蓋個新聞學)。

  另外2期一個很容易注意到的特點,就是所有的藍色科技牌,分數全部高過5分!尤其是戰略這張,分數接近10。這個我認為是相當不錯的指標,某種程度表示這些藍卡都是有助於獲勝的牌。我自己也很喜歡這時候打這些藍牌,戰略不用說,根本是人人都超愛的牌,從實戰結果來看也確實表現很好,極為實用,有不少情況戰略都是值得用力搶的牌。而建築學的分數也非常高,超出我的預期,不確定在舊版是否同為如此,我想這可能跟新版城市建築的重要性上升有關。


  3期使用最多的牌也非常好猜,第一名是電腦,第二名是飛機。3期大約有一半的科技牌分數都高過5分,多媒體維持2期新聞學的好表現,坐穩城市建築類第一名,其他熱門款如電腦、飛機都有5分,冷門如機械化農業、共產主義也都有5分。3期的第一個亮點,是政體的不均衡,3個政體當中民主制被大量使用,遠遠超過共產主義與原教旨的使用次數,而且民主制的分數突破10分,已經很明顯說明民主制有多強,看來應該改回舊版的2分比較合理。

  3期的第二個亮點,就是藍卡的分數突破天際,軍事理論接近10,其他的全都破10,公共服務更是高達14分。原因也不難理解,除了這些藍卡本身能力好之外,重要的當然是最後的事件加分。打出3期藍卡的加分可能包括發展6分、技術4分、多樣性2分,當然還可能包括政體、軍力的加分,分數相當可觀。遊戲後期這些藍卡應該都是兵家必爭之地,而公共服務給2白點實在很厲害,即使是用3白抓1白打,只要下一回合白點就回本了,這張本來也就是我很喜歡搶的牌。

  從這些3期高科技牌的高分數來看,回頭看3期領袖,也就不難想像愛因斯坦為何分數如此之高,能夠盡量多打出這些3期科技看起來對勝利是有幫助的,而小愛可以快速衝高腦力,有助於打出這些高科技牌。從這邊也可以再次看到,遊戲到了後期的科學產率相當重要,幾乎可以把衝高科學產率視同於衝高文化產率了。狼教授曾說過,遊戲前期的分數來源是礦力,後期的分數來源是腦力,從這邊的圖表可以得到很好的驗證,有高腦力輸出才能打出這些昂貴的3時期科技牌。
 

三、後記:政體牌


   做完圖表寫完這篇文章,才發現和平演變政體跟革命政體的資料欄是分開的。上面的圖表裡面的政體,都是指和平演變的。為了補上革命政體的資料,下面再補一個圖。


  圖表中Rev的代表革命。觀察到的現象是:遊戲越早期越適命革命。1期政體使用革命的分數皆比和平演變高,然而到了2期政體,革命的分數就比和平演變差了,到了3期更是明顯,每一個3期政體使用革命的分數都下降非常多。我想這個原因與當時代的黃卡能力應該很有關係,也與當時節奏很有關係。遊戲進到3期時,場上的黃卡都很強,而且科技牌也如上文所述,都是高分數科技牌,因此此時使用革命所賺到的腦力差距,恐怕不足以彌補犧牲大量白點而損失的好處。再者,遊戲進到後期,往往有很多事情要忙,很難找到一個理想的空檔去執行革命。

  可以看到,主流熱門款君主立憲,使用革命竟然分數直接掉到負分,這點我很意外。同樣意外的是,共產只需5腦革命(原教旨只需7腦),我以為是非常適合革命的政體,但革命的分數竟然也是大負分。我分別看了2人/3人/4人局的統計數據,發現這樣的負分趨勢是非常一致的存在各種人數局當中,因此我想這個現象是確定存在的。從這個圖來看,2期3期政體,大概只有共和制是稱得上適合革命(但分數也是有小幅小降),其他政體的分數都下降相當多。而要能和平演變這些政體,都需要相當多腦力,再次證明這遊戲的科學產率非常重要。


  這篇採用一種自定義的分數指標來做分析。上萬筆的raw data是很寶貴的,如果大家有建議的一些分析方向,我可以再找時間來做。用客觀統計資料做為說理的證據,是我很喜歡的方式。當然資料的來源品質可能會是一個問題(參與統計的玩家水準參差不齊),但我想這還是一個很不錯的參考資料。

7 則留言:

說不德 提到...

我最意外的是法典這張牌,因為我實在很少很少用,沒想到分數挺高的

David 提到...

我覺得你都被我影響啊 XD
我們存在嚴重的團體迷思問題(groupthink)

阿吉 提到...

法典好用阿XD
只要不會太晚+腦夠都很適合抓打
倒是革命君主有時還會猶豫QQ

說不德 提到...

大D就比較有可能用法典,可是他常亂打,
所以用了也沒有打得很好,變成我還是覺得新的嘗試也沒甚麼嘛
所以團體迷思還是持續存在
哈哈

David 提到...

樓上偷酸人,哈哈XD。 我覺得我不喜歡法典,主要是我太習慣先升鐵,鐵+法典就要11腦了(況且常會需要先出劍士4腦或騎士5腦),此時感覺都要進2時期了。而且又更喜歡2/3期的司法/公共服務,所以不太喜歡主動拿法典 (或說1期的藍卡都沒太喜歡,因為2/3期的不論是研發時機/本質能力都好得多)。

我會打法典好像都是有快速出腦力的情形 (大學、亞里期多德、事件快速給腦、達文西、新擴巨石陣)。不過從這樣數據,以後還是可以嘗試先出法典。

timer000 提到...

想請問一下
不知道在分析時,是否有各順位獲勝率的比較

我看Jingking的原始資料,似乎沒提到這方面的分析
只有簡單的說,後手有利

這結果十分有趣

David 提到...

看了一下當初用的excel檔,發現找不到順位的資訊。
雖然有記錄每個玩家與獲勝玩家的分數相對比例,但發現分數是排序過的,所以看不出每個順位對結果的影響。猜想可能是他當初爬BGO資料時,使用的資料處理步驟導致處理後的資料結果會預先對分數做排序。