研究代號:活在球內盡是數據
最近Pokemon Go在全球掀起一股熱潮,世界各地的訓練員,來自不同年齡,香港從以前全民皆股,全民皆炒,變成全民通街走;由之前的雨傘XX遍地開花,變成遍地開櫻花,這遊戲無疑能短時間改變了我們日常生活習慣,是好是壞,那就要看看玩家自己本身了。筆者個人也十分熱愛寵物小精靈,GBA遊戲:舊版,金銀,紅藍寶石通通玩過,Pokemon Go的出現不但讓自己找回童年的回憶,更成為下班後的減壓良物。 小時候的畫功真的有點不堪入目(囧) 當然在娛樂的時候,我也不忘做一點分析的工作,本文並不是分享Pokemon Go的攻略,如果想知道關於pokemon go的攻略,不妨瀏覽我朋友 小影 寫下的 攻略 ,既實用亦具參考價值。而我研究的Scope會更大,除了pokemon go的精靈,更會研究所有手提遊戲機(GBA, 3ds)版本的精靈。 近日,我發現了一個網站免費提供API (https://pokeapi.co/),能夠從中獲得小精靈們的數據,由最舊的黃版至X-Y版也包含在內,由於Request的次數是有上限的,所以我把獲取下來的數據先放在MongoDB,也即是NoSQL的資料庫,需要時從資料庫拿出來就好了。之後的資料整合及分析會交給Python中的Pandas, Scikit-learn的package來處理。 手提遊戲機版本(以下統稱為GAMEBOY版本)的精靈至X-Y新世代,一共有750隻精靈 寶可夢 (不要問我為何要刪掉寶可夢),基本屬性已有18種,加上有些精靈是擁有兩種屬性,屬性的組合實在多不勝數,另外,精靈的 基礎能力 也分為6個維度:血量 (HP),速度 (speed),攻擊力 (attack),特攻力 (special_attack),防禦力 (defensive),特防力 (special_defensive)。為了顯示每一只精靈的能力,我plot了一幅簡潔易明的圖表: 如果我們有3-dimension的資料,當然可以用3D圖來顯示,可是換着更高維度的呢?用4D, 5D圖?開玩笑的,其實有一個實用的方法:先利用Principal Componets Analysis (PCA) 是把6個dimension降成2個dimension,再用平面圖表示每一點,大家不用理會X, Y-axis的意思,可以了解點與...