Python OR R ? 初學者的一個疑問

這個問題早一兩年前已經非常流行,因為當時很多新手(包括一兩年前)想學習有關數據分析的軟件,當時R和Python都剛好冒起和被廣泛討論,甚至拿來作比較,筆者當時認為沒有必要比較,因為到今時今日我的答案都是一樣:這兩種程式語言我也會學。


同樣地是Open Source的軟件,亦同樣能做很多分析的工作,R的出身為統計軟件,Python是從Software development開始,但是因為Python和R用家不停地為各自的Library貢獻,本來沒有統計分析程式的Python,到現在什麼Pandas, Numpy, Scikit-Learn的Package也發展得愈趨純熟,統計分析,機器學習建模通通可以;而R變到現在也能進得Http Request和ODBC,所以無需擔心功能未必能滿足到自己的需求,因為兩者絕對有能力勝任,差在那一個程式用起來會比較方便。


網上亦很多專業的分析:
這篇以數據分析和性能方面來評論,內容比較Technical,提出python在data visualization表現相對遜息,並不如R的好。性能方面,由於R為統計分析變得容易,容易忽略性能表現,因而運行的時間多了。

這個來自Quora的討論,主要在功能上的角度作比較,提出Python或R會表現較好,R會有更多統計上的Library支持,用作分析和Visualization上相對較好;而Python,在發展分析工具如Dashboard, Web Service,以及近期流行的人工智能和深度學習,會有較多的支持:
https://www.quora.com/Which-is-better-for-data-analysis-R-or-Python


對於新手,不應貪心,進場應該選擇其中一個工具,至於是那個那就得看看你自己主要想用來做點什麼,由於筆者自己要做不同的數據分析,甚至要把結果可視化present出來,所以R更適合。除此之外,亦需要開發工具和Dashboard來作分析,機器學習來預測分類,所以Python在這方便會給我更多支持。所以,這兩種語言都對我非常重要,學習之後就書到用時也不會方恨少。

Comments

Popular posts from this blog

Boosting vs Bagging? 別再胡亂用了!

機器學習之陷阱 - Imbalance Class Classification

Excel VBA - 自動生成分析報告