Pythonコーディング・データ分析のお勉強方針メモ
QiitaにてPython×PowerBI記事を連載することにしました。
PowerBIはともかく、初心者の方はPythonの敷居がめちゃくちゃ高い方も多いのではないかと思います。
私自身、胸を張って書けると言えるレベルではないですが、 どのようにしたらPythonで楽しくコーディング・データ分析できるレベルになるか、 勉強の方針だけ書いていきたいと思います。
※だいたい予算1万円ほどご用意を!
いきなりPython初心者本を開くの禁止
これは私が最初にハマった問題。 いきなりPython初心者本を開くのは、相当モチベーションが高くないかぎりやめたほうがいいです。
※例えばこんなやつとか(説得力無いですが、間違いなく良書です)
- 作者: 柴田淳
- 出版社/メーカー: SBクリエイティブ
- 発売日: 2016/12/22
- メディア: 単行本
- この商品を含むブログ (2件) を見る
どんなことができるのか体験する
Pythonを使ったデータ分析でどんなことができるのか視覚的に体験してみるのがとてもいい感じ。 たとえばUdemyの以下コースは最初に取り組むにはとてもおススメ(一部、内容が古くてうまく実行できないフローがあります。)
コーディング?知らなくても大丈夫です。見様見真似にまずはやってみましょう。 コースの中に簡単なPython構文の解説動画が載っているので、それを最初に見るのが効率的かと。
環境構築でくじけない
上記コースでも案内がありますが、Pythonでは環境構築が最初のカベとして立ちはだかります。 ここで心折れてはいけません。
Anacondaを利用した環境構築
まずは王道かつ簡単なAnacondaを利用した環境構築です。 詳細はこちら。
クラウドを利用した環境構築
環境構築というか、クラウド上の環境を利用するため、”環境構築不要”で実行できる方法です。
いずれも、簡単なアカウント登録のみで無料で利用できます。 GoogleColabのほうはデータ取り込み等のクセが強いため、初心者の方はAzureのほうをおススメします。 ただ、いずれもクラウド上の環境であることを前提にする必要があり、最初はAnaconda等のローカルの環境に慣れたほうが無難です。
Pythonの基本を覚える
Udemyでどんなことができるか体験し、ちょっとしたコードの記載方法を覚えたら、自分でガシガシ書けるようになりたくなっているはず。 この下地ができてから、Pythonの基本をみっちり叩き込むようにしましょう。
初心者本を利用する
最初に紹介した以下みんなのPythonはまぎれもなく良書だと思います。 ある程度下地があれば、あいまいなところをかいつまんで読むぐらいでOKだと思います。
- 作者: 柴田淳
- 出版社/メーカー: SBクリエイティブ
- 発売日: 2016/12/22
- メディア: 単行本
- この商品を含むブログ (2件) を見る
オンライン学習サービスを利用する
今はオンライン学習サービスがとても充実しています。 私が利用したのはProgateのサービス。月額約1,000円くらいで、コーディングの基本をブラウザ環境のみで覚えることができます。
ちょっと技術力を高めたければ、ゲーム感覚で以下のようなものも面白そうです。
データ分析特有のライブラリ等の使い方を覚える
絶対にはずせないライブラリは以下のとおり
- pandas
- numpy
- matplotlib
- scikitlearn
- seaborn
- statsmodels
- scipy
- その他ディープラーニング、ベイズ系など(tensorflow, pystan)
この辺は、以下のようなデータサイエンス基礎本でみっちり修行しつつ、 実践&ググるで育てていくしかないのではないかと思います。
Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理
- 作者: Wes McKinney,瀬戸山雅人,小林儀匡,滝口開資
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/07/26
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
- 作者: Jake VanderPlas,菊池彰
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/05/26
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
[第2版]Python 機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)
- 作者: Sebastian Raschka,Vahid Mirjalili,福島真太朗,株式会社クイープ
- 出版社/メーカー: インプレス
- 発売日: 2018/03/16
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (2件) を見る
もしくは、データ分析・機械学習系のオンライン学習を利用するのもとてもよいのではないかと思います。(私は未実施)
統計・機械学習のキソを覚える
データ分析したければ、最低限の統計スキル(必要に応じて機械学習も)が必要になります。
統計のキソ固めはここで十分
書籍系だとPython×データ分析系の書籍がいろいろ優秀。
Pythonで学ぶあたらしい統計学の教科書 (AI & TECHNOLOGY)
- 作者: 馬場真哉
- 出版社/メーカー: 翔泳社
- 発売日: 2018/04/19
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る
- 作者: 伊藤真
- 出版社/メーカー: 翔泳社
- 発売日: 2018/01/24
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (3件) を見る
実践してみる
ある程度基礎固めをしたら、あとは実践の中でいろいろ覚えていくしかないような気がします。 というか、ここまでこなせれば自然と自分で学習できていきますので、あまり解説は不要なのですが・・・(笑)。
kaggle
Kaggle: Your Home for Data Science
言わずと知れた、機械学習コンペサイトです。 kaggleのいいところは、他の人が書いたコードをkernelで確認できること。 写経がはかどりますw
SIGNATE
こちらも日本版のコンペサイト。 ほかの人のコードは見れませんが、英語が不自由な方はこちらから挑戦してもいいかも。
おわりに
プログラミング初心者でも、Udemyみてprogateやっていくつかデータ分析本回れば、あとは自然と自分でいろいろやりたくなると思います。 最初のカベは高そうですが、一回やってみると意外と食わず嫌いであったことが分かります。 理系・文系とか、英語の羅列みると意味ぷーとか言う前に、まずは一歩目を踏み出してみましょう!