俺のOneNote

俺のOneNote

データ分析が仕事な人のOneNote愛とか、分析小話とか。

Pythonコーディング・データ分析のお勉強方針メモ

QiitaにてPython×PowerBI記事を連載することにしました。

PowerBIはともかく、初心者の方はPythonの敷居がめちゃくちゃ高い方も多いのではないかと思います。

私自身、胸を張って書けると言えるレベルではないですが、 どのようにしたらPythonで楽しくコーディング・データ分析できるレベルになるか、 勉強の方針だけ書いていきたいと思います。

※だいたい予算1万円ほどご用意を!

いきなりPython初心者本を開くの禁止

これは私が最初にハマった問題。 いきなりPython初心者本を開くのは、相当モチベーションが高くないかぎりやめたほうがいいです。

※例えばこんなやつとか(説得力無いですが、間違いなく良書です)

みんなのPython 第4版

みんなのPython 第4版

どんなことができるのか体験する

Pythonを使ったデータ分析でどんなことができるのか視覚的に体験してみるのがとてもいい感じ。 たとえばUdemyの以下コースは最初に取り組むにはとてもおススメ(一部、内容が古くてうまく実行できないフローがあります。)

www.udemy.com

コーディング?知らなくても大丈夫です。見様見真似にまずはやってみましょう。 コースの中に簡単なPython構文の解説動画が載っているので、それを最初に見るのが効率的かと。

環境構築でくじけない

上記コースでも案内がありますが、Pythonでは環境構築が最初のカベとして立ちはだかります。 ここで心折れてはいけません。

Anacondaを利用した環境構築

まずは王道かつ簡単なAnacondaを利用した環境構築です。 詳細はこちら。

qiita.com

クラウドを利用した環境構築

環境構築というか、クラウド上の環境を利用するため、”環境構築不要”で実行できる方法です。

Azure Notebook

Google Colabratory

いずれも、簡単なアカウント登録のみで無料で利用できます。 GoogleColabのほうはデータ取り込み等のクセが強いため、初心者の方はAzureのほうをおススメします。 ただ、いずれもクラウド上の環境であることを前提にする必要があり、最初はAnaconda等のローカルの環境に慣れたほうが無難です。

Pythonの基本を覚える

Udemyでどんなことができるか体験し、ちょっとしたコードの記載方法を覚えたら、自分でガシガシ書けるようになりたくなっているはず。 この下地ができてから、Pythonの基本をみっちり叩き込むようにしましょう。

初心者本を利用する

最初に紹介した以下みんなのPythonはまぎれもなく良書だと思います。 ある程度下地があれば、あいまいなところをかいつまんで読むぐらいでOKだと思います。

みんなのPython 第4版

みんなのPython 第4版

オンライン学習サービスを利用する

今はオンライン学習サービスがとても充実しています。 私が利用したのはProgateのサービス。月額約1,000円くらいで、コーディングの基本をブラウザ環境のみで覚えることができます。

prog-8.com

ちょっと技術力を高めたければ、ゲーム感覚で以下のようなものも面白そうです。

checkio.org

データ分析特有のライブラリ等の使い方を覚える

絶対にはずせないライブラリは以下のとおり

この辺は、以下のようなデータサイエンス基礎本でみっちり修行しつつ、 実践&ググるで育てていくしかないのではないかと思います。

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理

[第2版]Python 機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)

[第2版]Python 機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)

もしくは、データ分析・機械学習系のオンライン学習を利用するのもとてもよいのではないかと思います。(私は未実施)

aidemy.net

統計・機械学習のキソを覚える

データ分析したければ、最低限の統計スキル(必要に応じて機械学習も)が必要になります。

統計のキソ固めはここで十分

bellcurve.jp

書籍系だとPython×データ分析系の書籍がいろいろ優秀。

Pythonで学ぶあたらしい統計学の教科書 (AI & TECHNOLOGY)

Pythonで学ぶあたらしい統計学の教科書 (AI & TECHNOLOGY)

Pythonで動かして学ぶ! あたらしい機械学習の教科書

Pythonで動かして学ぶ! あたらしい機械学習の教科書

実践してみる

ある程度基礎固めをしたら、あとは実践の中でいろいろ覚えていくしかないような気がします。 というか、ここまでこなせれば自然と自分で学習できていきますので、あまり解説は不要なのですが・・・(笑)。

kaggle

Kaggle: Your Home for Data Science

言わずと知れた、機械学習コンペサイトです。 kaggleのいいところは、他の人が書いたコードをkernelで確認できること。 写経がはかどりますw

SIGNATE

signate.jp

こちらも日本版のコンペサイト。 ほかの人のコードは見れませんが、英語が不自由な方はこちらから挑戦してもいいかも。

おわりに

プログラミング初心者でも、Udemyみてprogateやっていくつかデータ分析本回れば、あとは自然と自分でいろいろやりたくなると思います。 最初のカベは高そうですが、一回やってみると意外と食わず嫌いであったことが分かります。 理系・文系とか、英語の羅列みると意味ぷーとか言う前に、まずは一歩目を踏み出してみましょう!