あれもPython,これもPython

Pythonで世界を包みたい

文系出身の自分が統計学んだ方法(統計検定二級攻略法)

データ分析やりたい、知りたい、
でも僕文系・・・
な人って結構いるんじゃないかと思います。

そういう人向けのロードマップを書きます。
あと理系だけど、統計苦手とか、
専門じゃないけど触れておきたい
人にも役に立つと思います。

前提

高校までの確率を知ってる人
(微積線形代数は必要なし)

目標

統計検定二級をとる

なぜ統計検定二級かというと

  • 一級だとしっかり数式がわからないといけない
  • 三級だと理論にあまり触れない

からです。
この記事が役に立つ人の目標ラインとしては二級が妥当かと。

資格所持に価値があるか、というのは人によるとは思います。
(少なくとも就職や転職ではあまり役には立たない印象です)
が、資格試験ベースで勉強すると、過去問を解くことで進捗が可視化できます。
自分の成長を確認したり、弱点がわかりやすくなるので、
勉強の目標としては有効だと思っています。
(何より合格できるとうれしい!)

入門編

統計学がわかる (ファーストブック)

統計学がわかる (ファーストブック)

別名アイス本。
統計の説明と、それ以外のバランスが適切だと思います。
読んでいて苦にならないのでサラッと読んで、
この後の理論書を読んでる最中に時々戻ってくる感じです。

その他、マンガやラノベの入門書としてはありますが、
統計の説明があんまり上手く入ってこなかったので、
私はアイス本がおすすめです。

ちなみに私は図書館で最初見つけて惚れ込んで、
自分で買って持ち歩きすぎて一回なくし、
再度購入したくらいこの本が気に入ってます!

初級編

改訂版 日本統計学会公式認定 統計検定2級対応 統計学基礎

改訂版 日本統計学会公式認定 統計検定2級対応 統計学基礎

え、いきなり教科書?って感じですが、
用語とか、対象範囲を押さえるのに使います。
もちろんこれだけだと理解はかなりつらいので、
統計ってこういうこと学ばなきゃ行けないんだ、
くらいのことをインプットするくらいの割り切りで。

用語を書き出して慣れたりするのがいい感じです。

理解編

統計学入門 (基礎統計学)

統計学入門 (基礎統計学)

通称赤本です。
かっちりした教科書なので、合わない人もいるかもしれませんが・・・
ただ、やはり入門者がきっちり理解する、という点ではこの本はベストかと思います。
(各章末尾にある演習問題はやらなくて良いかと)

実務のデータ分析に近い感じで勉強していきたい、という人は、
赤本の前に下記の本を挟むといいかもしれません。

EXCELビジネス統計分析 [ビジテク] 第2版 2013/2010/2007/2003対応

EXCELビジネス統計分析 [ビジテク] 第2版 2013/2010/2007/2003対応

こっちはエクセルでデータ分析を試す構成になっているので、
(図もかなり多い)
データ分析が知りたい方に軸がある方はあってると思います。
私も赤本の前に挟んでます。

習得編

日本統計学会公式認定 統計検定 2級 公式問題集[2013〜2015年]

日本統計学会公式認定 統計検定 2級 公式問題集[2013〜2015年]

ここまでくると、
あとは二級の問題集を繰り返し解いて、
傾向対策が出来れば十分受かると思います。

自分は、もう少し整理しつつ、計算問題を増やしておきたい、
青チャートみたいなのほしいと思ったので、
下記も追加しました。(教科書で範囲外がどうか確認しつつですが)

44の例題で学ぶ統計的検定と推定の解き方

44の例題で学ぶ統計的検定と推定の解き方

発展編

ここから先は
2級は受かる力はついたけど、
もう少し統計詳しくなりたい人向け。

平均・分散から始める一般化線形モデル入門

平均・分散から始める一般化線形モデル入門

あんまりネットで見かけませんが
緑本に入る前の総復習+緑本の予習に良い本です。
今までの流れだと、モデリング周りが弱いので、
これで補うと良いんじゃないでしょうか。

そして、緑本

読みましょう。
ここまでくると、専門家じゃないけど統計の教養ある人にしては
オーバーパワーな感じにはなってると思います。

二冊ともRのコードが載ってますが、
最悪読み飛ばしてもエッセンスはわかると思います。

ここから先のステップ

もう少し統計の数学力をつけたい、という人はこの本とか。

統計学のための数学入門30講 (科学のことばとしての数学)

統計学のための数学入門30講 (科学のことばとしての数学)

データサイエンティストの力をつけたい、という人は
線形や微積をやりつつ、パターン認識に手を出し始める必要があるかと。
あとは、プログラムですね。
R,Python,SQL場合によってはHadoopやその他基本的なIT知識など。
その辺についても、そのうち書きたいと思います。