あれもPython,これもPython

Pythonメモ※本サイトはアフィリエイトを利用しています

自然言語処理入門本について書いたら、素敵な書籍リストを頂いた

id:mamoruk さんより自然言語処理を学ぶ書籍を紹介していただきました。
ありがとうございます。
http://cl.sd.tmu.ac.jp/prospective/readings

  1. 自然言語処理
  2. 機械学習
  3. ウェブマイニング

に分かれており、非常に参考になります。
また、mamorukさんの監修なさっている本が3/5(明日!)発売予定なので、
手にとってみようと思います。

自然言語処理の基本と技術 (仕組みが見えるゼロからわかる)

自然言語処理の基本と技術 (仕組みが見えるゼロからわかる)

mamorukさん自身の紹介記事はこちら
技術から基本を学ぶコンセプト

以下読んだことある本について感想など。

集合知プログラミング

集合知プログラミング

集合知プログラミング

クラスタリング検索エンジン、最適化手法、遺伝アルゴリズムなどを
アプリケーションを作って学びます。
この本の特色は、モジュールを使用せずにアルゴリズムを書くこと。

それ、sklearnで良いよね・・・みたいな言い訳は通用しません。
文章が読みやすくて、大好きな本の一つです。

入門ソーシャルデータ

入門 ソーシャルデータ 第2版 ―ソーシャルウェブのデータマイニング

入門 ソーシャルデータ 第2版 ―ソーシャルウェブのデータマイニング

集合知プログラミングと比べると、モジュールを結構使います。
扱う内容が好みではなかったのですが、
要約アルゴリズムが面白かったです。
(私が読んだのは初版なので2版以降は変わってるかも?)

実践 機械学習

実践 機械学習システム

実践 機械学習システム

集合知プログラミング、入門ソーシャルデータと比べると、 コーディングの負担が少ないです。
(sklearnを使う場面が多い)
どちらかというと、機械学習を使って何をするか、どうするか?というところに重点が置かれています。
テキストだけではなく、画像、音楽データも扱っていたりして、結構楽しいです。

大規模サービス技術入門

はてなインターンとかの内容を書籍化したんだったけな・・・(うろ覚え)
扱う内容が幅広く紹介が難しいんですが、
はてなのシステム運用の話も載っていて、「へ〜」って言いながら読んでました
(システムだけではなくて、実運用の実話とか)

アーキテクチャの話だと以前別の人に勧められた、
インフラデザインパターンも資料集として便利でした。
(Amazon評価微妙ですけど・・・)

インフラデザインパターン ~安定稼動に導く127の設計方式 (WEB+DB PRESS plus)

インフラデザインパターン ~安定稼動に導く127の設計方式 (WEB+DB PRESS plus)

バッドデータハンドブック

バッドデータハンドブック ―データにまつわる問題への19の処方箋

バッドデータハンドブック ―データにまつわる問題への19の処方箋

データにまつわるエッセイとハウツー。
さくさく読める本です。
オライリーの中では、比較的薄くて小さいのもいいです。
(新書や文庫よりは大きいですけど)

データそのもののバッドさだけではなくて、
データの出自自体から考える必要性等、
データへの観点を広げることが出来ます。

あとはファイルに対するこだわりの章が素敵です。
ビバ ファイル

Pythonによるデータ分析入門

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

matplotlib,numpy,pandasの使い方集ですね。

分析手法とかが詳しいわけではなく、
上記モジュールのデータ操作がメインなので注意が必要です。

あと、入門に向くかというと、ちょっとハイボリュームな気がします。
(Python入門者にはじめてのPythonを進める感じ)