id:mamoruk さんより自然言語処理を学ぶ書籍を紹介していただきました。
ありがとうございます。
http://cl.sd.tmu.ac.jp/prospective/readings
に分かれており、非常に参考になります。
また、mamorukさんの監修なさっている本が3/5(明日!)発売予定なので、
手にとってみようと思います。
- 作者: 奥野陽,グラム・ニュービッグ,萩原正人,小町守,イノウ
- 出版社/メーカー: 翔泳社
- 発売日: 2016/03/05
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る
mamorukさん自身の紹介記事はこちら
技術から基本を学ぶコンセプト
以下読んだことある本について感想など。
集合知プログラミング
- 作者: Toby Segaran,當山仁健,鴨澤眞夫
- 出版社/メーカー: オライリージャパン
- 発売日: 2008/07/25
- メディア: 大型本
- 購入: 91人 クリック: 2,220回
- この商品を含むブログ (277件) を見る
クラスタリング、検索エンジン、最適化手法、遺伝アルゴリズムなどを
アプリケーションを作って学びます。
この本の特色は、モジュールを使用せずにアルゴリズムを書くこと。
それ、sklearnで良いよね・・・みたいな言い訳は通用しません。
文章が読みやすくて、大好きな本の一つです。
入門ソーシャルデータ
入門 ソーシャルデータ 第2版 ―ソーシャルウェブのデータマイニング
- 作者: Matthew A. Russell,佐藤敏紀,瀬戸口光宏,原川浩一,長尾高弘
- 出版社/メーカー: オライリージャパン
- 発売日: 2014/06/21
- メディア: 大型本
- この商品を含むブログ (2件) を見る
集合知プログラミングと比べると、モジュールを結構使います。
扱う内容が好みではなかったのですが、
要約アルゴリズムが面白かったです。
(私が読んだのは初版なので2版以降は変わってるかも?)
実践 機械学習
- 作者: Willi Richert,Luis Pedro Coelho,斎藤康毅
- 出版社/メーカー: オライリージャパン
- 発売日: 2014/10/25
- メディア: 大型本
- この商品を含むブログ (4件) を見る
集合知プログラミング、入門ソーシャルデータと比べると、
コーディングの負担が少ないです。
(sklearnを使う場面が多い)
どちらかというと、機械学習を使って何をするか、どうするか?というところに重点が置かれています。
テキストだけではなく、画像、音楽データも扱っていたりして、結構楽しいです。
大規模サービス技術入門
[Web開発者のための]大規模サービス技術入門 ―データ構造、メモリ、OS、DB、サーバ/インフラ (WEB+DB PRESS plusシリーズ)
- 作者: 伊藤直也,田中慎司
- 出版社/メーカー: 技術評論社
- 発売日: 2010/07/07
- メディア: 単行本(ソフトカバー)
- 購入: 80人 クリック: 1,849回
- この商品を含むブログ (133件) を見る
はてなのインターンとかの内容を書籍化したんだったけな・・・(うろ覚え)
扱う内容が幅広く紹介が難しいんですが、
はてなのシステム運用の話も載っていて、「へ〜」って言いながら読んでました
(システムだけではなくて、実運用の実話とか)
アーキテクチャの話だと以前別の人に勧められた、
インフラデザインパターンも資料集として便利でした。
(Amazon評価微妙ですけど・・・)
インフラデザインパターン ~安定稼動に導く127の設計方式 (WEB+DB PRESS plus)
- 作者: 株式会社NTTデータ,杉原健郎,吉田一幸,岩崎賢治,三浦広志,吉田佐智男
- 出版社/メーカー: 技術評論社
- 発売日: 2014/02/07
- メディア: 大型本
- この商品を含むブログ (10件) を見る
バッドデータハンドブック
バッドデータハンドブック ―データにまつわる問題への19の処方箋
- 作者: Q. Ethan McCallum,磯蘭水,笹井崇司
- 出版社/メーカー: オライリージャパン
- 発売日: 2013/09/26
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (9件) を見る
データにまつわるエッセイとハウツー。
さくさく読める本です。
オライリーの中では、比較的薄くて小さいのもいいです。
(新書や文庫よりは大きいですけど)
データそのもののバッドさだけではなくて、
データの出自自体から考える必要性等、
データへの観点を広げることが出来ます。
あとはファイルに対するこだわりの章が素敵です。
ビバ ファイル
Pythonによるデータ分析入門
Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理
- 作者: Wes McKinney,小林儀匡,鈴木宏尚,瀬戸山雅人,滝口開資,野上大介
- 出版社/メーカー: オライリージャパン
- 発売日: 2013/12/26
- メディア: 大型本
- この商品を含むブログ (12件) を見る
matplotlib,numpy,pandasの使い方集ですね。
分析手法とかが詳しいわけではなく、
上記モジュールのデータ操作がメインなので注意が必要です。
あと、入門に向くかというと、ちょっとハイボリュームな気がします。
(Python入門者にはじめてのPythonを進める感じ)