Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎
Andreas C. Muller, Sarah Guido
ISBN4873117984
オライリージャパン
Pythonの機械学習ライブラリ scikit-learn を使って、さまざまな機械学習アルゴリズムの使い方を学ぶ。
特徴的なのは、アルゴリズムの詳細には立ち入らず、使い方に重点を置いていること。
とはいっても、ライブラリの使い方だけ説明しているということではなく、
どういうケースにどのアルゴリズムが適しているかを、実例を交えて詳細に論じている。
モデルの複雑さと過剰適合の関係など、機械学習において基本的な概念もわかりやすく
説明している。
特徴量の作り方や、パラメータ調整の実際に関しても詳しく述べられている。
特に、特殊な扱いが必要なテキスト処理の基礎も示されている。日本語に適用するには、形態素解析
など一手間かかるが、これ一冊でゆるい卒論ぐらいまではカバーできそう。
scikit-learnも国内ではまだあまり流行っている感じではないが、すごく良くできているので、
今後普及するのではないだろうか。
縁あって、翻訳させていただいた。Pythonで機械学習という本はたくさんあるけど、
その中でもなかなかの良書かと。よろしければぜひ。
Andreas C. Muller Sarah Guido
オライリージャパン
売り上げランキング: 639