2012年4月19日木曜日

Hadoop MapReduce デザインパターン ―MapReduceによる大規模テキストデータ処理

Hadoop MapReduce デザインパターン ―MapReduceによる大規模テキストデータ処理 Jimmy Lin, Chris Dyer ISBN4873115124 オライリージャパン

流行のMapReduce は力技で大量のデータ処理ができるが、だからといってなにも工夫が必要でないわけではない。 かいてみると以外に制約も多く、なかなか思った通りのことを書けなかったりする。 本書は、そのような場合に適用できるさまざまなテクニックを、具体的なデータアルゴリズムに沿って 紹介している。 英語版は、PDFが ここ で公開されている。

原題「Data-Intensive Text Processing with MapReduce」。 コードサンプルは擬似コードで書かれているだけで、Hadoopコードは全然出てこない。 そのせいで、わずか170ページ程度の本だが、非常に内容が濃い。 そのかわり、初学者にはちょっと敷居が高いかもしれない。

著者のJimmy Linとはちょっとお会いしたことがある。 若いのにすでにTenureを持っている俊才で、いまはサバティカルでTwitterにいるらしい。 こういうことができるところが、アメリカのいいところだよなあ。。

監訳者のお一人はノーチラスの「社長」神林さん。

Hadoop MapReduce デザインパターン ―MapReduceによる大規模テキストデータ処理
Jimmy Lin Chris Dyer
オライリージャパン
売り上げランキング: 33009

0 件のコメント:

コメントを投稿