たごもりすメモ

コードとかその他の話とか。

Hadoop徹底入門 第2版

著者の方からいただきました! ありがとうございます!

Hadoop徹底入門 第2版 オープンソース分散処理環境の構築

Hadoop徹底入門 第2版 オープンソース分散処理環境の構築

第1版も持ってたんだけど、較べてみると第2版のほうがはるかに出来がよくなってると思います。1版だと hadoop v0.20 と v0.21 の両論併記みたいになっていたところが CDH4 + MRv1 を一貫して対象とすることでずっとすっきりした内容になってますね。
というか本当に全体的にCDH4にしっかり対応した内容になっていて、まあ今から入門する人に古い環境について教えることもあるまい、と思うと、これは今から始める人には本当に良い内容になっているんじゃないでしょうか。
Namenode HA や JobTracker HA についてもちゃんと記述があり、実運用に耐えるHadoopクラスタを組める内容になっている*1と思います。

本の最後のほうにはFluentdの章と、あと我らがoza先生によるYARNの章もあります。Hadoopは動くとしてデータはどうやって持ってくるんだよ、という人にはFluentdの章は目的をシンプルに達成するための内容になってると思いました。YARNの章は、そもそも何故YARNなんてものがあるのかという話から始まるわかりやすい内容になってました。両方ともすばらしいと思います。

ということで、今からHadoop始める人はこの本を買っておけばいいんじゃないかなと思いましたね!

*1:かもしれない……というのは、誰かがこれを片手にプロダクション環境を作って実証するまではわからない!