Hadoop徹底入門 第2版
著者の方からいただきました! ありがとうございます!
Hadoop徹底入門 第2版 オープンソース分散処理環境の構築
- 作者: 太田一樹,岩崎正剛,猿田浩輔,下垣徹,藤井達朗,山下真一,濱野賢一朗
- 出版社/メーカー: 翔泳社
- 発売日: 2013/07/09
- メディア: 大型本
- この商品を含むブログ (5件) を見る
第1版も持ってたんだけど、較べてみると第2版のほうがはるかに出来がよくなってると思います。1版だと hadoop v0.20 と v0.21 の両論併記みたいになっていたところが CDH4 + MRv1 を一貫して対象とすることでずっとすっきりした内容になってますね。
というか本当に全体的にCDH4にしっかり対応した内容になっていて、まあ今から入門する人に古い環境について教えることもあるまい、と思うと、これは今から始める人には本当に良い内容になっているんじゃないでしょうか。
Namenode HA や JobTracker HA についてもちゃんと記述があり、実運用に耐えるHadoopクラスタを組める内容になっている*1と思います。
本の最後のほうにはFluentdの章と、あと我らがoza先生によるYARNの章もあります。Hadoopは動くとしてデータはどうやって持ってくるんだよ、という人にはFluentdの章は目的をシンプルに達成するための内容になってると思いました。YARNの章は、そもそも何故YARNなんてものがあるのかという話から始まるわかりやすい内容になってました。両方ともすばらしいと思います。
ということで、今からHadoop始める人はこの本を買っておけばいいんじゃないかなと思いましたね!
*1:かもしれない……というのは、誰かがこれを片手にプロダクション環境を作って実証するまではわからない!