好書推薦-Hadoop技術手冊(第三版)

 

詳細介紹(點我)

 

 

準備好釋放潛藏在您資料中的力量了嗎?透過這本綜合技術大全,您將學會如何用Apache Hadoop來打造並維運一個可靠而具擴充性的分散式系統。無論是想瞭解如何分析各種大小資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。

您將在本書中發現許多耀眼的應用案例,用以說明Hadoop是如何被用來解決特定問題。第三版修訂囊括了近期Hadoop的一些改變,像是關於新版MapReduce API的介紹,以及MapReduce 2那極具彈性的執行模型(YARN)。

.用HDFS(Hadoop Distributed File System)來儲存大型資料集。

.用MapReduce運行分散式運算。

.用Hadoop的資料與I/O組成元件來進行壓縮、資料完整性驗證、序列化(包括Avro)與封藏(persistence)。

.探索在現實生活中,撰寫MapReduce程式常見的陷阱,以及進階的功能。

.設計、建立與管理一座專用的Hadoop叢集,或者在雲端服務上運行Hadoop

.用Sqoop將資料從關聯式資料庫載入HDFS

.運用高階查詢語言Pig來處理大量資料

.運用Hadoop的資料倉儲系統Hive來分析資料集

.善用HBase資料庫來儲存結構化與辦結構化資料

.善用ZooKeeper搭建分散式系統



作者簡介:

Tom White

現任 Cloudera 工程師,也是阿帕契基金會的成員。自2007年2月起,他就是Apache Hadoop的提交者。他曾幫oreilly.com、java.net與IBM的developerWorks撰寫多篇技術文章;此外也在多場商業研討會中發表演講。



 

詳細介紹(點我)

 

arrow
arrow

    AVA 發表在 痞客邦 留言(0) 人氣()