出版時間:2011-8 出版社:電子工業(yè)出版社 作者:劉鵬 頁數(shù):456
Tag標簽:無
內(nèi)容概要
作為谷歌云計算基礎(chǔ)架構(gòu)的模仿實現(xiàn),Hadoop堪稱業(yè)界最經(jīng)典的開源云計算平臺軟件?!秾崙?zhàn)Hadoop--開啟通向云計算的捷徑》(作者劉鵬)是原著的Hadoop編程技術(shù)書籍,是云計算專家劉鵬教授繼《云計算》教材取得成功后,再次組織團隊精心編寫的又一力作,其作者均來自擁有豐富實踐經(jīng)驗的云計算技術(shù)研發(fā)和教學(xué)團隊。
《實戰(zhàn)Hadoop--開啟通向云計算的捷徑》強調(diào)動手、強調(diào)實戰(zhàn),以風(fēng)趣幽默的語言和一系列生動的實戰(zhàn)應(yīng)用案例,系統(tǒng)地講授了Hadoop的核心技術(shù)和擴展技術(shù),包括:
HDFS、MapReduce、HBase、Hive、Pig、Cassandra、
Chukwa和ZooKeeper等,并給出了3個完整的Hadoop云計算綜合應(yīng)用實例,最后介紹了保障Hadoop平臺可靠性的方法。
本書讀者對象為各類云計算相關(guān)企業(yè)、高校和科研機構(gòu)的研發(fā)人員,亦適合作為高校研究生和本科生教材。
作者簡介
劉鵬,清華大學(xué)博士,解放軍理工大學(xué)教授、學(xué)科帶頭人,中國云計算專家委員會委員。主要研究方向為信息網(wǎng)格和云計算,完成科研課題18項,發(fā)表論文70余篇,獲部級科技進步獎6項。曾奪得國際計算機排序比賽冠軍,并兩次奪得全國高??萍急荣愖罡擢?,獲“全軍十大學(xué)習(xí)成才標兵”、“南京十大杰出青年”和“清華大學(xué)學(xué)術(shù)新秀”等稱號。2002年首倡的“網(wǎng)格計算池”和2003年研發(fā)的“反垃圾郵件網(wǎng)格”分別為云計算和云安全的前身。創(chuàng)辦了知名的中國網(wǎng)格(chinagrid.net)和中國云計算(chinacloud.cn)網(wǎng)站。
書籍目錄
第1章 神奇的大象——Hadoop
1.1 初識神象
1.2 Hadoop初體驗
1.2.1 了解Hadoop的構(gòu)架
1.2.2 查看Hadoop活動
1.3 Hadoop族群
1.4 Hadoop安裝
1.4.1 在Linux系統(tǒng)中安裝Hadoop
1.4.2 在Windows系統(tǒng)中安裝Hadoop
1.4.3 站在象背上說“hello”
1.4.4 Eclipse下的Hadoop應(yīng)用開發(fā)
參考文獻
第2章 HDFS——不怕故障的海量存儲
第3章 分久必合——MapReduce
第4章 一張無限大的表——HBase
第5章 更上一層樓——MapReduce進階
第6章 Hive——飛進數(shù)據(jù)倉庫的小蜜蜂
第7章 Pig——一頭什么都能吃的豬
第8章 Facebook的女神——Cassandra
第9章 Chukwa——收集數(shù)據(jù)的大烏龜
第10章 一統(tǒng)天下——ZooKeeper
第11章 綜合實戰(zhàn)1——打造一個搜索引擎
第12章 綜合實戰(zhàn)2——生物信息學(xué)應(yīng)用
第13章 綜合實戰(zhàn)3——移動通信信令監(jiān)測與查詢
第14章 高枕無憂——Hadoop容錯
章節(jié)摘錄
版權(quán)頁:插圖:在對源文件進行功能性處理之前,有必要對11.2.2節(jié)生成的源文件進行一次預(yù)分析和過濾。主要原因有以下幾個。(1)在遇到故障并恢復(fù)爬行后,爬蟲會從日志文件的最近一頁(一頁包含20個帖子)重新繼續(xù)爬取工作。從最近一頁爬取保證了帖子不被遺漏,但是會導(dǎo)致有些帖子被重復(fù)爬取(一般不會超過2次)。為保證索引時指定文件的唯一性,有必要過濾相同帖子的記錄,保證帖子的唯一性。(2)爬取過程中,從遇到的帖子中抽取出的信息可能并不符合我們的要求,比如,源文件中可能會有之類的記錄。這樣的空信息記錄也必須過濾掉。對源文件進行一次預(yù)分析和過濾以確保數(shù)據(jù)的完整性和正確性,可以避免后續(xù)步驟中由于數(shù)據(jù)不正確而引發(fā)的一些問題。對元數(shù)據(jù)進行預(yù)分析是海量數(shù)據(jù)處理過程中很必要也是很自然的一步。
媒體關(guān)注與評論
隨著計算模式從個人計算向云計算的發(fā)展,開源軟件的比重和作用越來越大,現(xiàn)在多數(shù)云服務(wù)都基于開源平臺Hadoop是國際著名的云計算開源平臺,本書通過許多實例,深入系統(tǒng)地分析了Hadoop的技術(shù)、源碼以及構(gòu)建實用系統(tǒng)的方法。為國內(nèi)產(chǎn)學(xué)研各界開啟了一條通向云計算的捷徑。 ——中國工程院院士、中國電子學(xué)會計算專家委員會副主任 倪光南作為云計算基礎(chǔ)架構(gòu)的開源軟件,Hadoop堪稱業(yè)界最成熟和經(jīng)典的案例該書是云計算業(yè)界專家劉鵬教授帶領(lǐng)科研團隊,基于多年研究心得,做了大量技術(shù)開發(fā)和測試,以嚴謹?shù)膽B(tài)度和詼諧幽默的語言編寫的Hadoop實戰(zhàn)寶典。相信對推動中國云計算技術(shù)的發(fā)展和應(yīng)用具有重要價值。 ——中興通訊首席構(gòu)師、中國電子學(xué)會云計算專家委員會委員 羅圣美熱烈祝賀劉鵬教授主編的 實戰(zhàn)Hadoop——開啟通向云計算的捷徑。一書出版發(fā)行,它將大力推動我國云計算的應(yīng)用。 ——清華大學(xué)教授、中國電子學(xué)會云計算專家委員會委員 鄭緯民
編輯推薦
《實戰(zhàn)Hadoop:開啟通向云計算的捷徑》:云計算核心研發(fā)團隊剖析Hadoop:怎么裝?怎么編程?怎么解決實際問題?
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載