實戰(zhàn)Hadoop

出版時間:2011-8  出版社:電子工業(yè)出版社  作者:劉鵬  頁數(shù):456  
Tag標簽:無  

內(nèi)容概要

作為谷歌云計算基礎(chǔ)架構(gòu)的模仿實現(xiàn),Hadoop堪稱業(yè)界最經(jīng)典的開源云計算平臺軟件?!秾崙?zhàn)Hadoop--開啟通向云計算的捷徑》(作者劉鵬)是原著的Hadoop編程技術(shù)書籍,是云計算專家劉鵬教授繼《云計算》教材取得成功后,再次組織團隊精心編寫的又一力作,其作者均來自擁有豐富實踐經(jīng)驗的云計算技術(shù)研發(fā)和教學(xué)團隊。
《實戰(zhàn)Hadoop--開啟通向云計算的捷徑》強調(diào)動手、強調(diào)實戰(zhàn),以風(fēng)趣幽默的語言和一系列生動的實戰(zhàn)應(yīng)用案例,系統(tǒng)地講授了Hadoop的核心技術(shù)和擴展技術(shù),包括:
HDFS、MapReduce、HBase、Hive、Pig、Cassandra、
Chukwa和ZooKeeper等,并給出了3個完整的Hadoop云計算綜合應(yīng)用實例,最后介紹了保障Hadoop平臺可靠性的方法。
本書讀者對象為各類云計算相關(guān)企業(yè)、高校和科研機構(gòu)的研發(fā)人員,亦適合作為高校研究生和本科生教材。

作者簡介

劉鵬,清華大學(xué)博士,解放軍理工大學(xué)教授、學(xué)科帶頭人,中國云計算專家委員會委員。主要研究方向為信息網(wǎng)格和云計算,完成科研課題18項,發(fā)表論文70余篇,獲部級科技進步獎6項。曾奪得國際計算機排序比賽冠軍,并兩次奪得全國高??萍急荣愖罡擢?,獲“全軍十大學(xué)習(xí)成才標兵”、“南京十大杰出青年”和“清華大學(xué)學(xué)術(shù)新秀”等稱號。2002年首倡的“網(wǎng)格計算池”和2003年研發(fā)的“反垃圾郵件網(wǎng)格”分別為云計算和云安全的前身。創(chuàng)辦了知名的中國網(wǎng)格(chinagrid.net)和中國云計算(chinacloud.cn)網(wǎng)站。

書籍目錄

第1章 神奇的大象——Hadoop
 1.1 初識神象
  1.2 Hadoop初體驗
  1.2.1 了解Hadoop的構(gòu)架
  1.2.2 查看Hadoop活動
 1.3 Hadoop族群
 1.4 Hadoop安裝
  1.4.1 在Linux系統(tǒng)中安裝Hadoop
  1.4.2 在Windows系統(tǒng)中安裝Hadoop
  1.4.3 站在象背上說“hello”
  1.4.4 Eclipse下的Hadoop應(yīng)用開發(fā)
 參考文獻
第2章 HDFS——不怕故障的海量存儲
第3章 分久必合——MapReduce
第4章 一張無限大的表——HBase
第5章 更上一層樓——MapReduce進階
第6章 Hive——飛進數(shù)據(jù)倉庫的小蜜蜂
第7章 Pig——一頭什么都能吃的豬
第8章 Facebook的女神——Cassandra
第9章 Chukwa——收集數(shù)據(jù)的大烏龜
第10章 一統(tǒng)天下——ZooKeeper
第11章 綜合實戰(zhàn)1——打造一個搜索引擎
第12章 綜合實戰(zhàn)2——生物信息學(xué)應(yīng)用
第13章 綜合實戰(zhàn)3——移動通信信令監(jiān)測與查詢
第14章 高枕無憂——Hadoop容錯

章節(jié)摘錄

版權(quán)頁:插圖:在對源文件進行功能性處理之前,有必要對11.2.2節(jié)生成的源文件進行一次預(yù)分析和過濾。主要原因有以下幾個。(1)在遇到故障并恢復(fù)爬行后,爬蟲會從日志文件的最近一頁(一頁包含20個帖子)重新繼續(xù)爬取工作。從最近一頁爬取保證了帖子不被遺漏,但是會導(dǎo)致有些帖子被重復(fù)爬取(一般不會超過2次)。為保證索引時指定文件的唯一性,有必要過濾相同帖子的記錄,保證帖子的唯一性。(2)爬取過程中,從遇到的帖子中抽取出的信息可能并不符合我們的要求,比如,源文件中可能會有之類的記錄。這樣的空信息記錄也必須過濾掉。對源文件進行一次預(yù)分析和過濾以確保數(shù)據(jù)的完整性和正確性,可以避免后續(xù)步驟中由于數(shù)據(jù)不正確而引發(fā)的一些問題。對元數(shù)據(jù)進行預(yù)分析是海量數(shù)據(jù)處理過程中很必要也是很自然的一步。

媒體關(guān)注與評論

隨著計算模式從個人計算向云計算的發(fā)展,開源軟件的比重和作用越來越大,現(xiàn)在多數(shù)云服務(wù)都基于開源平臺Hadoop是國際著名的云計算開源平臺,本書通過許多實例,深入系統(tǒng)地分析了Hadoop的技術(shù)、源碼以及構(gòu)建實用系統(tǒng)的方法。為國內(nèi)產(chǎn)學(xué)研各界開啟了一條通向云計算的捷徑。  ——中國工程院院士、中國電子學(xué)會計算專家委員會副主任 倪光南作為云計算基礎(chǔ)架構(gòu)的開源軟件,Hadoop堪稱業(yè)界最成熟和經(jīng)典的案例該書是云計算業(yè)界專家劉鵬教授帶領(lǐng)科研團隊,基于多年研究心得,做了大量技術(shù)開發(fā)和測試,以嚴謹?shù)膽B(tài)度和詼諧幽默的語言編寫的Hadoop實戰(zhàn)寶典。相信對推動中國云計算技術(shù)的發(fā)展和應(yīng)用具有重要價值。  ——中興通訊首席構(gòu)師、中國電子學(xué)會云計算專家委員會委員 羅圣美熱烈祝賀劉鵬教授主編的  實戰(zhàn)Hadoop——開啟通向云計算的捷徑。一書出版發(fā)行,它將大力推動我國云計算的應(yīng)用。  ——清華大學(xué)教授、中國電子學(xué)會云計算專家委員會委員 鄭緯民

編輯推薦

《實戰(zhàn)Hadoop:開啟通向云計算的捷徑》:云計算核心研發(fā)團隊剖析Hadoop:怎么裝?怎么編程?怎么解決實際問題?

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    實戰(zhàn)Hadoop PDF格式下載


用戶評論 (總計86條)

 
 

  •   實戰(zhàn)Hadoop——開啟通向云計算的捷徑 看看
  •   Hadoop的入門教材,學(xué)習(xí)云計算的開始。
  •   深入淺出、生動而詳細地講述Hadoop的基本原理,并配以實際應(yīng)用案例,相信本書會對推動Hadoop在國內(nèi)的應(yīng)用和研究起到極大的作用
  •   云計算涉及到的相關(guān)軟件的情況介紹的很多,對于對云計算所知不多的人很有幫助
  •   簡明易懂,由淺入深,很適合hadoop學(xué)習(xí)。
  •   了解hadoop必讀書籍,寫得很不錯,推薦
  •   這是購買的第一本hadoop方面的書,真的很不錯。
  •   內(nèi)容很標準,hadoop入門的話再好不過了,不會像網(wǎng)上的教程那樣總是出錯。
  •   知道如何開發(fā)云技術(shù)平臺,值得一看的書
  •   剛買,還沒時間看,但是作者給的網(wǎng)址: ***.chinacloud***盡然沒法登陸
  •   學(xué)習(xí)一下新技術(shù)??纯戳私饬私?。
  •   書寫的不錯,歷史,發(fā)展,案例
  •   入門可以,但這些上網(wǎng)找也是可以的。。。。不過可以幫著理一下思路。書很厚,說的點也多。。。但都不整個深入,介紹性的講了下。。。
  •   適合已經(jīng)入門的讀者。
  •   大數(shù)據(jù)時代入門書籍
  •   昨晚一口氣讀了大半,寫了很好,很適合初學(xué)者
  •   這書值得一看,不錯的書!
  •   書不錯,是可以直接上手的書
  •   書的內(nèi)容正好符合我所想要的
  •   書的質(zhì)量不錯,內(nèi)容還沒有看呢,很有手感
  •   這書實踐性好像挺強的.
  •   書剛到,還沒來的及看。
  •   從基礎(chǔ)入手,講的比較全面。
  •   純粹學(xué)習(xí)之用。
  •   精品,非常不錯,是一本入門級的好書,如果正在接觸海量數(shù)據(jù)的操作,可以嘗試學(xué)習(xí)。
  •   這本書配合權(quán)威指南看還行
  •   感覺這本書是初學(xué)者的最初的選擇
  •   實用性很強,就是里面有些錯誤有待修改。
  •   雖然有一些錯別字,但是還是覺得比其他的讀物要好點
  •   看了幾章 愛不釋手
  •   內(nèi)容詳實,很新,有用。
  •   正在看,看了下目錄不錯
  •   才看了一點,覺得理論講的不錯!
  •   看了目錄和第一頁,內(nèi)容質(zhì)量不錯,希望有收獲。
  •   《實戰(zhàn)Hadoop》是中國電子學(xué)會云計算專家委員會劉鵬教授主編的國內(nèi)第一本原著的Hadoop編程技術(shù)書籍。國內(nèi)原創(chuàng),但是講的比較淺顯,失之深入,快速瀏覽下也還不錯。
  •   作為Hadoop使用級別挺好的,之前劉博寫過一本云計算,不過理論偏多。后來寫了這本實戰(zhàn),感覺可以。如果能夠配合hadoop原理自己實現(xiàn)一套山寨或者精簡版的云計算平臺就更好了?!林馗写笥诟袆印?/li>
  •   劉鵬教授的云計算看過,很不錯,相信他推薦的書也很不錯,希望有所收獲
  •   書一看就是正版,但是感覺每頁的含量都不是很足,很多都是來自論文上面的,有點拼湊的感覺!在如今Hadoop資料比較缺乏的時代,用來作入門還是可以的。
  •   雖然從hadoop權(quán)威指南中抄了不少,但還是以中國人的方式呈現(xiàn)了hadoop。案例不錯。
  •   花一個小時通篇粗讀了一遍。對我們這種用不上想了解偶爾又想實戰(zhàn)研究一把的人,是本好書。
  •   這本書范圍挺廣,但是案例不錯經(jīng)典,缺相關(guān)關(guān)聯(lián)。不過可以提高自己的知識面。
  •   適合入門,深入的話,只能再買更詳細的書來看
  •   不錯的一本書,正好老師上課也是推薦這本書作為教材!
  •   總體內(nèi)容不錯,不夠詳細,不夠深入,初學(xué)者的入門好書。
  •   送貨的速度很快,書的內(nèi)容還沒有具體看,希望很好。
  •   還不錯,包裝不好,書略有破損
  •   總的說來,感覺內(nèi)容太少,雖然書挺厚的,但明顯內(nèi)容不多,一頁紙浪費不少。字號特別大,行間距也不小,一頁沒寫多少字,就用完了,如今這年頭,出版的書基本上都這個樣。無語!
  •   感覺還行,正在學(xué)習(xí)
  •   正在努力地學(xué)習(xí)中……
  •   挺實用的一本書,入門還是挺好的
  •   還不錯,入門參考
  •   這個需要慢慢看!
  •   還可以,深度不夠,不過還是比較全面
  •   給別人買的,聽說還好
  •   項目需要,研讀中...
  •   權(quán)威,目前階段算很好的了
  •   適合初學(xué)者學(xué)習(xí)hadoop框架,一步一步寫的比較仔細,不錯。
  •   該書編者是我老師,以及同學(xué)。 只能說,不推薦這本書。 這更像一本手冊。 推薦Hadoop權(quán)威指南這本書。
  •   只是工具書,對hadoop沒有一個直觀的認識,只是拿來玩玩還行。
  •   可能是個人水平有限,書中涉及到很多的JAVA語言內(nèi)容,本來想著增加運維能力的,感覺這本書應(yīng)該適合開發(fā)看!
  •   書本的內(nèi)容比較適合初學(xué)者,但是要深入研究的話光靠這本書是不行的。
  •   書中介紹不詳細!每頁書的內(nèi)容很少!介紹不是很到位!
  •   正在讀,寫的比較樸實,比較適合初學(xué)者
  •   看了之后還是覺得應(yīng)該買國外版的。
  •   以后再也不在當當買書了 運輸不好 書都損壞的不成樣子了 真夠鬧心
  •   還算可以,但不是我想想中的完美!
  •   體現(xiàn)了國產(chǎn)書的特色,東拼西湊,多個作者,一人一章,沒有統(tǒng)一的寫作思想,書的很多內(nèi)容就是官方文檔翻譯過來的,買虧了,不如去看官方文檔。
    求國人什么時候別太想著坑讀書人的錢!
  •   這本書一般般,講述的不夠細致。
  •   內(nèi)涵不夠!適合初級學(xué)習(xí)!?。。。。。。?!
  •   那有什么實戰(zhàn),簡直就是狗屁!看完這本書后就知道hadoop包括哪些模塊以及哪些實現(xiàn)技術(shù),沒有一點實戰(zhàn)性。這本書就是介紹hadoop的組成模塊以及子模塊的功能。
  •   內(nèi)容嚴重錯誤,字大,行間距大,擺明了坑爹啊。

    書內(nèi)的源碼肯定是亂寫上去的,各別類的方法在實際中跟本不存在,方法的輸入?yún)?shù)類型胡拼亂湊,全是異常,編譯都通不過。真是坑人啊。~~~~~~~~~~~~~

    后幾單的實戰(zhàn),根本就是海吹,沒有實戰(zhàn)的可行性。這些作者真是太無恥了。。。。。。大家警惕啊,買了就后悔。。。。。。
  •   看了這本書終于明白什么叫做天下文章一大抄
  •   這本書還算不錯的。比如Pig一章,介紹了如何運行腳本,都簡明扼要,切中要害??戳似渌臅紱]有很好闡述這個問題。抄的話,肯定是有的,畢竟這些東西都是外國人提出的。另外,這本書的推薦者實在太多了,比如張亞勤都推薦,覺得有點太中國特色了。
  •   這本書講述了很多新技術(shù),不過只是皮毛,不夠深入
  •   很出名的一本書,適合初學(xué)者,但是有的地方講的確實不到位,按照上面的說法安裝hadoop是絕對安裝不上的,有何必講,直接略過好了,或者給個指引,推薦個好的資源讓我們?nèi)タ?/li>
  •   預(yù)期的差不多,雖然最終沒有采用這個技術(shù)做項目,但確實了解了一些技術(shù)要領(lǐng)與細節(jié),值得購買。
  •   紙質(zhì)什么的都行,挺滿意的……
  •   雜糅,不具體,死摳概念,完全不想看,還不如網(wǎng)絡(luò)資料來的具體。
  •   很好,很不錯。書寫的很好,送貨速度很快
  •   書質(zhì)量很好,很喜歡,正在學(xué)習(xí)中
  •   1,質(zhì)量 非常好2,內(nèi)容 偏于實踐,如果初學(xué),買本原理的會比較好
  •   太專業(yè),有點看不太懂。卓越的送貨還是不錯的。
  •   剛拿到書,隨后進一步評論
  •   實戰(zhàn)Hadoop
  •   實戰(zhàn)Hadoop:開啟通向云計算的捷徑
  •   好書,希望解決大數(shù)據(jù)問題
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7