Lucene搜索引擎開發(fā)權威經典

出版時間:2008-10  出版社:中國鐵道出版社  作者:于天恩  頁數(shù):629  字數(shù):939000  
Tag標簽:無  

內容概要

這本書基于Lucene的當前最新版本(2.1)精解了Lucene搜索引擎的相關知識,從基礎知識到應用開發(fā),精練簡潔,恰到好處    本書共包括16章,分為6部分。第1部分Lucene基礎。介紹了Lucene的基礎知識,包括Lucene的歷史和發(fā)展情況、使用Lucene創(chuàng)建索引和執(zhí)行搜索的基本方法以及中文分詞的應用,最后做了兩個應用項目。第2部分:數(shù)據(jù)解析。介紹解析不同格式數(shù)據(jù)(如Word、PDF等)的方法,包括常用的數(shù)據(jù)解析組件、Lucene自身的數(shù)據(jù)解析機制和Lius類庫。第3部分:索引的高級知識。介紹了 Lucene建立索引的過程,索引的查看和刪除,索引的同步,索引的合并和優(yōu)化等內容。第4部分:搜索的高級知識。介紹使用不同的Query對象構建搜索請求,使用QueryParser解析用戶的搜索請求,搜索結果的過濾和排序等內容。第5部分:Lucene應用實例。應用本節(jié)介紹的所有知識構建一個桌面搜索引擎和一個Web搜索引擎。這部分作為對前面所有內容的總結。第6部分:Nutch搜索引擎框架。介紹了基于Lucene的完整搜索引擎Nutch。    本書適合從Lucene初學者到高級開發(fā)人員之間的一切Lucene愛好者。

作者簡介

于天恩,現(xiàn)任某大型軟件開發(fā)公司技術總監(jiān),高級軟件工程師,精通主流軟件編程技術(100多種),具有大量軟件項目開發(fā)經驗。主持開發(fā)過大中型企業(yè)網站,短信服務系統(tǒng),辦公自動化系統(tǒng)(OA),CRM系統(tǒng)等。
  已經出版的作品:《PHP精解案例教程》、《做自己的搜索引擎——搜

書籍目錄

第1部分 Lucene基礎(第1~5章)  第1章 Lucene簡介  1.1 認識Lucene     1.1.1  Lucene是什么     1.1.2  Lucene的作者     1.1.3  Lucene的歷史     1.l.4  Lucene的現(xiàn)在   1.2  Lucene體驗實例     1.2.1 下載Lucene     1.2.2 編寫輔助糞     1.2.3 最簡單的搜索引擎     1.2.4 索引器的開發(fā)     1.2.5 索引器的運行     1.2.6 搜索器的開發(fā)      1.2.7 搜索器的運行    小結 第2章 創(chuàng)建索引    2.1 創(chuàng)建索引的基本方式     2.1.1 理解創(chuàng)建索引的過程     2.1.2 創(chuàng)建Field     2.1.3 創(chuàng)建Document     2.1.4 創(chuàng)建Index Writer   2.2 創(chuàng)建索引實例     2.2.1 簡單索引     2.2.2 復雜一點的索引     2.2.3 為文件創(chuàng)建索引     2.2.4 為某一目錄下的所有文件創(chuàng)建索引   小結 第3章 執(zhí)行搜索   3.1 執(zhí)行搜索的基本方式     3.1.1 創(chuàng)建搜索器對象:IndexSearcher     3.1.2 封裝搜索條件:使用Term和Query對象     3.1.3 執(zhí)行搜索     3.1.4 提取搜索結果:了解Hits對象     3.1.5 提取搜索結果:了解Document對象     3.1.6 提取搜索結果了解Field對象  3.2 執(zhí)行搜索實例     3.2.1 簡單搜索     3.2.2 分詞問題   小結 第4章 中文分詞  4.1 說說分詞     4.1.1 分詞的方法     4.1.2 做分詞器   4.2  Lucene的分詞器     4.2.1 二分法分詞器     4.2.2  Lucene自帶的中文分詞器     4.2.3  NGram分詞器的原理和用法     4.2.4  JE分詞器的原理和用法     4.2.5  IK分詞器的原理和用法     4.2.6 其他分詞器  小結  ……第2部分 數(shù)據(jù)解析(第6~8章)第3部分 索引的高級知識(第9~10章)第4部分 搜索的高級知識(第11~12章)第5部分 lucene應用實例(第13~14章)第6部分 Nutch搜索引擎框架(第15~16章)

章節(jié)摘錄

  第1部分 Lucene基礎(第1~5章)  作為本書的第一部分,筆者在這里使用五章的篇幅介紹了Lucene的基礎知識。包括Lucene的歷史和發(fā)展情況、使用Lucene創(chuàng)建索引和執(zhí)行搜索的基本方法以及中文分詞的應用,最后做了兩個應用項目,來說明使用Lucene建立搜索引擎的詳細過程?! ∵@部分內容是很淺的,只是基礎。學過了這部分之后,讀者就可以做一些實際的應用項目了。比如:給自己的網站添加全文搜索引擎。

編輯推薦

  《Lucene搜索引擎開發(fā)權威經典》基于Lucene的當前最新版本(2.1)精解了Lucene搜索引擎的相關知識,從基礎知識到應用開發(fā),精煉簡潔,恰到好處?!  禠ucene搜索引擎開發(fā)權威經典》包含了必要的理論,但以實踐為主。所講的理論都不是紙上談兵,都是可以立即付諸實踐進行工程應用,代碼可以直接拿來用。  書,不見得要寫得深透。書的好壞要由書面向的讀者群來評價?!禠ucene搜索引擎開發(fā)權威經典》適合從Lucene初學者到高級開發(fā)人員之間的一切Lucene愛好者?! 热菥殞嵱?,《Lucene搜索引擎開發(fā)權威經典》中所列代碼可以搭建一座中型搜索平臺,完整實例再現(xiàn),讓讀者緊跟作者構建思路,Lucene搜索引擎技術完美演繹。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    Lucene搜索引擎開發(fā)權威經典 PDF格式下載


用戶評論 (總計6條)

 
 

  •   《搜索引擎權威經典》一書約630頁厚,售價為88元,買了一本試試,總算沒有白花書費。該書的主要優(yōu)缺點如下:

    優(yōu)點:
    1)lucene部分寫的比較細致,容易讀懂。例程結構清晰、錯誤較少,有一定重用的價值,多數(shù)情況不作或只稍為修改就可以運行。
    2)對PDF、WORD、EXCEL、XML、HTML等文件的解析較好。
    3)光盤中附帶了運行l(wèi)ucene的一些插件。光盤沒有附帶的,還可以在書中推薦的網址下載。沒有軟件版本不匹配的問題。

    缺點:
    1)說了很多重復的話,用了很多重復的代碼。很多程序只是修改了2~3行代碼,連程序的名字都沒有換。
    2)使用CMD,在DOS界面下調試運行程序十分不便,建議改用Eclipse/MyEclipse。
    3)Nutch部分只有區(qū)區(qū)20余頁,到總頁碼的5%,而且介紹沒有Nutch和Lucene的聯(lián)系。似乎,有點不負責任。

    看完覺得寫的虎頭蛇尾 過于羅嗦,談不上什么“權威”,只不過適合那些需要容易上手并迅速深入lucene的人。
  •   寫的很好,中國人自己寫的好書
  •   從當當買了這么多書,這是我買得最失望的一本書,作者純粹就是想湊字數(shù)賺稿費,看完什么東西也學不到,還不如看lucene源代碼來得實在,也沒有一些網站上對lucene分析得好,總的來說很讓人失望的一本書。
  •   很失望,不好,代碼連最基本的java格式都不是,是c的排版格式,而且很多地方都是java所不推薦的編程方式,重復的代碼一堆,來撐篇幅,不少實例圖也是錯誤的,張冠李戴,不值得買。
  •   唉,這是我讀過的最會堆砌的書了,非常遺憾看到這樣的技術書籍,極不推薦購買
  •   從來沒見過這么濫竽充數(shù)的技術書籍。虧作者還好意思顯擺。他那點積累太淺薄了。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網 手機版

京ICP備13047387號-7