開發(fā)自己的搜索引擎--Lucene 2.0+Heriterx

出版時間:2007-6  出版社:人民郵電出版社  作者:邱哲,符滔滔  頁數(shù):521  字?jǐn)?shù):662000  
Tag標(biāo)簽:無  

內(nèi)容概要

本書是一本針對搜索引擎開發(fā)的書籍。通過學(xué)習(xí)本書,讀者可以獨(dú)立構(gòu)建出一個企業(yè)級的搜索引擎網(wǎng)站。本書詳細(xì)講解了搜索引擎與信息檢索基礎(chǔ),Lucene入門實(shí)例,Lucene索引的建立,使用Lucene進(jìn)行搜索,排序,過濾和分頁,Lucene的分析器,對Word、Excel和PDF格式文檔的處理,Compass搜索引擎框架,Lucene分布式和Google Search API,爬蟲Heritrix,HTMLParser,DWR等內(nèi)容。最后綜合使用所講述的技術(shù),構(gòu)建了一個典型的垂直搜索系統(tǒng),該系統(tǒng)具有很強(qiáng)的商業(yè)實(shí)用價值?! ”緯且槐窘榻B如何使用Lucene 2.0和Heritrix來構(gòu)建搜索引擎的書。通過對相關(guān)API和源代碼的分析,力求使讀者在掌握應(yīng)用的基礎(chǔ)上能夠深入其核心,自行擴(kuò)展和開發(fā)相應(yīng)組件,開發(fā)出更有創(chuàng)意的搜索引擎產(chǎn)品?! ”緯m合從事計算機(jī)軟件開發(fā)的人員閱讀,同時也可以作為搜索引擎愛好者的入門書籍。閱讀本書需要具備Java語言基礎(chǔ)。

作者簡介

邱哲,北京理工大學(xué)碩士,現(xiàn)為某公司技術(shù)經(jīng)理,主要從事歐美軟件外包開發(fā)。在J2EE方面有4年的開發(fā)經(jīng)驗(yàn),在搜索引擎與“爬蟲”方面有3年的開發(fā)經(jīng)驗(yàn),著有《征服Ajax+Lucene構(gòu)建搜索引擎》一書。

書籍目錄

第一篇 搜索引擎入門  第1章 搜索引擎與信息檢索基礎(chǔ)     1.1 搜索引擎的歷史       1.1.1 萌芽:Archie、Gopher       1.1.2 起步:Robot(網(wǎng)絡(luò)機(jī)器人)的出現(xiàn)與Spider(網(wǎng)絡(luò)爬蟲)       1.1.3 發(fā)展:Excite、Galaxy、Yahoo等       1.1.4 繁榮:Infoseek、AltaVista、Google和Baidu     1.2 信息檢索系統(tǒng)的基本知識       1.2.1 什么是信息檢索系統(tǒng)       1.2.2 信息檢索的過程       1.2.3 傳統(tǒng)查找的優(yōu)點(diǎn)和不足       1.2.4 使用索引提高檢索速度       1.2.5 倒排索引       1.2.6 評價信息檢索系統(tǒng)的標(biāo)準(zhǔn)     1.3 Lucene簡介     1.4 小結(jié) 第二篇 Lucene開發(fā)詳解  第2章 Lucene入門實(shí)例     2.1 實(shí)例介紹       2.1.1 實(shí)例說明       2.1.2 開發(fā)過程     2.2 準(zhǔn)備工作       2.2.1 將文檔的全角標(biāo)點(diǎn)轉(zhuǎn)換成半角標(biāo)點(diǎn)       2.2.2 將大文檔切分成多個小文檔       2.2.3 預(yù)處理源文件的統(tǒng)一接口     2.3 創(chuàng)建Eclipse工程       2.3.1 準(zhǔn)備工作       2.3.2 創(chuàng)建工程并引入Lucene的JAR包       2.3.3 運(yùn)行文檔預(yù)處理類       2.3.4 創(chuàng)建處理文檔的索引類:IndexProcessor       2.3.5 創(chuàng)建檢索索引的搜索類     2.4 運(yùn)行效果     2.5 小結(jié)   第3章 Lucene索引的建立     3.1 Document邏輯文件       3.1.1 Lucene的Document       3.1.2 為Document添加多種Field       3.1.3 Document的內(nèi)部實(shí)現(xiàn)     3.2 Field的內(nèi)部實(shí)現(xiàn)       3.2.1 Field包含的類       3.2.2 Field類的構(gòu)造方法     3.3 Lucene的索引工具IndexWriter       3.3.1 IndexWriter的初始化       3.3.2 向索引添加文檔       3.3.3 限制每個Field中的詞條的數(shù)量     3.4 Lucene索引過程詳解       3.4.1 Lucene索引建立過程概述             3.4.2 使用addDocument方法向索引添加文檔       3.4.3 DocumentWriter的addDocument方法                               3.4.4 文檔的倒排       3.4.5 對postingTable進(jìn)行排序       3.4.6 將Posting信息寫入索引     3.5 索引文件格式       3.5.1 索引的segment       3.5.2 .fnm格式       3.5.3 .fdx與.fdt格式       3.5.4 .tii與.tis格式       3.5.5 deletable格式                   3.5.6 復(fù)合索引格式.cfs           3.6 索引過程的優(yōu)化                   3.6.1 合并因子mergeFactor             3.6.2 maxMergeDocs                               3.6.3 minMergeDocs           3.7 索引的合并與索引的優(yōu)化       3.7.1 FSDirectory與RAMDirectory       3.7.2 使用IndexWriter來合并索引                                     3.7.3 索引的優(yōu)化     3.8 從索引中刪除文檔                                                      3.8.1 索引的讀取工具IndexReader             3.8.2 使用文檔ID號來刪除特定文檔       3.8.3 使用Field信息來刪除批量文檔     3.9 Lucene的同步問題       3.9.1 為什么要進(jìn)行同步以及Lucene的同步法則       3.9.2 commit.lock與write.lock                 3.10 Lucene 2.0的新類:IndexModifier類     3.11 小結(jié)   第4章 Lucene的搜索     4.1 使用IndexSearcher進(jìn)行搜索       4.1.1 初始化IndexSearcher       4.1.2 IndexSearcher最簡單的使用       4.1.3 IndexSearcher的多種search方法     4.2 Hits類詳解       4.2.1 Hits類的公有接口       4.2.2 效率分析       4.2.3 Hits內(nèi)部的緩存       4.2.4 Hits類的工作原理     4.3 對搜索結(jié)果的評分       4.3.1 文檔與詞條的向量空間       4.3.2 Lucene的文檔得分算法     4.4 構(gòu)建各種Lucene內(nèi)建的Query對象       4.4.1 toString查看原子查詢       4.4.2 查詢重寫與權(quán)重       4.4.3 TermQuery詞條搜索       4.4.4 BooleanQuery布爾搜索       4.4.5 RangeQuery范圍搜索       4.4.6 PrefixQuery前綴搜索       4.4.7 PhraseQuery短語搜索       4.4.8 MultiPhraseQuery多短語搜索       4.4.9 FuzzyQuery模糊搜索       4.4.10 WildcardQuery通配符搜索       4.4.11 SpanQuery跨度搜索           4.5 第三方提供的Query對象:RegexQuery                       4.6 通過QueryParser轉(zhuǎn)換用戶關(guān)鍵字                                         4.6.1 詞條的定義       4.6.2 QueryParser初始化       4.6.3 改變QueryParser默認(rèn)的布爾邏輯                   4.6.4 短語和QueryParser       4.6.5 FuzzyQuery和QueryParser       4.6.6 通配符與QueryParser                                     4.6.7 查找指定的Field       4.6.8 RangeQuery與QueryParser       4.6.9 QueryParser和SpanQuery     4.7 多Field搜索與多索引搜索       4.7.1 多域搜索MultiFieldQueryParser             4.7.2 MultiSearcher在多個索引上搜索             4.7.3 ParalellMultiSearcher:多線程搜索             4.7.4 Searchable和RMI           4.8 小結(jié)   第5章 排序、過濾和分頁     5.1 相關(guān)度排序       5.1.1 使用Score進(jìn)行自然排序       5.1.2 Searcher的explain方法       5.1.3 通過改變boost值來改變文檔的得分     5.2 使用Sort來排序       5.2.1 Sort簡介       5.2.2 SortField       5.2.3 按文檔得分進(jìn)行排序       5.2.4 按文檔的內(nèi)部ID號來排序       5.2.5 按一個或多個Field來排序       5.2.6 改變SortField中的Locale信息     5.3 搜索的過濾器       5.3.1 過濾器的基本結(jié)構(gòu)                                     5.3.2 一個簡單的Filter:建立索引       5.3.3 一個簡單的Filter:打印索引文檔信息                   5.3.4 一個簡單的Filter:安全級別與過濾器代碼       5.3.5 一個簡單的Filter:在搜索時應(yīng)用過濾器             5.3.6 一個簡單的Filter:總結(jié)       5.3.7 按范圍過濾RangeFilter       5.3.8 在結(jié)果中查詢QueryFilter       5.3.9 緩存結(jié)果:CachingWrapperFilter     5.4 翻頁問題       5.4.1 依賴于session的翻頁             5.4.2 多次查詢       5.4.3 緩存+多次查詢             5.4.4 緩存+多次查詢+數(shù)據(jù)庫     5.5 小結(jié)   第6章 Lucene的分析器           6.1 分析       6.1.1 分詞             6.1.2 Lucene的分析器的結(jié)構(gòu)       6.1.3 Lucene的分析器的實(shí)現(xiàn)                 6.2 Lucene與JavaCC       6.2.1 JavaCC簡介                         6.2.2 JavaCC為Lucene提供的分析器腳本       6.2.3 Lucene的標(biāo)準(zhǔn)分析器       6.2.4 標(biāo)準(zhǔn)過濾器:StandardFilter       6.2.5 大小寫轉(zhuǎn)換器:LowerCaseFilter             6.2.6 忽略詞過濾器:StopFilter     6.3 分析器的進(jìn)階       6.3.1 再看StandardAnalyzer中的管道過濾器結(jié)構(gòu)       6.3.2 長度過濾器:LengthFilter       6.3.3 PerFieldAnalyzerWrapper       6.3.4 其他     6.4 對中文的分析       6.4.1 現(xiàn)有的中文分詞方式簡介       6.4.2 中科院的分詞軟件和JE分詞     6.5 小結(jié) 第三篇 Lucene相關(guān)話題  第7章 對Word、Excel 和PDF的處理     7.1 使用PDFBox處理PDF文檔       7.1.1 PDFBox的下載       7.1.2 在Eclipse中配置       7.1.3 使用PDFBox解析PDF內(nèi)容       7.1.4 運(yùn)行效果       7.1.5 與Lucene的集成     7.2 使用xpdf來處理中文PDF文檔       7.2.1 xpdf的下載       7.2.2 配置       7.2.3 提取中文       7.2.4 運(yùn)行效果     7.3 使用POI來處理Excel和Word文件格式       7.3.1 對Excel的處理類       7.3.2 ExcelReader的運(yùn)行效果       7.3.3 POI中Excel文件Cell的類型       7.3.4 對Word的處理類     7.4 使用Jacob來處理Word文檔       7.4.1 Jacob的下載       7.4.2 在Eclipse中配置           7.5 小結(jié)   第8章 Compass:封裝了Lucene的框架     8.1 Compass簡介       8.1.1 Compass的下載       8.1.2 Compass的代碼片斷     8.2 Compass的初始配置       8.2.1 Compass的配置文件       8.2.2 將索引存放于內(nèi)存中       8.2.3 使用JDBC來存儲索引             8.2.4 使用連接池來存儲索引       8.2.5 加載compass.cfg.xml文件     8.3 域模型的配置       8.3.1 實(shí)體代碼       8.3.2 實(shí)體關(guān)系             8.3.3 實(shí)體Book的配置文件       8.3.4 通用元數(shù)據(jù)定義文件(.cmd.xml)       8.3.5 Author和Article的配置文件     8.4 使用Compass來建立索引             8.4.1 索引代碼       8.4.2 對象關(guān)系圖和運(yùn)行結(jié)果     8.5 使用Compass來搜索       8.5.1 使用find()方法搜索       8.5.2 CompassHits類型                               8.5.3 CompassHit類型       8.5.4 使用Lucene語法來查找     8.6 配置Analyzer和Optimizer     8.7 小結(jié)   第9章 Lucene分布式和Google Search API     9.1 Lucene與分布式       9.1.1 什么是GFS       9.1.2 為Lucene提供分布式的幾點(diǎn)設(shè)想     9.2 Google的Search API       9.2.1 搭建環(huán)境       9.2.2 構(gòu)建搜索類       9.2.3 設(shè)置查詢時的參數(shù)和查詢語法       9.2.4 運(yùn)行測試     9.3 小結(jié) 第四篇 網(wǎng)絡(luò)爬蟲Heritrix  第10章 無比強(qiáng)大的網(wǎng)絡(luò)爬蟲Heritrix     10.1 Heritrix使用入門       10.1.1 下載和運(yùn)行Heritrix       10.1.2 在Eclipse里配置Heritrix的開發(fā)環(huán)境       10.1.3 創(chuàng)建一個新的抓取任務(wù)       10.1.4 設(shè)置抓取時的處理鏈       10.1.5 設(shè)置運(yùn)行時的參數(shù)             10.1.6 運(yùn)行抓取任務(wù)       10.1.7 Heritrix的鏡像存儲結(jié)構(gòu)       10.1.8 終止抓取或終止Heritrix的運(yùn)行     10.2 Heritrix的架構(gòu)       10.2.1 抓取任務(wù)CrawlOrder       10.2.2 中央控制器CrawlController       10.2.3 Frontier鏈接制造工廠       10.2.4 用Berkeley DB實(shí)現(xiàn)的BdbFrontier       10.2.5 Heritrix的多線程ToeThread和ToePool       10.2.6 處理鏈和Processor     10.3 擴(kuò)展和定制Heritrix       10.3.1 向Heritrix中添加自己的Extractor       10.3.2 定制Queue-assignment-policy的兩個問題       10.3.3 定制Queue-assignment-policy繼承QueueAssignmentPolicy類       10.3.4 擴(kuò)展FrontierScheduler來抓取特定的內(nèi)容       10.3.5 在Prefetcher中取消robots.txt的限制     10.4 小結(jié) 第五篇 構(gòu)建垂直搜索引擎  第11章 搜索引擎綜合實(shí)例:準(zhǔn)備篇     11.1 實(shí)例簡介以及實(shí)現(xiàn)途徑       11.1.1 選擇網(wǎng)站       11.1.2 太平洋電腦網(wǎng)和網(wǎng)易手機(jī)頻道       11.1.3 分析網(wǎng)站內(nèi)容并準(zhǔn)備抓取清單       11.1.4 從下拉列表獲得手機(jī)品牌首頁       11.1.5 解析手機(jī)品牌頁面     11.2 在Heritrix中為pconline開發(fā)抓取所需的定制類       11.2.1 保存所有產(chǎn)品的頁面和圖片       11.2.2 不保存其他無關(guān)頁面       11.2.3 開始抓取     11.3 在Heritrix中為網(wǎng)易手機(jī)頻道開發(fā)抓取所需的定制類       11.3.1 分析網(wǎng)易手機(jī)頻道       11.3.2 設(shè)計抓取代碼     11.4 在Eclipse中創(chuàng)建工程結(jié)構(gòu)       11.4.1 下載插件       11.4.2 在Eclipse中配置插件       11.4.3 創(chuàng)建工程       11.4.4 設(shè)置工程的Context       11.4.5 設(shè)定源代碼存放和輸出路徑       11.4.6 添加Java代碼       11.4.7 添加Jar包       11.4.8 創(chuàng)建JSP文件       11.4.9 工程整體結(jié)構(gòu)一覽     11.5 設(shè)定配置文件及其相關(guān)類       11.5.1 系統(tǒng)屬性配置文件       11.5.2 封裝配置文件     11.6 產(chǎn)品詳細(xì)信息文件格式     11.7 解析網(wǎng)頁信息的基類Extractor     11.8 太平洋電腦網(wǎng)手機(jī)產(chǎn)品頁面Extractor     11.9 pconline產(chǎn)品信息運(yùn)行效果測試       11.9.1 編寫測試函數(shù)       11.9.2 執(zhí)行測試     11.10 網(wǎng)易手機(jī)頻道的產(chǎn)品信息運(yùn)行效果     11.11 構(gòu)建產(chǎn)品信息詞庫     11.12 數(shù)據(jù)庫與索引結(jié)構(gòu)       11.12.1 定義Product類       11.12.2 確定數(shù)據(jù)庫與索引的結(jié)構(gòu)     11.13 數(shù)據(jù)庫處理和索引處理       11.13.1 對數(shù)據(jù)庫進(jìn)行操作       11.13.2 對索引進(jìn)行操作     11.14 調(diào)用數(shù)據(jù)庫處理類和索引處理類     11.15 運(yùn)行     11.16 小結(jié)   第12章 使用正則表達(dá)式與HTMLParser提取網(wǎng)頁內(nèi)容     12.1 HTML的基本知識     12.2 JDK中的正則表達(dá)式提取網(wǎng)頁內(nèi)容       12.2.1 java.util.regex包       12.2.2 正則表達(dá)式提取網(wǎng)頁內(nèi)容實(shí)例     12.3 HTMLParser提取網(wǎng)頁內(nèi)容       12.3.1 HTMLParser的下載       12.3.2 HTMLParser概述       12.3.3 Lexer的功能及實(shí)現(xiàn)       12.3.4 HTMLParser的功能及實(shí)現(xiàn)       12.3.5 HTMLParser實(shí)例     12.4 小結(jié)   第13章 搜索引擎綜合實(shí)例:DWR     13.1 DWR的下載     13.2 DWR入門與實(shí)例演示       13.2.1 創(chuàng)建工程結(jié)構(gòu)       13.2.2 在web.xml中配置DWR       13.2.3 配置dwr.xml       13.2.4 頁面代碼       13.2.5 運(yùn)行效果       13.2.6 DWR與直接使用XMLHttpRequest對象的比較       13.2.7 在DWR中操縱自定義的對象       13.2.8 查看DWR的輸出日志     13.3 dwr.xml的配置       13.3.1 dwr.xml的標(biāo)準(zhǔn)結(jié)構(gòu)       13.3.2 標(biāo)簽與DWR自帶的converter和creator       13.3.3 標(biāo)簽       13.3.4 標(biāo)簽       13.3.5 另一個例子     13.4 util.js       13.4.1 調(diào)用util.js       13.4.2 使用useLoadingMessage方法顯示提示圖標(biāo)       13.4.3 DWRUtil.setValue和DWRUtil.getValue       13.4.4 DWRUtil.getValues和DWRUtil.setValues       13.4.5 DWRUtil.addOptions和DWRUtil.removeAllOptions       13.4.6 DWRUtil.addRows和DWRUtil.removeAllRows       13.4.7 DWRUtil.toDescriptiveString方法     13.5 小結(jié)   第14章 搜索引擎綜合實(shí)例:Web篇     14.1 配置文件       14.1.1 Spring配置文件       14.1.2 DWR配置文件       14.1.3 web.xml                 14.2 各種Bean類             14.2.1 SearchResult       14.2.2 SearchResults       14.2.3 SearchRequest     14.3 SearchService的實(shí)現(xiàn)     14.4 SearchResultDao     14.5 前臺部分       14.5.1 搜索主頁面main.jsp       14.5.2 圖片的顯示       14.5.3 詳細(xì)信息頁面detail.jsp     14.6 問題     14.7 小結(jié)

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    開發(fā)自己的搜索引擎--Lucene 2.0+Heriterx PDF格式下載


用戶評論 (總計80條)

 
 

  •   以前總覺得搜索引擎很神秘,遙不可及,沒想到通過看完此書,初步學(xué)習(xí)JAVA界第一個開源搜索引擎框架--Lucene后,才真正感覺其實(shí)搜索就在我們身邊,搜索引擎以及網(wǎng)絡(luò)爬蟲的基本原理也已了解。而此書就是最好的入門書籍,講的很通俗易懂,實(shí)例也很到位,內(nèi)容比較豐富,對于想用JAVA開發(fā)簡單的搜索引擎的或是想在自己J2EE之路上錦上添花的讀者,都是值得一看的好書??!
  •   現(xiàn)在網(wǎng)上關(guān)于搜索引擎的資料比較少,.net版本更是沒有。我是從Lucene的Java版獲取思路,完善Lucene.net的功能。偶爾可以看看,如果你想學(xué)習(xí)搜索引擎。
  •   正在進(jìn)行著畢業(yè)設(shè)計的實(shí)現(xiàn),我選擇的題目為基于lucene檢索系統(tǒng)的研究是開發(fā)。為了使自己和別人有不同,所以,就選擇了這個題目。看了大概2個月的理論知識,開始實(shí)踐的時候,發(fā)現(xiàn)根本無法入手,就開始了網(wǎng)上選書的征程,感謝當(dāng)當(dāng)網(wǎng)的數(shù)據(jù)挖掘技術(shù),將這本書進(jìn)入我的我眼里,報著忐忑的心里,買了這個書,到了,就開始了瘋狂的學(xué)習(xí)過程。從開始到最后,幾乎沒有什么廢話可言,認(rèn)真的講解,認(rèn)真的教授。一點(diǎn)一點(diǎn)的,我從懵懂到懂,經(jīng)歷了這個過程。謝謝作者。本來,這方面的書就不多。這個的確很好唯一不足的地方就是,最后的例子不能使用。原因是,網(wǎng)站改版了,與作者無關(guān)。嘿嘿~希望,作者還有好書出現(xiàn)。
  •   這本書很不錯,例子很詳細(xì),唯一的遺憾是對于compass講解有點(diǎn)少了,只能從lucene入手,再掌握compass這樣的選擇其實(shí)也是蠻不錯的。
  •   http://www.smallmao.cn/Java學(xué)習(xí)視頻下載:http://java.smallmao.cn/不錯不錯不錯不錯不錯不錯不錯不錯不錯不錯,lucene入門很好??!
  •   對于想自己開發(fā)垂直搜索引擎的朋友的話,那么這本書會是一本不錯的入門書,而且找不到第二本替代的書。至少我沒發(fā)現(xiàn)呵呵!
  •   開發(fā)自己的搜索引擎這本書很不錯,但關(guān)于這一類的書太少了
  •   從頭看到尾,所獲頗豐,已經(jīng)可以把Lucene用到實(shí)際工作中了。
  •   學(xué)習(xí)lucene的好書。
  •   這本書非常不錯,對學(xué)習(xí)搜索引擎的初學(xué)者來說幫助挺大的。當(dāng)當(dāng)?shù)乃拓浰俣纫埠芸欤?天左右就收到了,比較驚喜。
  •   對于沒接觸過搜索引擎的可以看看,入門級的,推薦
  •   還算可以啦~~書中雖然給出的代碼占了很大篇幅,對于有項(xiàng)目開發(fā)基本的人來說,卻是好事。因?yàn)橥ㄟ^閱讀代碼,再加上書中還算詳細(xì)的解說,很快就能掌握啦。
  •   最基本的全文檢索引擎
  •   1、認(rèn)為此書講的很垃圾,書中書中所有的問題,都是點(diǎn)到為止,沒有一點(diǎn)深入的地方在具體的項(xiàng)目中,基本用不上。2、書中有多次描述上的錯誤。而且還沒有源碼與之對應(yīng),我暈~~
  •   這本書還挺不錯的,做這講的比較有耐心
  •   這本書不錯大家可以買來看看就是價格有點(diǎn)貴!
  •   一直不太相信國人寫的書,但是這本真的不錯。一周就看完了,把東西都講清楚了,非常感謝!
  •   書挺好適合初學(xué)者
  •   比較適合我的需要
  •   很好當(dāng)當(dāng)網(wǎng)上的書又便宜又好
  •   好.不錯合我的需要
  •   不知道,還沒看
  •   兩個字,經(jīng)典!看就是了
  •   書籍還可以,只是也還好,而且有個比較實(shí)用案例講解了Lucene+Heritirx結(jié)合的構(gòu)建了一個搜索引擎。如果這個有興趣的朋友可以買來看看。。
  •   看完一遍,感覺還不錯,Lucene2.0講的比較細(xì)致,是學(xué)習(xí)Lucene2.0的一本好書!不過內(nèi)部大部分是關(guān)于Lucene2.0基礎(chǔ)接口使用的介紹,是入門的好書,如果能多講一些Lucene2.0的高級主題就好啦,比如如何創(chuàng)建高性能,分布式搜索引擎。
  •   但Lucene版本有點(diǎn)過老。但對學(xué)習(xí)搜索引擎的原理是很有好處的。
  •   詳細(xì)的介紹了lucene,但是對于heritrix而言,個人認(rèn)為介紹的還不夠詳細(xì),只是介紹了使用上的一些方法和一個簡單的擴(kuò)展??傮w上講,還是一本值得一讀的。
  •   對于初學(xué)者而言確實(shí)不錯,對于研究英文版的Lucene2.0api而言,此書替我理清了不少思路。問題是Lucene的很多輔助功能書中沒有介紹。還是需要讀者自己去研究api。開心之余不免感到有點(diǎn)惋惜??磥磉€得去研究LuceneinAction。
  •   這是一本入門的好書,有很多例子由淺入深,對于想提高的人幫助不大,但是對于想入門的朋友,確實(shí)不錯~!本來書就不厚,還有大段大段的代碼占據(jù)了相當(dāng)?shù)目臻g,真正有價值的內(nèi)容不多。原價太貴了,打完折還是覺得貴,薄薄一本書性價比不高。這是一本很不錯的搜索引擎開發(fā)入門書,書中簡要的介紹了搜索引擎的倆個開源工具,對于初學(xué)者有很大的幫助,
  •   這本書讀了一半左右了,感覺代碼偏多了一些。講的不夠深入,要是想了解深入的lucene的東西不太適合。個人感覺比較適合像我這種初學(xué)者:)
  •   這本書很不錯,自己的搜索引擎開發(fā)指南,適用于有一定開發(fā)經(jīng)驗(yàn)的人員。如果是初學(xué)者的話還是不要購買了。
  •   關(guān)于搜索引擎開發(fā)的書比較少,這本書對于初學(xué)者很值得看
  •   該書我覺得對搜索引擎入門來說還可以,我已經(jīng)看了索引和檢索那部分了,感覺真的不錯!或許是因?yàn)闀淖髡吒覀円粯佣己苣贻p吧,我也看了作者為書做的BLOG了,上面有很多內(nèi)容感覺還可以。
  •   初學(xué)都不錯,可以初步了解lucene的架構(gòu)
  •   這本書深入淺出的介紹了搜索引擎。簡單的介紹了搜索引擎的歷史,包括yahoogoogle的故事等。對于瀏覽器有一個大體的介紹,也有一個很好的例子。不過對于我個人來說工作上暫時用不上,所以沒有細(xì)讀,只是作為一種儲備存在書架上了。書到用時方恨少,呵呵。
  •   這本書是我對比了好幾本關(guān)于搜索引擎的書后選擇買的,自己感覺還不錯,反正對我想要了解的東西都有講到了,只是書的快遞慢的呀,從購買后將近等了半個月呢,希望當(dāng)當(dāng)能夠改進(jìn)呢~~
  •   一直以來,想找本搜索引擎方面的書籍看看,苦于書籍太少??戳诉@本書后,我發(fā)覺我找到我想要的了。
  •   我是初學(xué)者、對于初學(xué)者而言很有幫助,講的很細(xì);其中案例比較多,而這對于初學(xué)者而言是錦上添花,看了大概基本可以建立屬于自己的搜索引擎了。。。感興趣的朋友可以看看。
  •   是一本入門的好書,不過要想學(xué)高升一點(diǎn)的.建議不要買這本!感覺有點(diǎn)像照著API在寫書,只不過比API多了幾句中文的說明.
  •   盡管此書講的有些內(nèi)容不是太深入,但總體上還是可以的.書中包括了對少部分源代碼的分析,從而讓讀者對它有了更深入的了解.其中還提到相關(guān)的一些內(nèi)容,讓我們知道這方面的內(nèi)容應(yīng)該可以再去深究
  •   想做搜索的朋友可以參考一下,質(zhì)量和內(nèi)容都堪稱上成
  •   內(nèi)容沒有深入的講太多東西,只是簡單介紹了一下基礎(chǔ)使用的東西!
  •   還是值得學(xué)習(xí)一下的,搜索這個東西還是很復(fù)雜的。
  •   書有點(diǎn)貴,但是物有所值,要有一定java基礎(chǔ)才能看懂
  •   書還是挺不錯的不過光盤就不是很好用啦要是光盤能有個實(shí)例就更好了
  •   這書相對于入門者就有點(diǎn)無所適從,因?yàn)樯婕暗狡渌矫娴臇|西,所以建議初學(xué)者先看看關(guān)于Apache等環(huán)境軟件的搭建!!
  •   作為入門的參考書還是比較不錯。。。
  •   都快變成源代碼導(dǎo)讀了,這書的厚度完全可以刪減二分之一。
  •   有的內(nèi)容是有點(diǎn)老了。這次送貨很及時,希望繼續(xù)努力
  •   入門真的還不錯
  •   送書速度很快,只用了4天。還有光盤啊。。
  •   很詳細(xì),細(xì)致,期待更多這樣的好書
  •   是一本還算好的書,但還能做的更好。
  •   一本很不錯的書,值得參考!
  •   例子還可以,適合出學(xué)者
  •   速度和質(zhì)量還不錯。
  •   我覺得還不錯,但是我還沒仔細(xì)看呢
  •   貨真價實(shí),物美價廉!
  •   對于lucene的介紹還可以,compass部分講的就真的是相當(dāng)入門了,需要進(jìn)行項(xiàng)目開發(fā)的話還需要自己去學(xué)習(xí)compass文檔和api。但是現(xiàn)在市場上根本就沒有compasssearch相關(guān)的書,所以從這個角度來說還是不錯的
  •   如果沒有半點(diǎn)搜索引擎開發(fā)經(jīng)驗(yàn),這本書倒是蠻適合。
  •   lucene有些地方還不完善,這本書講的也不是很深
  •   看了這本書能對搜索引擎有一個初步的了解,是一本入門級的書
  •   可以作為初學(xué)者入門使用
  •   我買的時候是想做點(diǎn)東西出來??墒前l(fā)現(xiàn)里邊的東西比較散,要組織起來需要很大的基礎(chǔ)
  •   感覺一般,項(xiàng)目的實(shí)際應(yīng)用性太差,不知道你們感覺如何
  •   紙質(zhì)特軟特差,比報紙的紙還要次!在當(dāng)當(dāng)買了幾本書都是如此,實(shí)在是令人不爽!如果能報銷的話,建議到書店去買啦,書店的折扣也至少是90%...
  •   可惜編者水平有限,很多地方寫錯了...
  •   書還是挺不錯的服務(wù)不怎么樣太慢也沒有光盤
  •   買回來以后仔細(xì)的看了,沒有想象中的好,很多都說的不夠細(xì)
  •   要想深入,只能選擇其他的
  •   如題:不夠深入
  •   不是很好,很多都是解析源碼,沒有觀點(diǎn)
  •   拿到手有電后悔,入門看比較好,業(yè)界人士就不必啦,luceneinaction好過。
  •   大入門了,沒有什么特別好的內(nèi)容
  •   說實(shí)話,買了本書我很后悔
  •   只是講如何調(diào)用控件,沒實(shí)質(zhì)性的東西
  •   “配有一個完整的搜索引擎案例。這個案例有很強(qiáng)的實(shí)用價值,只需稍加修改,就能應(yīng)用于實(shí)際項(xiàng)目,市場價值在30000元以上!”。出版是沒有這個代碼。只是說“沒有拿到授權(quán),趕不上出版時間”就了事?這樣的縮水了的書,出了不丟人?賣“期書”,代碼光盤什么時候補(bǔ)給我們?
  •   先說說內(nèi)容,如果你會用百度或者是google并且你聽說過lucene你這本書你也可以寫得出來,絕大部分的內(nèi)容就是直接從源代碼里把代碼復(fù)制出來,再在網(wǎng)上搜點(diǎn)評論貼上去,請問這就是在你們創(chuàng)作的書嗎???字寫得很大500多頁的內(nèi)容字體小一個號也就成300頁了?。。。。?,再說說光盤只有30幾M的東西而且還不是什么有用的東西,兩個字不值?。。。?!希望不要有人再上當(dāng)了~!@#¥%……&*()——+
  •   就說了幾句大實(shí)話,當(dāng)當(dāng)網(wǎng)還把我的評論給刪除了,太不厚道了。難道就只準(zhǔn)說好話,不準(zhǔn)說實(shí)話????搞毛了,下次不在這里買書了。這本書確實(shí)是非常一般,不過是將API講了一遍。
  •   都是將代碼的,而且很費(fèi)。。。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號-7