出版時間:2008-10 出版社:中國鐵道出版社 作者:于天恩 頁數(shù):629 字數(shù):939000
Tag標簽:無
內容概要
這本書基于Lucene的當前最新版本(2.1)精解了Lucene搜索引擎的相關知識,從基礎知識到應用開發(fā),精練簡潔,恰到好處 本書共包括16章,分為6部分。第1部分Lucene基礎。介紹了Lucene的基礎知識,包括Lucene的歷史和發(fā)展情況、使用Lucene創(chuàng)建索引和執(zhí)行搜索的基本方法以及中文分詞的應用,最后做了兩個應用項目。第2部分:數(shù)據(jù)解析。介紹解析不同格式數(shù)據(jù)(如Word、PDF等)的方法,包括常用的數(shù)據(jù)解析組件、Lucene自身的數(shù)據(jù)解析機制和Lius類庫。第3部分:索引的高級知識。介紹了 Lucene建立索引的過程,索引的查看和刪除,索引的同步,索引的合并和優(yōu)化等內容。第4部分:搜索的高級知識。介紹使用不同的Query對象構建搜索請求,使用QueryParser解析用戶的搜索請求,搜索結果的過濾和排序等內容。第5部分:Lucene應用實例。應用本節(jié)介紹的所有知識構建一個桌面搜索引擎和一個Web搜索引擎。這部分作為對前面所有內容的總結。第6部分:Nutch搜索引擎框架。介紹了基于Lucene的完整搜索引擎Nutch。 本書適合從Lucene初學者到高級開發(fā)人員之間的一切Lucene愛好者。
作者簡介
于天恩,現(xiàn)任某大型軟件開發(fā)公司技術總監(jiān),高級軟件工程師,精通主流軟件編程技術(100多種),具有大量軟件項目開發(fā)經驗。主持開發(fā)過大中型企業(yè)網站,短信服務系統(tǒng),辦公自動化系統(tǒng)(OA),CRM系統(tǒng)等。
已經出版的作品:《PHP精解案例教程》、《做自己的搜索引擎——搜
書籍目錄
第1部分 Lucene基礎(第1~5章) 第1章 Lucene簡介 1.1 認識Lucene 1.1.1 Lucene是什么 1.1.2 Lucene的作者 1.1.3 Lucene的歷史 1.l.4 Lucene的現(xiàn)在 1.2 Lucene體驗實例 1.2.1 下載Lucene 1.2.2 編寫輔助糞 1.2.3 最簡單的搜索引擎 1.2.4 索引器的開發(fā) 1.2.5 索引器的運行 1.2.6 搜索器的開發(fā) 1.2.7 搜索器的運行 小結 第2章 創(chuàng)建索引 2.1 創(chuàng)建索引的基本方式 2.1.1 理解創(chuàng)建索引的過程 2.1.2 創(chuàng)建Field 2.1.3 創(chuàng)建Document 2.1.4 創(chuàng)建Index Writer 2.2 創(chuàng)建索引實例 2.2.1 簡單索引 2.2.2 復雜一點的索引 2.2.3 為文件創(chuàng)建索引 2.2.4 為某一目錄下的所有文件創(chuàng)建索引 小結 第3章 執(zhí)行搜索 3.1 執(zhí)行搜索的基本方式 3.1.1 創(chuàng)建搜索器對象:IndexSearcher 3.1.2 封裝搜索條件:使用Term和Query對象 3.1.3 執(zhí)行搜索 3.1.4 提取搜索結果:了解Hits對象 3.1.5 提取搜索結果:了解Document對象 3.1.6 提取搜索結果了解Field對象 3.2 執(zhí)行搜索實例 3.2.1 簡單搜索 3.2.2 分詞問題 小結 第4章 中文分詞 4.1 說說分詞 4.1.1 分詞的方法 4.1.2 做分詞器 4.2 Lucene的分詞器 4.2.1 二分法分詞器 4.2.2 Lucene自帶的中文分詞器 4.2.3 NGram分詞器的原理和用法 4.2.4 JE分詞器的原理和用法 4.2.5 IK分詞器的原理和用法 4.2.6 其他分詞器 小結 ……第2部分 數(shù)據(jù)解析(第6~8章)第3部分 索引的高級知識(第9~10章)第4部分 搜索的高級知識(第11~12章)第5部分 lucene應用實例(第13~14章)第6部分 Nutch搜索引擎框架(第15~16章)
章節(jié)摘錄
第1部分 Lucene基礎(第1~5章) 作為本書的第一部分,筆者在這里使用五章的篇幅介紹了Lucene的基礎知識。包括Lucene的歷史和發(fā)展情況、使用Lucene創(chuàng)建索引和執(zhí)行搜索的基本方法以及中文分詞的應用,最后做了兩個應用項目,來說明使用Lucene建立搜索引擎的詳細過程?! ∵@部分內容是很淺的,只是基礎。學過了這部分之后,讀者就可以做一些實際的應用項目了。比如:給自己的網站添加全文搜索引擎。
編輯推薦
《Lucene搜索引擎開發(fā)權威經典》基于Lucene的當前最新版本(2.1)精解了Lucene搜索引擎的相關知識,從基礎知識到應用開發(fā),精煉簡潔,恰到好處?! 禠ucene搜索引擎開發(fā)權威經典》包含了必要的理論,但以實踐為主。所講的理論都不是紙上談兵,都是可以立即付諸實踐進行工程應用,代碼可以直接拿來用。 書,不見得要寫得深透。書的好壞要由書面向的讀者群來評價?!禠ucene搜索引擎開發(fā)權威經典》適合從Lucene初學者到高級開發(fā)人員之間的一切Lucene愛好者?! 热菥殞嵱?,《Lucene搜索引擎開發(fā)權威經典》中所列代碼可以搭建一座中型搜索平臺,完整實例再現(xiàn),讓讀者緊跟作者構建思路,Lucene搜索引擎技術完美演繹。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載