Web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用

出版時(shí)間：2011-10 出版社：李志義清華大學(xué)出版社 (2011-10出版) 作者：李志義編頁數(shù)：313

內(nèi)容概要

　　《21世紀(jì)高等學(xué)校規(guī)劃教材·信息管理與信息系統(tǒng)：Web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用》從互聯(lián)網(wǎng)信息組織與檢索的角度，較新穎地介紹了web信息檢索系統(tǒng)的原理、主要模塊、相關(guān)理論、技術(shù)以及最新發(fā)展方向。同時(shí)結(jié)合實(shí)例詳細(xì)闡述了web查詢系統(tǒng)設(shè)計(jì)的方法、步驟及編程實(shí)現(xiàn)的全過程。《21世紀(jì)高等學(xué)校規(guī)劃教材·信息管理與信息系統(tǒng)：Web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用》的最大特色是在傳統(tǒng)《信息檢索》有關(guān)教材的基礎(chǔ)上，增加了基于．net平臺(tái)而設(shè)計(jì)的web信息檢索的完整案例。全書分三篇共九章內(nèi)容，理論篇介紹了web信息組織的基礎(chǔ)理論、基于內(nèi)容的多媒體信息檢索、搜索引擎的原理與結(jié)構(gòu)等；設(shè)計(jì)篇介紹了基于asp．net的開發(fā)環(huán)境配置及vb．net編程、基礎(chǔ)、web查詢系統(tǒng)和搜索引擎的設(shè)計(jì)，案例設(shè)計(jì)力求由淺人深、分步推進(jìn)，每個(gè)案例均附有完整的源代碼；應(yīng)用篇引入檢索案例介紹了常用搜索引擎與web數(shù)據(jù)庫系統(tǒng)的檢索與利用，使檢索理論與查詢實(shí)踐緊密結(jié)合起來。　　《21世紀(jì)高等學(xué)校規(guī)劃教材·信息管理與信息系統(tǒng)：Web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用》每章的正文內(nèi)容后附有“本章小結(jié)”和“思考與練習(xí)”，以便加深讀者對(duì)本章知識(shí)點(diǎn)的理解，以及培養(yǎng)讀者應(yīng)用本章學(xué)到的知識(shí)來解決實(shí)際問題的能力。　　《21世紀(jì)高等學(xué)校規(guī)劃教材·信息管理與信息系統(tǒng)：Web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用》層次分明，深入淺出；既有深入的理論分析，也有大量的設(shè)計(jì)和檢索案例，具有學(xué)習(xí)和實(shí)用雙重意義，可作為高等院校信息管理與信息系統(tǒng)、電子商務(wù)等專業(yè)的本科生或研究生的教學(xué)參考書和教材，也可供從事網(wǎng)站開發(fā)、web挖掘、數(shù)字圖書館等應(yīng)用程序開發(fā)工作的科研人員參閱。

書籍目錄

上篇理論篇第1章 web信息檢索概論1.1 web信息檢索及相關(guān)術(shù)語的解釋1.2 web信息檢索系統(tǒng)的邏輯結(jié)構(gòu)1.3 信息檢索的流程與步驟1.4 web信息檢索研究的歷史、現(xiàn)狀及進(jìn)展1.5 本章 小結(jié)1.6 思考與練習(xí)第2章 web信息資源的文檔類型及基于內(nèi)容的多媒體信息檢索2.1 html文檔2.2 xml語言2.3 元數(shù)據(jù)2.4 多媒體信息與文件格式2.5 基于內(nèi)容的多媒體信息檢索2.6 本章 小結(jié)2.7 思考與練習(xí)第3章 與web查詢技術(shù)相關(guān)的數(shù)據(jù)結(jié)構(gòu)理論——索引、查找的算法、二叉樹和圖的遍歷3.1 索引和倒排文件3.2 樹、二叉樹和圖的遍歷3.3 查找的幾種算法3.4 本章 小結(jié)3.5 思考與練習(xí)第4章 web搜索引擎的原理與結(jié)構(gòu)4.1 搜索引擎概述4.2 搜索引擎的體系結(jié)構(gòu)4.3 搜索引擎對(duì)信息的抓取與采集4.4 搜索引擎對(duì)抓取信息的預(yù)處理4.5 搜索引擎的查詢服務(wù)4.6 本章 小結(jié)4.7 思考與練習(xí)中篇設(shè)計(jì)篇第5章 web查詢系統(tǒng)設(shè)計(jì)基礎(chǔ)(一)——開發(fā)環(huán)境配置及.net程序的創(chuàng)建、調(diào)試5.1 web查詢程序的開發(fā)平臺(tái)——.net概述5.2 web查詢程序的開發(fā)環(huán)境——.net的配置5.3 利用vs.net創(chuàng)建asp.net程序5.4 asp.net的程序結(jié)構(gòu)及編寫的幾種方式5.5 本章 小結(jié)5.6 思考與練習(xí)第6章 web查詢系統(tǒng)設(shè)計(jì)基礎(chǔ)(二)——vb.net程序設(shè)計(jì)基礎(chǔ)6.1 vb.net編程的基本規(guī)則6.2 vb.net的數(shù)據(jù)類型及常量、變量6.3 vb.net的運(yùn)算符6.4 vb.net的條件與循環(huán)語句6.5 vb.net的過程和函數(shù)6.6 面向?qū)ο缶幊袒A(chǔ)6.7 本章 小結(jié)6.8 思考與練習(xí)第7章 web查詢系統(tǒng)的設(shè)計(jì)7.1 access、sqlserver2005等數(shù)據(jù)庫和表的創(chuàng)建與維護(hù)7.2 ado.net訪問數(shù)據(jù)庫概述7.3 ado.net操作數(shù)據(jù)庫的方式7.4 基于.net的查詢程序設(shè)計(jì)實(shí)例7.5 對(duì)查詢結(jié)果的處理7.6 綜合設(shè)計(jì)實(shí)例7.7 基于.net的搜索引擎設(shè)計(jì)案例7.8 本章 小結(jié)7.9 思考與練習(xí)下篇篇應(yīng)用篇第8章 搜索引擎的查找與利用8.1 水平搜索引擎的查找與利用——百度搜索8.2 水平搜索引擎的查找與利用——google8.3 水平搜索引擎的查找與利用——雅虎搜索8.4 其他水平搜索引擎的查找與利用8.5 垂直搜索引擎8.6 元搜索引擎8.7 本章 小結(jié)8.8 思考與練習(xí)第9章 web數(shù)據(jù)庫系統(tǒng)的檢索與應(yīng)用9.1 中文論文數(shù)據(jù)庫的檢索與利用——中國知識(shí)資源總庫9.2 中文論文數(shù)據(jù)庫的檢索與利用——其他論文數(shù)據(jù)庫概要9.3 外文論文數(shù)據(jù)庫的檢索與利用——proquest數(shù)據(jù)庫的檢索與利用9.4 外文論文數(shù)據(jù)庫的檢索與利用——常用外文論文數(shù)據(jù)庫檢索概要9.5 圖書、報(bào)紙、會(huì)議文獻(xiàn)、專利信息等有關(guān)資料和數(shù)據(jù)的檢索9.6 本章 小結(jié)9.7 思考與練習(xí)參考文獻(xiàn)

章節(jié)摘錄

版權(quán)頁：插圖：進(jìn)一步而言，分布式搜索引擎的主要特點(diǎn)還有：（1）各檢索服務(wù)器之間協(xié)同工作，每個(gè)服務(wù)器只搜索自身區(qū)域內(nèi)的信息資源，彼此之間只傳遞搜索結(jié)果信息，加快了檢索速度，減輕網(wǎng)絡(luò)及主搜索引擎服務(wù)器的負(fù)擔(dān)。（2）與網(wǎng)絡(luò)資源本身的分布式特性相適應(yīng)，增加搜索服務(wù)器方便，具有可擴(kuò)展性。（3）索引信息劃分到各個(gè)數(shù)據(jù)庫中，使得各索引數(shù)據(jù)庫規(guī)模小，易于管理，縮短查詢響應(yīng)時(shí)間。此外，分布式搜索引擎的分布性主要體現(xiàn)在三個(gè)方面：Web信息搜集的分布性，主要是指多個(gè)采集器的分布協(xié)同工作；索引器的分布性，即對(duì)搜集到的Web信息以分布式的方式進(jìn)行索引文件的構(gòu)建、存儲(chǔ)、組織和管理；檢索的分布性，是指搜索引擎能借助相關(guān)的并發(fā)控制方法和技術(shù)快速響應(yīng)分布在不同區(qū)域內(nèi)的大量網(wǎng)絡(luò)用戶的同時(shí)訪問。搜索引擎對(duì)信息的抓取與采集在宏觀上討論搜索引擎體系結(jié)構(gòu)的基礎(chǔ)上，本節(jié)開始重點(diǎn)介紹搜索引擎對(duì)Web資源的采集算法和與此相關(guān)的基本知識(shí)。通常，搜索引擎可以采用批量搜集和增量搜集兩種策略獲取Web信息。所謂批量搜集是指搜索引擎每隔一段時(shí)間對(duì)Web信息進(jìn)行一次全面的搜索，并用所搜集到的信息覆蓋前一次搜集的信息。而增量搜集基于網(wǎng)絡(luò)中的大部分信息往往不經(jīng)常更新的考慮，在每次搜索信息時(shí)，只需要搜集那些發(fā)生變化的或者新出現(xiàn)的站點(diǎn)信息即可，因此可以明顯提高系統(tǒng)的搜索效率和降低資源消耗。相比而言，增量搜集具有更大的適應(yīng)能力和信息更新能力。目前，Web信息采集的方式主要有人工和機(jī)器人、網(wǎng)絡(luò)蜘蛛等自動(dòng)抓取兩種方式。人工方式準(zhǔn)確率高但技術(shù)含量低、工作量大，本節(jié)不予探討，而注重討論的是自動(dòng)采集的方式。由于自動(dòng)采集器軟件有多種名稱和稱呼，比如機(jī)器人（Robert）程序、Spider（網(wǎng)絡(luò)蜘蛛）程序或Crawler（網(wǎng)絡(luò)爬蟲）程序，本節(jié)統(tǒng)稱為采集器或網(wǎng)絡(luò)爬蟲。 4. 3.1  采集器的工作流程  采集器的實(shí)質(zhì)是一種用于從互聯(lián)網(wǎng)上抓取Web信息的軟件程序，它以Web頁之間的相互鏈接為路徑，依照一定的遍歷策略試圖爬行網(wǎng)絡(luò)空間的每個(gè)角落，采集所需信息，并將其轉(zhuǎn)存到本地存儲(chǔ)器上，以便索引器進(jìn)行標(biāo)引處理和創(chuàng)建索引庫。采集器具有如下的特點(diǎn)：程序具備超強(qiáng)的執(zhí)行力；在分析Web頁和利用鏈接進(jìn)行爬行等方面具有自動(dòng)性和智能性；能自動(dòng)將Web信息實(shí)施簡(jiǎn)單的存儲(chǔ)操作等。此外，采集器還具有可伸縮性、分布式、可定制性等特點(diǎn)。

編輯推薦

《web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用》教學(xué)目標(biāo)明確，注重理論與實(shí)踐的結(jié)合，教學(xué)方法靈活，培養(yǎng)學(xué)生自主學(xué)習(xí)的能力，教學(xué)內(nèi)容先進(jìn)，滿足專業(yè)人才的社會(huì)需求，教學(xué)模式完善，提供配套的教學(xué)資源解決方案。

圖書封面

評(píng)論、評(píng)分、閱讀與下載

還沒讀過(87)
勉強(qiáng)可看(633)
一般般(108)
內(nèi)容豐富(4479)
強(qiáng)力推薦(367)

Web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用 PDF格式下載

用戶評(píng)論 (總計(jì)0條)

Web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用

用戶評(píng)論 (總計(jì)0條)

推薦圖書

相關(guān)圖書