Web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用

出版時(shí)間:2011-10  出版社:李志義 清華大學(xué)出版社 (2011-10出版)  作者:李志義 編  頁數(shù):313  

內(nèi)容概要

  《21世紀(jì)高等學(xué)校規(guī)劃教材·信息管理與信息系統(tǒng):Web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用》從互聯(lián)網(wǎng)信息組織與檢索的角度,較新穎地介紹了web信息檢索系統(tǒng)的原理、主要模塊、相關(guān)理論、技術(shù)以及最新發(fā)展方向。同時(shí)結(jié)合實(shí)例詳細(xì)闡述了web查詢系統(tǒng)設(shè)計(jì)的方法、步驟及編程實(shí)現(xiàn)的全過程?!?1世紀(jì)高等學(xué)校規(guī)劃教材·信息管理與信息系統(tǒng):Web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用》的最大特色是在傳統(tǒng)《信息檢索》有關(guān)教材的基礎(chǔ)上,增加了基于.net平臺(tái)而設(shè)計(jì)的web信息檢索的完整案例。全書分三篇共九章內(nèi)容,理論篇介紹了web信息組織的基礎(chǔ)理論、基于內(nèi)容的多媒體信息檢索、搜索引擎的原理與結(jié)構(gòu)等;設(shè)計(jì)篇介紹了基于asp.net的開發(fā)環(huán)境配置及vb.net編程、基礎(chǔ)、web查詢系統(tǒng)和搜索引擎的設(shè)計(jì),案例設(shè)計(jì)力求由淺人深、分步推進(jìn),每個(gè)案例均附有完整的源代碼;應(yīng)用篇引入檢索案例介紹了常用搜索引擎與web數(shù)據(jù)庫系統(tǒng)的檢索與利用,使檢索理論與查詢實(shí)踐緊密結(jié)合起來?!  ?1世紀(jì)高等學(xué)校規(guī)劃教材·信息管理與信息系統(tǒng):Web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用》每章的正文內(nèi)容后附有“本章小結(jié)”和“思考與練習(xí)”,以便加深讀者對(duì)本章知識(shí)點(diǎn)的理解,以及培養(yǎng)讀者應(yīng)用本章學(xué)到的知識(shí)來解決實(shí)際問題的能力?!  ?1世紀(jì)高等學(xué)校規(guī)劃教材·信息管理與信息系統(tǒng):Web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用》層次分明,深入淺出;既有深入的理論分析,也有大量的設(shè)計(jì)和檢索案例,具有學(xué)習(xí)和實(shí)用雙重意義,可作為高等院校信息管理與信息系統(tǒng)、電子商務(wù)等專業(yè)的本科生或研究生的教學(xué)參考書和教材,也可供從事網(wǎng)站開發(fā)、web挖掘、數(shù)字圖書館等應(yīng)用程序開發(fā)工作的科研人員參閱。

書籍目錄

上篇理論篇第1章 web信息檢索概論1.1 web信息檢索及相關(guān)術(shù)語的解釋1.2 web信息檢索系統(tǒng)的邏輯結(jié)構(gòu)1.3 信息檢索的流程與步驟1.4 web信息檢索研究的歷史、現(xiàn)狀及進(jìn)展1.5 本章 小結(jié)1.6 思考與練習(xí)第2章 web信息資源的文檔類型及基于內(nèi)容的多媒體信息檢索2.1 html文檔2.2 xml語言2.3 元數(shù)據(jù)2.4 多媒體信息與文件格式2.5 基于內(nèi)容的多媒體信息檢索2.6 本章 小結(jié)2.7 思考與練習(xí)第3章 與web查詢技術(shù)相關(guān)的數(shù)據(jù)結(jié)構(gòu)理論——索引、查找的算法、二叉樹和圖的遍歷3.1 索引和倒排文件3.2 樹、二叉樹和圖的遍歷3.3 查找的幾種算法3.4 本章 小結(jié)3.5 思考與練習(xí)第4章 web搜索引擎的原理與結(jié)構(gòu)4.1 搜索引擎概述4.2 搜索引擎的體系結(jié)構(gòu)4.3 搜索引擎對(duì)信息的抓取與采集4.4 搜索引擎對(duì)抓取信息的預(yù)處理4.5 搜索引擎的查詢服務(wù)4.6 本章 小結(jié)4.7 思考與練習(xí)中篇設(shè)計(jì)篇第5章 web查詢系統(tǒng)設(shè)計(jì)基礎(chǔ)(一)——開發(fā)環(huán)境配置及.net程序的創(chuàng)建、調(diào)試5.1 web查詢程序的開發(fā)平臺(tái)——.net概述5.2 web查詢程序的開發(fā)環(huán)境——.net的配置5.3 利用vs.net創(chuàng)建asp.net程序5.4 asp.net的程序結(jié)構(gòu)及編寫的幾種方式5.5 本章 小結(jié)5.6 思考與練習(xí)第6章 web查詢系統(tǒng)設(shè)計(jì)基礎(chǔ)(二)——vb.net程序設(shè)計(jì)基礎(chǔ)6.1 vb.net編程的基本規(guī)則6.2 vb.net的數(shù)據(jù)類型及常量、變量6.3 vb.net的運(yùn)算符6.4 vb.net的條件與循環(huán)語句6.5 vb.net的過程和函數(shù)6.6 面向?qū)ο缶幊袒A(chǔ)6.7 本章 小結(jié)6.8 思考與練習(xí)第7章 web查詢系統(tǒng)的設(shè)計(jì)7.1 access、sqlserver2005等數(shù)據(jù)庫和表的創(chuàng)建與維護(hù)7.2 ado.net訪問數(shù)據(jù)庫概述7.3 ado.net操作數(shù)據(jù)庫的方式7.4 基于.net的查詢程序設(shè)計(jì)實(shí)例7.5 對(duì)查詢結(jié)果的處理7.6 綜合設(shè)計(jì)實(shí)例7.7 基于.net的搜索引擎設(shè)計(jì)案例7.8 本章 小結(jié)7.9 思考與練習(xí)下篇篇應(yīng)用篇第8章 搜索引擎的查找與利用8.1 水平搜索引擎的查找與利用——百度搜索8.2 水平搜索引擎的查找與利用——google8.3 水平搜索引擎的查找與利用——雅虎搜索8.4 其他水平搜索引擎的查找與利用8.5 垂直搜索引擎8.6 元搜索引擎8.7 本章 小結(jié)8.8 思考與練習(xí)第9章 web數(shù)據(jù)庫系統(tǒng)的檢索與應(yīng)用9.1 中文論文數(shù)據(jù)庫的檢索與利用——中國知識(shí)資源總庫9.2 中文論文數(shù)據(jù)庫的檢索與利用——其他論文數(shù)據(jù)庫概要9.3 外文論文數(shù)據(jù)庫的檢索與利用——proquest數(shù)據(jù)庫的檢索與利用9.4 外文論文數(shù)據(jù)庫的檢索與利用——常用外文論文數(shù)據(jù)庫檢索概要9.5 圖書、報(bào)紙、會(huì)議文獻(xiàn)、專利信息等有關(guān)資料和數(shù)據(jù)的檢索9.6 本章 小結(jié)9.7 思考與練習(xí)參考文獻(xiàn)

章節(jié)摘錄

版權(quán)頁:插圖:進(jìn)一步而言,分布式搜索引擎的主要特點(diǎn)還有:(1)各檢索服務(wù)器之間協(xié)同工作,每個(gè)服務(wù)器只搜索自身區(qū)域內(nèi)的信息資源,彼此之間只傳遞搜索結(jié)果信息,加快了檢索速度,減輕網(wǎng)絡(luò)及主搜索引擎服務(wù)器的負(fù)擔(dān)。(2)與網(wǎng)絡(luò)資源本身的分布式特性相適應(yīng),增加搜索服務(wù)器方便,具有可擴(kuò)展性。(3)索引信息劃分到各個(gè)數(shù)據(jù)庫中,使得各索引數(shù)據(jù)庫規(guī)模小,易于管理,縮短查詢響應(yīng)時(shí)間。此外,分布式搜索引擎的分布性主要體現(xiàn)在三個(gè)方面:Web信息搜集的分布性,主要是指多個(gè)采集器的分布協(xié)同工作;索引器的分布性,即對(duì)搜集到的Web信息以分布式的方式進(jìn)行索引文件的構(gòu)建、存儲(chǔ)、組織和管理;檢索的分布性,是指搜索引擎能借助相關(guān)的并發(fā)控制方法和技術(shù)快速響應(yīng)分布在不同區(qū)域內(nèi)的大量網(wǎng)絡(luò)用戶的同時(shí)訪問。搜索引擎對(duì)信息的抓取與采集在宏觀上討論搜索引擎體系結(jié)構(gòu)的基礎(chǔ)上,本節(jié)開始重點(diǎn)介紹搜索引擎對(duì)Web資源的采集算法和與此相關(guān)的基本知識(shí)。通常,搜索引擎可以采用批量搜集和增量搜集兩種策略獲取Web信息。所謂批量搜集是指搜索引擎每隔一段時(shí)間對(duì)Web信息進(jìn)行一次全面的搜索,并用所搜集到的信息覆蓋前一次搜集的信息。而增量搜集基于網(wǎng)絡(luò)中的大部分信息往往不經(jīng)常更新的考慮,在每次搜索信息時(shí),只需要搜集那些發(fā)生變化的或者新出現(xiàn)的站點(diǎn)信息即可,因此可以明顯提高系統(tǒng)的搜索效率和降低資源消耗。相比而言,增量搜集具有更大的適應(yīng)能力和信息更新能力。目前,Web信息采集的方式主要有人工和機(jī)器人、網(wǎng)絡(luò)蜘蛛等自動(dòng)抓取兩種方式。人工方式準(zhǔn)確率高但技術(shù)含量低、工作量大,本節(jié)不予探討,而注重討論的是自動(dòng)采集的方式。由于自動(dòng)采集器軟件有多種名稱和稱呼,比如機(jī)器人(Robert)程序、Spider(網(wǎng)絡(luò)蜘蛛)程序或Crawler(網(wǎng)絡(luò)爬蟲)程序,本節(jié)統(tǒng)稱為采集器或網(wǎng)絡(luò)爬蟲。 4. 3.1  采集器的工作流程  采集器的實(shí)質(zhì)是一種用于從互聯(lián)網(wǎng)上抓取Web信息的軟件程序,它以Web頁之間的相互鏈接為路徑,依照一定的遍歷策略試圖爬行網(wǎng)絡(luò)空間的每個(gè)角落,采集所需信息,并將其轉(zhuǎn)存到本地存儲(chǔ)器上,以便索引器進(jìn)行標(biāo)引處理和創(chuàng)建索引庫。采集器具有如下的特點(diǎn):程序具備超強(qiáng)的執(zhí)行力;在分析Web頁和利用鏈接進(jìn)行爬行等方面具有自動(dòng)性和智能性;能自動(dòng)將Web信息實(shí)施簡單的存儲(chǔ)操作等。此外,采集器還具有可伸縮性、分布式、可定制性等特點(diǎn)。

編輯推薦

《web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用》教學(xué)目標(biāo)明確,注重理論與實(shí)踐的結(jié)合,教學(xué)方法靈活,培養(yǎng)學(xué)生自主學(xué)習(xí)的能力,教學(xué)內(nèi)容先進(jìn),滿足專業(yè)人才的社會(huì)需求,教學(xué)模式完善,提供配套的教學(xué)資源解決方案。

圖書封面

評(píng)論、評(píng)分、閱讀與下載


    Web信息檢索系統(tǒng)的設(shè)計(jì)及應(yīng)用 PDF格式下載


用戶評(píng)論 (總計(jì)0條)

 
 

 

250萬本中文圖書簡介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7