出版時間:2008-11 出版社:北京郵電大學(xué)出版社有限公司 作者:袁津生,蔡岳 編著 頁數(shù):327 字?jǐn)?shù):529000
Tag標(biāo)簽:無
前言
網(wǎng)絡(luò)的發(fā)展徹底改變了人們的思維、習(xí)慣與生活。一方面,它使我們更容易獲取各種各樣的信息,而另一方面,要想在數(shù)十億網(wǎng)頁的網(wǎng)絡(luò)信息中精確地找到自己需要的信息簡直就如“大海撈針”一般。那么在巨大的網(wǎng)絡(luò)信息世界里,怎么樣才能找到我們需要的數(shù)據(jù)呢?這就要靠搜索引擎。面對浩如煙海的網(wǎng)絡(luò)資源,搜索引擎就好像是航船的指南針,引領(lǐng)著人們在網(wǎng)絡(luò)中沖浪。目前,搜索引擎已經(jīng)成為信息檢索最有效的工具。據(jù)統(tǒng)計,搜索引擎已經(jīng)成為僅次于電子郵件的第二大網(wǎng)絡(luò)應(yīng)用服務(wù),是用戶獲取信息的首要途徑,在美國有超過84%的網(wǎng)民經(jīng)常使用搜索引擎。
內(nèi)容概要
隨著搜索引擎技術(shù)的發(fā)展和不斷完善,越來越多的人開始對搜索引擎原理和技術(shù)進(jìn)行研究,越來越多的人喜歡上了搜索引擎?! ”緯鴱慕虒W(xué)的角度出發(fā),全面地闡述了搜索引擎的原理和實踐,包括搜索引擎的基本原理與技術(shù)、搜索引擎的數(shù)據(jù)結(jié)柳搜索引擎的爬蟲、多媒體信息檢索技術(shù)以及搜索引擎開發(fā)技術(shù)?! ”緯m合高等院校計算機(jī)科學(xué)與技術(shù)專業(yè)及相關(guān)專業(yè)的高年級學(xué)生和研究生閱讀參考,也適合相關(guān)領(lǐng)域的工程技術(shù)人員參閱。
書籍目錄
第1章 搜索引擎概述 1.1 搜索引擎的概念 1.2 搜索引擎的歷史 1.3 搜索引擎的分類 1.4 搜索引擎的關(guān)鍵技術(shù) 1.5 當(dāng)代主要搜索引擎介紹 1.5.1 谷歌搜索 1.5.2 雅虎搜索 1.5.3 百度搜索 1.5.4 北大天網(wǎng)搜索 1.6 搜索引擎的發(fā)展 1.7 小結(jié) 思考題第2章 搜索引擎的體系結(jié)構(gòu)和工作原理 2.1 搜索引擎的體系結(jié)構(gòu) 2.1.1 搜索器 2.1.2 索引器 2.1.3 檢索器 2.1.4 用戶接口 2.2 搜索引擎的工作原理 2.2.1 網(wǎng)頁搜集 2.2.2 網(wǎng)頁處理 2.2.3 查詢服務(wù) 2.3 元搜索引擎 2.3.1 元搜索引擎的基本構(gòu)成 2.3.2 元搜索引擎的分類 2.3.3 常用元搜索引擎介紹 2.3.4 元搜索引擎的特點(diǎn) 2.3.5 主要技術(shù)指標(biāo) 2.4 小結(jié) 思考題第3章 信息處理技術(shù) 3.1 檢索模型 3.1.1 經(jīng)典模型 3.1.2 代數(shù)模型 3.2 文本處理 3.2.1 詞法分析 3.2.2 分詞技術(shù) 3.2.3 無用詞匯刪除 3.2.4 詞干提取 3.2.5 索引詞選擇 3.2.6 詞典 3.3 文本壓縮 3.3.1 基本概念 3.3.2 統(tǒng)計方法 3.3.3 字典方法 3.3.4 倒排文檔壓縮 3.4 Web信息處理 3.4.1 Web信息的特點(diǎn) 3.4.2 Web信息的表現(xiàn)方式 3.4.3 Web信息系統(tǒng)結(jié)構(gòu) 3.5 小結(jié) 思考題第4章 信息檢索技術(shù) 4.1 順排檢索 4.1.1 表展開法 4.1.2 邏輯樹展開法 4.1.3 BF算法 4.1.4 KMP算法 4.1.5 BM算法 4.2 倒排檢索 4.2.1 倒排檢索 4.2.2 倒排文檔 4.2.3 逆波蘭表達(dá)式……第5章 信息檢索評價第6章 網(wǎng)絡(luò)搜索引擎技術(shù)第7章 多媒體檢索概述第8章 基于內(nèi)容的多媒體信息檢索技術(shù)第9章 搜索引擎開發(fā)技術(shù)參考文獻(xiàn)
章節(jié)摘錄
第1章 搜索引擎概述在浩瀚的網(wǎng)絡(luò)資源中,搜索引擎(Search Engine)是一種網(wǎng)上信息檢索工具,它能幫助用戶迅速而全面地找到所需要的信息。我們可以這樣對搜索引擎進(jìn)行定義:搜索引擎是一種能夠通過因特網(wǎng)接受用戶的查詢指令,并向用戶提供符合其查詢要求的信息資源網(wǎng)址的系統(tǒng)。多數(shù)網(wǎng)上用戶使用搜索引擎來獲得所需信息,據(jù)CNNIC的統(tǒng)計,用搜索引擎搜索僅次于電子郵件的應(yīng)用。目前網(wǎng)上比較有影響的中文搜索工具有:Google、百度(Baidu)、北大天網(wǎng)、愛問(iask)、雅虎(Yahoo)、搜狗(Sogou)等搜索引擎。英文的有:Yahoo、AltaVista、Excite、Infoseek、Lycos、Aol等。另外還有專用搜索引擎,例如,專門搜索歌曲和音樂的;專門搜索電子郵件地址、電話與地址及公眾信息的;專門搜索各種文件的FTP搜索引擎等。本章主要介紹搜索引擎的概念、搜索引擎的發(fā)展史、搜索引擎的分類以及一些著名的搜索引擎。1.1 搜索引擎的概念搜索引擎是指根據(jù)一定的策略、運(yùn)用特定的計算機(jī)程序搜集互聯(lián)網(wǎng)上的信息,在對信息進(jìn)行組織和處理后,為用戶提供檢索服務(wù)的系統(tǒng)。搜索引擎并不真正搜索互聯(lián)網(wǎng),它搜索的實際上是預(yù)先整理好的網(wǎng)頁索引數(shù)據(jù)庫。真正意義上的搜索引擎,通常指的是收集了互聯(lián)網(wǎng)上幾千萬到幾十億個網(wǎng)頁并對網(wǎng)頁中的每一個詞(即關(guān)鍵詞)進(jìn)行索引,建立索引數(shù)據(jù)庫的全文搜索引擎。當(dāng)用戶查找某個關(guān)鍵詞的時候,所有在頁面內(nèi)容中包含了該關(guān)鍵詞的網(wǎng)頁都將作為搜索結(jié)果被搜出來。在經(jīng)過復(fù)雜的算法進(jìn)行排序后,這些結(jié)果將按照與搜索關(guān)鍵詞的相關(guān)度高低,依次排列。
編輯推薦
《搜索引擎原理與實踐》由北京郵電大學(xué)出版社出版。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載