出版時(shí)間:2008-11 出版社:北京郵電大學(xué)出版社有限公司 作者:袁津生,蔡岳 編著 頁(yè)數(shù):327 字?jǐn)?shù):529000
Tag標(biāo)簽:無(wú)
前言
網(wǎng)絡(luò)的發(fā)展徹底改變了人們的思維、習(xí)慣與生活。一方面,它使我們更容易獲取各種各樣的信息,而另一方面,要想在數(shù)十億網(wǎng)頁(yè)的網(wǎng)絡(luò)信息中精確地找到自己需要的信息簡(jiǎn)直就如“大海撈針”一般。那么在巨大的網(wǎng)絡(luò)信息世界里,怎么樣才能找到我們需要的數(shù)據(jù)呢?這就要靠搜索引擎。面對(duì)浩如煙海的網(wǎng)絡(luò)資源,搜索引擎就好像是航船的指南針,引領(lǐng)著人們?cè)诰W(wǎng)絡(luò)中沖浪。目前,搜索引擎已經(jīng)成為信息檢索最有效的工具。據(jù)統(tǒng)計(jì),搜索引擎已經(jīng)成為僅次于電子郵件的第二大網(wǎng)絡(luò)應(yīng)用服務(wù),是用戶獲取信息的首要途徑,在美國(guó)有超過(guò)84%的網(wǎng)民經(jīng)常使用搜索引擎。
內(nèi)容概要
隨著搜索引擎技術(shù)的發(fā)展和不斷完善,越來(lái)越多的人開(kāi)始對(duì)搜索引擎原理和技術(shù)進(jìn)行研究,越來(lái)越多的人喜歡上了搜索引擎?! ”緯?shū)從教學(xué)的角度出發(fā),全面地闡述了搜索引擎的原理和實(shí)踐,包括搜索引擎的基本原理與技術(shù)、搜索引擎的數(shù)據(jù)結(jié)柳搜索引擎的爬蟲(chóng)、多媒體信息檢索技術(shù)以及搜索引擎開(kāi)發(fā)技術(shù)?! ”緯?shū)適合高等院校計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)及相關(guān)專業(yè)的高年級(jí)學(xué)生和研究生閱讀參考,也適合相關(guān)領(lǐng)域的工程技術(shù)人員參閱。
書(shū)籍目錄
第1章 搜索引擎概述 1.1 搜索引擎的概念 1.2 搜索引擎的歷史 1.3 搜索引擎的分類 1.4 搜索引擎的關(guān)鍵技術(shù) 1.5 當(dāng)代主要搜索引擎介紹 1.5.1 谷歌搜索 1.5.2 雅虎搜索 1.5.3 百度搜索 1.5.4 北大天網(wǎng)搜索 1.6 搜索引擎的發(fā)展 1.7 小結(jié) 思考題第2章 搜索引擎的體系結(jié)構(gòu)和工作原理 2.1 搜索引擎的體系結(jié)構(gòu) 2.1.1 搜索器 2.1.2 索引器 2.1.3 檢索器 2.1.4 用戶接口 2.2 搜索引擎的工作原理 2.2.1 網(wǎng)頁(yè)搜集 2.2.2 網(wǎng)頁(yè)處理 2.2.3 查詢服務(wù) 2.3 元搜索引擎 2.3.1 元搜索引擎的基本構(gòu)成 2.3.2 元搜索引擎的分類 2.3.3 常用元搜索引擎介紹 2.3.4 元搜索引擎的特點(diǎn) 2.3.5 主要技術(shù)指標(biāo) 2.4 小結(jié) 思考題第3章 信息處理技術(shù) 3.1 檢索模型 3.1.1 經(jīng)典模型 3.1.2 代數(shù)模型 3.2 文本處理 3.2.1 詞法分析 3.2.2 分詞技術(shù) 3.2.3 無(wú)用詞匯刪除 3.2.4 詞干提取 3.2.5 索引詞選擇 3.2.6 詞典 3.3 文本壓縮 3.3.1 基本概念 3.3.2 統(tǒng)計(jì)方法 3.3.3 字典方法 3.3.4 倒排文檔壓縮 3.4 Web信息處理 3.4.1 Web信息的特點(diǎn) 3.4.2 Web信息的表現(xiàn)方式 3.4.3 Web信息系統(tǒng)結(jié)構(gòu) 3.5 小結(jié) 思考題第4章 信息檢索技術(shù) 4.1 順排檢索 4.1.1 表展開(kāi)法 4.1.2 邏輯樹(shù)展開(kāi)法 4.1.3 BF算法 4.1.4 KMP算法 4.1.5 BM算法 4.2 倒排檢索 4.2.1 倒排檢索 4.2.2 倒排文檔 4.2.3 逆波蘭表達(dá)式……第5章 信息檢索評(píng)價(jià)第6章 網(wǎng)絡(luò)搜索引擎技術(shù)第7章 多媒體檢索概述第8章 基于內(nèi)容的多媒體信息檢索技術(shù)第9章 搜索引擎開(kāi)發(fā)技術(shù)參考文獻(xiàn)
章節(jié)摘錄
第1章 搜索引擎概述在浩瀚的網(wǎng)絡(luò)資源中,搜索引擎(Search Engine)是一種網(wǎng)上信息檢索工具,它能幫助用戶迅速而全面地找到所需要的信息。我們可以這樣對(duì)搜索引擎進(jìn)行定義:搜索引擎是一種能夠通過(guò)因特網(wǎng)接受用戶的查詢指令,并向用戶提供符合其查詢要求的信息資源網(wǎng)址的系統(tǒng)。多數(shù)網(wǎng)上用戶使用搜索引擎來(lái)獲得所需信息,據(jù)CNNIC的統(tǒng)計(jì),用搜索引擎搜索僅次于電子郵件的應(yīng)用。目前網(wǎng)上比較有影響的中文搜索工具有:Google、百度(Baidu)、北大天網(wǎng)、愛(ài)問(wèn)(iask)、雅虎(Yahoo)、搜狗(Sogou)等搜索引擎。英文的有:Yahoo、AltaVista、Excite、Infoseek、Lycos、Aol等。另外還有專用搜索引擎,例如,專門(mén)搜索歌曲和音樂(lè)的;專門(mén)搜索電子郵件地址、電話與地址及公眾信息的;專門(mén)搜索各種文件的FTP搜索引擎等。本章主要介紹搜索引擎的概念、搜索引擎的發(fā)展史、搜索引擎的分類以及一些著名的搜索引擎。1.1 搜索引擎的概念搜索引擎是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序搜集互聯(lián)網(wǎng)上的信息,在對(duì)信息進(jìn)行組織和處理后,為用戶提供檢索服務(wù)的系統(tǒng)。搜索引擎并不真正搜索互聯(lián)網(wǎng),它搜索的實(shí)際上是預(yù)先整理好的網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)。真正意義上的搜索引擎,通常指的是收集了互聯(lián)網(wǎng)上幾千萬(wàn)到幾十億個(gè)網(wǎng)頁(yè)并對(duì)網(wǎng)頁(yè)中的每一個(gè)詞(即關(guān)鍵詞)進(jìn)行索引,建立索引數(shù)據(jù)庫(kù)的全文搜索引擎。當(dāng)用戶查找某個(gè)關(guān)鍵詞的時(shí)候,所有在頁(yè)面內(nèi)容中包含了該關(guān)鍵詞的網(wǎng)頁(yè)都將作為搜索結(jié)果被搜出來(lái)。在經(jīng)過(guò)復(fù)雜的算法進(jìn)行排序后,這些結(jié)果將按照與搜索關(guān)鍵詞的相關(guān)度高低,依次排列。
編輯推薦
《搜索引擎原理與實(shí)踐》由北京郵電大學(xué)出版社出版。
圖書(shū)封面
圖書(shū)標(biāo)簽Tags
無(wú)
評(píng)論、評(píng)分、閱讀與下載
250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版