出版時(shí)間:2012-3 出版社:水利水電出版社 作者:梁春燕 頁數(shù):168
Tag標(biāo)簽:無
內(nèi)容概要
作為搜索引擎領(lǐng)域的重要發(fā)展趨勢(shì)之一,主題搜索引擎充分考慮和滿足用戶對(duì)某些特定領(lǐng)域的網(wǎng)絡(luò)信息需求,具有高度的目標(biāo)化和專業(yè)化。本書在繼承國內(nèi)外相關(guān)研究成果的基礎(chǔ)上,以化學(xué)化工領(lǐng)域?yàn)槔?,設(shè)計(jì)了一個(gè)完整的主題搜索引擎系統(tǒng),并基于專業(yè)知識(shí)庫,研究了專業(yè)化爬行器、索引和檢索的相關(guān)策略以及多語言自動(dòng)分類技術(shù)和個(gè)性化技術(shù),使Internet主題搜索引擎可提供更智能化、專業(yè)化和個(gè)性化的檢索服務(wù),更好地滿足專業(yè)用戶的信息需求。
本書內(nèi)容豐富、應(yīng)用性強(qiáng),可供信息管理、計(jì)算機(jī)應(yīng)用等領(lǐng)域從事相關(guān)研究的專家學(xué)者、工程技術(shù)人員及高等院校相關(guān)專業(yè)教師、研究生參考使用。
書籍目錄
前言
常用符號(hào)表
第1章 Internet搜索引擎概述
1.1 Internet搜索引擎簡介
1.2 Internet搜索引擎的基本原理
1.3 Internet搜索引擎的相關(guān)技術(shù)
1.3.1網(wǎng)絡(luò)信息收集
1.3.2網(wǎng)絡(luò)信息索引
1.3.3網(wǎng)絡(luò)信息檢索
1.3.4網(wǎng)頁重要性評(píng)價(jià)技術(shù)-
1.3.5自動(dòng)分類技術(shù)
1.3.6個(gè)性化技術(shù)
1.4本書研究背景及內(nèi)容
1.4.1本書研究背景
1.4.2本書研究內(nèi)容
第2章 Internet主題搜索引擎的總體設(shè)計(jì)
2.1 Internet主題搜索引擎概述
2.2 Internet主題搜索引擎的目標(biāo)
2.3 Internet主題搜索引擎的總體設(shè)計(jì)
2.4 Internet主題搜索引擎的基本模塊
2.4.1爬行
2.4.2索引
2.4.3檢索
2.4.4排序
2.4.5 自動(dòng)分類
2.4.6個(gè)性化檢索
2.5本章小結(jié)
第3章 Internet主題搜索引擎的信息收集和索引
3.1 Internet主題搜索引擎的收集策略
3.1.1爬行器的基本概念-
3.1.2爬行器的訪問策略
3.1.3主題搜索引擎爬行器的設(shè)計(jì)和實(shí)現(xiàn)
3.2 Internet主題搜索引擎的索引策略
3.2.1索引器的基本概念
3.2.2主題搜索引擎索引器的設(shè)計(jì)和實(shí)現(xiàn)
3.3本章小結(jié)
第4章 Internet主題搜索引擎的檢索和排序
4.1基于倒排索引的關(guān)鍵詞檢索
4.1.1檢索策略
4.1.2檢索的基本功能和實(shí)現(xiàn)
4.2基于網(wǎng)絡(luò)鏈接結(jié)構(gòu)的網(wǎng)頁評(píng)價(jià)和排序
4.2.1 PageRank算法的實(shí)現(xiàn)
4.2.2基本排序方法
4.3 Internet主題搜索引擎的基本檢索功能和相關(guān)界面
4.3.1基本檢索
4.3.2使用偏好設(shè)置
4.3.3高級(jí)檢索
4.3.4結(jié)果顯示
4.4本章小結(jié)
第5章 專業(yè)信息的自動(dòng)分類
5.1 自動(dòng)分類算法的研究
第6章 Internet主題搜索索引擎的個(gè)性化檢索
第7章 Internet主題搜索引擎的展望
參考文獻(xiàn)
后記
章節(jié)摘錄
版權(quán)頁: 插圖: 用戶在使用搜索引擎進(jìn)行信息檢索時(shí),通常會(huì)得到動(dòng)輒幾千幾萬的返回結(jié)果。面對(duì)這些數(shù)量巨大的信息,用戶往往只會(huì)瀏覽前幾頁的結(jié)果,更多的結(jié)果則被埋沒在后面而不為用戶所關(guān)心。因此,將更能滿足用戶需求的文檔優(yōu)先顯示給用戶,就成為搜索引擎的重要目標(biāo),這通常是通過對(duì)搜索結(jié)果進(jìn)行更好的排序來實(shí)現(xiàn)的。在返回給用戶的相關(guān)文檔列表中,除了根據(jù)文檔和用戶查詢的相關(guān)度進(jìn)行排序外,還可以利用Internet上網(wǎng)頁之間的相互評(píng)價(jià),獲取網(wǎng)頁重要性/權(quán)威性的信息,參與到文檔的排序中,從而可以將質(zhì)量較好的文檔優(yōu)先顯示給用戶。 根據(jù)1.3.1節(jié)的闡述,可知網(wǎng)絡(luò)上的資源通過超文本鏈接形成一個(gè)巨大的有向圖(圖1.4)。從一個(gè)網(wǎng)頁指向另一個(gè)網(wǎng)頁的超鏈接,除了可以指導(dǎo)爬行器的爬行外,還可以看作是一個(gè)網(wǎng)頁對(duì)鏈接網(wǎng)頁的評(píng)價(jià),這就構(gòu)成了一個(gè)巨大的相互評(píng)價(jià)網(wǎng)絡(luò)。通過分析這個(gè)網(wǎng)絡(luò)鏈接結(jié)構(gòu),使用某種算法來計(jì)算網(wǎng)頁的鏈接重要性,使之與網(wǎng)頁和查詢的相關(guān)度一起共同決定返回網(wǎng)頁的排序,就可以在同樣相關(guān)度的情況下,將質(zhì)量較好的網(wǎng)絡(luò)資源優(yōu)先排在前面。主要有兩種網(wǎng)頁重要性評(píng)價(jià)技術(shù),即Google的PageRank算法和IBM的HITS技術(shù)。
編輯推薦
《Internet主題搜索引擎設(shè)計(jì)與研究》以化學(xué)化工專業(yè)為例,研究在專業(yè)知識(shí)庫的基礎(chǔ)上,自動(dòng)收集和索引Internet專業(yè)資源并進(jìn)行智能處理和智能檢索的方法,研究建立Internet專業(yè)主題搜索引擎,為專業(yè)用戶提供智能高效的網(wǎng)絡(luò)檢索服務(wù)。
圖書封面
圖書標(biāo)簽Tags
無
評(píng)論、評(píng)分、閱讀與下載
Internet主題搜索引擎設(shè)計(jì)與研究 PDF格式下載