出版時(shí)間:2007-9 出版社:第1版 (2007年9月1日) 作者:盧亮 頁(yè)數(shù):289 字?jǐn)?shù):210000
Tag標(biāo)簽:無
內(nèi)容概要
本書是搜索引擎業(yè)界資深的搜索引擎專家長(zhǎng)久以來經(jīng)驗(yàn)的積累與研究工作的心路歷程。本書從搜索引擎的歷史和現(xiàn)狀開始展開,為廣大讀者展現(xiàn)了搜索引擎簡(jiǎn)單界面背后的復(fù)雜技術(shù)、原理和應(yīng)用,從數(shù)據(jù)挖掘到搜索引擎的數(shù)據(jù)結(jié)構(gòu),從搜索引擎爬蟲到分布式搜索引擎的設(shè)計(jì)均是作者精心研究的結(jié)果和過程,對(duì)研究搜索引擎的人士頗有實(shí)用價(jià)值和參考意義。 本書適合剛搜索引擎行業(yè)乃至互聯(lián)網(wǎng)行業(yè)的從業(yè)人員、如網(wǎng)站設(shè)計(jì)者、程序員、個(gè)人網(wǎng)站的站主,本書還適合大中學(xué)院相關(guān)專業(yè)及培訓(xùn)機(jī)構(gòu)的相關(guān)培訓(xùn)作為參考書籍。
書籍目錄
第1章 搜索引擎的歷史和現(xiàn)狀 1.1 搜索引擎的歷史 1.2 搜索引擎的分類 1.3 搜索引擎的現(xiàn)狀 1.4 世界主要搜索引擎介紹 1.4.1 Google 1.4.2 百度 1.4.3 Technorati 1.4.4 A11theweb 1.4.5 Ask.com 1.4.6 MSN Search 小結(jié) 參考文獻(xiàn)第2章 數(shù)據(jù)挖掘 2.1 數(shù)據(jù)挖掘概覽 2.1.1 為什么要做數(shù)據(jù)挖掘 2.1.2 數(shù)據(jù)挖掘的任務(wù) 2.1.3 關(guān)聯(lián)挖掘和分析 2.1.4 多子類 2.1.5 聚類分析 2.1.6 序列模式分析 2.1.7 偏差分析 2.2 數(shù)據(jù)挖掘的常用技術(shù) 2.2.1 人工神經(jīng)網(wǎng)絡(luò) 2.2.2 統(tǒng)計(jì)分析 小結(jié) 參考文獻(xiàn)第3章搜索引擎的數(shù)據(jù)結(jié)構(gòu) 3.1 存儲(chǔ)結(jié)構(gòu) 3.1.1 四種基本存儲(chǔ)方法 3.2 索引 3.2.1 倒排索引 3.3 結(jié)構(gòu)化查詢語(yǔ)言 3.4 海量數(shù)據(jù)系統(tǒng) 小結(jié) 參考文獻(xiàn)第4章 搜索引擎的基本結(jié)構(gòu) 4.1 網(wǎng)絡(luò)爬蟲 4.2 排序 4.2.1 網(wǎng)頁(yè)的權(quán)重 4.2.2 向量空間模型VSM 4.2.3 擴(kuò)展相關(guān)信息 4.3 索引系統(tǒng) 4.4 緩存機(jī)制 小結(jié) 參考文獻(xiàn)第5章 搜索引擎爬蟲 5.1 深度優(yōu)先與廣度優(yōu)先 5.1.1 網(wǎng)頁(yè)鏈接情況概覽 5.1.2 取得有效的網(wǎng)賈文字 ……第6章 搜索引擎索引系統(tǒng)第7章 分布式搜索引擎設(shè)計(jì)第8章 Goog1e搜索引擎的結(jié)構(gòu)第9章 中文分詞第10章 分類與聚類第11章 內(nèi)容消重和SPAM消除第12章 圖像搜索引擎附錄
圖書封面
圖書標(biāo)簽Tags
無
評(píng)論、評(píng)分、閱讀與下載
搜索引擎原理、實(shí)踐與應(yīng)用 PDF格式下載