搜索引擎

出版時(shí)間:2005-4  出版社:科學(xué)出版社發(fā)行部  作者:李曉明  頁數(shù):247  
Tag標(biāo)簽:無  

內(nèi)容概要

本書系統(tǒng)地介紹了互聯(lián)網(wǎng)搜索引擎的工作原理、實(shí)現(xiàn)技術(shù)及其系統(tǒng)構(gòu)建方案。全書分三篇共13章內(nèi)容,從基本工作原理概述,到一個(gè)小型簡單搜索引擎具體細(xì)節(jié)的實(shí)現(xiàn),進(jìn)而詳細(xì)討論了大規(guī)模分布式搜索引擎系統(tǒng)的設(shè)計(jì)要點(diǎn)及其關(guān)鍵技術(shù);最后介紹了面向主題和個(gè)性化的web信息服務(wù),闡述了中文網(wǎng)頁自動(dòng)分類等技術(shù)及其應(yīng)用。本書層次分明,由淺入深;既有深入的理論分析,也有大量的實(shí)驗(yàn)數(shù)據(jù),具有學(xué)習(xí)和實(shí)用雙重意義。    本書可作為高等院校計(jì)算機(jī)科學(xué)與技術(shù)、信息管理與信息系統(tǒng)、電子商務(wù)等專業(yè)的研究生或高年級(jí)本科生的教學(xué)參考書和技術(shù)資料,對(duì)廣大從事網(wǎng)絡(luò)技術(shù)、Web站點(diǎn)的管理、數(shù)字圖書館、Web挖掘等研究和應(yīng)用開發(fā)的科技人員也有很高的參考價(jià)值。

作者簡介

李曉明:天網(wǎng)搜索引擎領(lǐng)域負(fù)責(zé)人
閆宏飛 王繼民:天網(wǎng)搜索引擎項(xiàng)目負(fù)責(zé)人

書籍目錄

前言第一章 引論 第一節(jié) 搜索引擎的概念  第二節(jié) 搜索引擎的發(fā)展歷史  第三節(jié) 一些著名的搜索引擎上篇 Web搜索引擎基本原理和技術(shù) 第二章 Web搜索引擎工作原理和體系結(jié)構(gòu)   第一節(jié) 基本要求   第二節(jié) 網(wǎng)頁搜集   第三節(jié) 預(yù)處理   第四節(jié) 查詢服務(wù)   第五節(jié) 體系結(jié)構(gòu) 第三章 Web信息的搜集    第一節(jié)   引言     一、超文本傳輸協(xié)議     二、一個(gè)小型搜索引擎系統(tǒng)   第二節(jié) 網(wǎng)頁搜集     一、定義LJRL類和Page類     二、與服務(wù)器建立連接     三、發(fā)送請(qǐng)求和接收數(shù)據(jù)     四、網(wǎng)頁信息存儲(chǔ)的天網(wǎng)格式   第三節(jié) 多道搜集程序并行工作     一、多線程并發(fā)工作     二、控制對(duì)一個(gè)站點(diǎn)并發(fā)搜集線程的數(shù)目     第四節(jié) 如何避免網(wǎng)頁的重復(fù)搜集     一、記錄未訪問、已訪問IJRL和網(wǎng)頁內(nèi)容摘要信息     二、域名與IP的對(duì)應(yīng)問題   第五節(jié) 如何首先搜集重要的網(wǎng)頁   第六節(jié) 搜集信息的類型   第七節(jié) 本章 小結(jié)     第四章 對(duì)搜集信息的預(yù)處理    第一節(jié) 信息預(yù)處理的系統(tǒng)結(jié)構(gòu)-    第二節(jié) 索引網(wǎng)頁庫    第三節(jié) 中文自動(dòng)分詞    第四節(jié) 分析網(wǎng)頁和建立倒排文件    第五節(jié) 本章 小結(jié) 第五章 信息查詢服務(wù)   第一節(jié) 查詢服務(wù)的系統(tǒng)結(jié)構(gòu)   第二節(jié) 檢索的定義   第三節(jié) 查詢服務(wù)的實(shí)現(xiàn)     一、結(jié)果集合的形成     二、查詢結(jié)果顯示   第四節(jié) 本章 小結(jié)中篇 對(duì)質(zhì)量和性能的追求 第六章 可擴(kuò)展搜集子系統(tǒng)   第一節(jié) 天網(wǎng)系統(tǒng)概述和集中式搜集系統(tǒng)結(jié)構(gòu)     一、天網(wǎng)系統(tǒng)結(jié)構(gòu)     二、集中式搜集系統(tǒng)   第二節(jié) 利用并行處理技術(shù)高效搜集網(wǎng)頁的一種方案     一、節(jié) 點(diǎn)間URL的劃分策略     二、關(guān)于性能的討論     三、性能測試和評(píng)價(jià)     四、系統(tǒng)的動(dòng)態(tài)可配置性設(shè)計(jì)    第三節(jié) 本章 小結(jié) 第七章 網(wǎng)頁凈化與消重    第一節(jié) 網(wǎng)頁凈化與元數(shù)據(jù)提取     一、引言     二、D0cview模型     三、網(wǎng)頁的表示     四、提取Docview模型要素的方法     五、模型應(yīng)用及實(shí)驗(yàn)研究    第二節(jié) 網(wǎng)頁消重算法     一、消重算法…… 第八章 高性能檢索子系統(tǒng) 第九章 用戶行為的特征及緩存的應(yīng)用 第十章 相關(guān)排序與系統(tǒng)質(zhì)量評(píng)估下篇 面向主題和個(gè)性化的Wed信息服務(wù) 第十一章 中文網(wǎng)頁自動(dòng)分類技術(shù) 第十二章 搜索引擎?zhèn)€性化查詢服務(wù) 第十三章 面向主題的信息搜集與應(yīng)用參考文獻(xiàn)附錄 術(shù)語后記

圖書封面

圖書標(biāo)簽Tags

評(píng)論、評(píng)分、閱讀與下載


    搜索引擎 PDF格式下載


用戶評(píng)論 (總計(jì)84條)

 
 

  •   理論聯(lián)系實(shí)際,對(duì)深入了解搜索引擎的工作原理非常有用,遺憾的是對(duì)技術(shù)細(xì)節(jié)討論不夠充分
  •   國內(nèi)搜索引擎的書本來就少,這本書算是國內(nèi)出版的最好的一本。書上內(nèi)容結(jié)合了北大天網(wǎng)的實(shí)例來講解說明,算是有理有據(jù)的,并非泛泛而談。要知道天網(wǎng)搜索引擎算是國內(nèi)的Numberone了。百度里面都是從天網(wǎng)招過去的,酷訊的老板干脆就是原來開發(fā)天網(wǎng)的。由此可知這本書的含金量是很高的。只是版本有點(diǎn)老,如果作者能重新出版,加入一些新的內(nèi)容就更好了。
  •   學(xué)習(xí)搜索引擎的原理和方法的好書,經(jīng)典好書,值得推薦,作者還有系列相關(guān)書籍!
  •   史上最經(jīng)典的搜索引擎基礎(chǔ)學(xué)習(xí)資料,詳實(shí),對(duì)學(xué)習(xí)SEO有相當(dāng)大的幫助!
  •   適合學(xué)習(xí)搜索引擎的同學(xué)閱讀,要是有java版本就更好了
  •   非常不錯(cuò)的一本搜索引擎教程,很值得一看!
  •   這是一本非常好搜索引擎的入門書籍!
  •   技術(shù)原理類的書 朋友推薦的 值得一看,這種工具類的書,只能在辦公室書桌旁看,需要用心去思考和理解。
  •   對(duì)天網(wǎng)有深刻的探索,比較系統(tǒng),便于只是融合
  •   圖書館借了好幾次,最終決定買一本。很有收藏價(jià)值的書,相信以為一直會(huì)用到
  •   內(nèi)容一氣呵成,非常流暢,由淺入深,適合初學(xué)者
  •   感覺寫的不錯(cuò),才看到第六章。。。
  •   買了好幾本書,質(zhì)量都不錯(cuò),當(dāng)當(dāng)一如既往的好
  •   基礎(chǔ)知識(shí),不錯(cuò)的一本書,推薦一下。
  •   相當(dāng)專業(yè),在網(wǎng)上看人家推薦的,還可以
  •   因?yàn)榈诙嬗悬c(diǎn)貴,就選擇了第一版。做seo的話還是需要多熟悉一下基礎(chǔ)的內(nèi)容。
  •   封面不怎么喜歡,但是內(nèi)容還行
  •   真正的理解了搜索的內(nèi)容,比那些抄算法的強(qiáng)多了
  •   剛拿到手,匆匆翻閱了一下,感覺內(nèi)容很實(shí)在,應(yīng)該是一本好書,真正閱讀的時(shí)候希望不要令人失望
  •   書好,我喜歡,希望大家購買!
  •   買來還沒有看,應(yīng)該還可以
  •   在別人的博客中看見的,不錯(cuò)
  •   講的非常好 我一看就明白了
  •   當(dāng)當(dāng)?shù)乃拓浰俣日娴暮芸?..
  •   不適合初學(xué)者啊 好難明啊
  •   第一次讀這類書,收獲不小,對(duì)我有一定深度!
  •   給先生買的,對(duì)工作有幫助,呵呵
  •   這本書系統(tǒng)地介紹了搜索引擎的實(shí)現(xiàn)方法及原理,是了解搜索引擎知識(shí)的一本好書
  •   學(xué)習(xí)seo首先要先系統(tǒng)的學(xué)習(xí)搜索引擎。知道了搜索引擎的工作原理才能讓seo工作展開的更順利,效果更明顯。這本書雖然老了點(diǎn),但是還是值得我們借鑒,看看就知道了,我也是從seo三人行那里得知的這本書。
  •   對(duì)搜索引擎的研究綜述和基本框架談?wù)摰妮^為透徹,作為科研論文的參考文獻(xiàn)是不錯(cuò)的。第6、7章在今日看來也不失指導(dǎo)價(jià)值,作者在圈內(nèi)算是有資歷的人了,寫出的東西當(dāng)然有意義。搜索引擎領(lǐng)域的仁人志士理應(yīng)買一本看看。美中不足的是出版年份較早,有些內(nèi)容過時(shí)了,希冀能有新版出現(xiàn)!
  •   國內(nèi)關(guān)于搜索引擎方面的書籍,本身就少,此書是非常好的搜索引擎方面的書籍,他不僅僅介紹理論,還有一個(gè)小的模型。關(guān)于中篇的介紹,要是在有實(shí)際的解決案例就好了
  •   聽seo三人行小涵推薦的,應(yīng)該算是不錯(cuò)的了。里面很多公司,主要想學(xué)下搜索引擎的原理,想理解多一點(diǎn)百度。相信會(huì)有比較深刻的搜索引擎原理認(rèn)識(shí)
  •   剛開始學(xué)搜索引擎,這本書蠻不錯(cuò)的,很適合初學(xué)者。
  •   這本書可以幫助讀者很快的了解整個(gè)搜索引擎的框架結(jié)構(gòu)
  •   適合入門看,可以對(duì)搜索引擎有個(gè)整體了解
  •   這個(gè)書,還是值得買的,如果你對(duì)搜索引擎不是很了解的話
  •   本書介紹的較為詳細(xì),但不足的是沒有自己編寫的具體代碼,用的是別人的開源項(xiàng)目,對(duì)于做項(xiàng)目的人來書,可以作為參考書,但是不能作為一本可以作為模板的設(shè)計(jì)輔助教材
  •   對(duì)于入門來說是不錯(cuò)的,雖然原理老了點(diǎn),但是大體方向還是不變的。
  •   第一次用,很方便,價(jià)錢也說的過去!很好的互聯(lián)網(wǎng)產(chǎn)品!贊
  •   不錯(cuò),只是有些內(nèi)容希望寫的再詳細(xì)一些!
  •   比較專業(yè),正在研究中
  •   內(nèi)容不怎么生動(dòng),拿到這本書讓我想起大學(xué)的古板的教科書。
  •   這本書早幾個(gè)月就買好了,放在家里一直沒看,對(duì)書沒什么評(píng)價(jià),不過送貨速度還蠻好的。
  •   相對(duì)于其它幾本來說,這本書還是不錯(cuò)的。。。。可以一看
  •   但還是有點(diǎn)貴,這本書不是很厚啊,材料不足那么貴吧
  •   好,但是可能要有基礎(chǔ)的人才看得懂
  •   2天內(nèi)收到貨 速度快
  •   還沒看,爭取盡快看看
  •   老師給過了,就好
  •   頂!很難得的一本好書
  •   質(zhì)量、速度都還不錯(cuò)。
  •   還不錯(cuò),很容易看懂,就是版本老了點(diǎn)。對(duì)于入門者還是值得一看的。。。。不說了,看書去。
  •   不錯(cuò)書很好~~~·~
  •   從零開始教,還是蠻適合入門的
  •   不錯(cuò)啊,還沒看完
  •   買了還沒什么時(shí)間去看.
  •   書的內(nèi)容老了些,但是很經(jīng)典
  •   相比其它幾款為了賺錢而推出的垃圾快餐書而言,這書算是不錯(cuò)的了對(duì)搜索引擎的理論有一個(gè)詳細(xì)的介紹,適合入門但缺乏具體解決方案
  •   這本書里面很多測試對(duì)比數(shù)據(jù)
    因?yàn)檫@本書,我前幾天就上天網(wǎng)看看,感覺很多內(nèi)容搜不出來。
    這難道就是國內(nèi)最高水準(zhǔn)的搜索引擎?
    今天去看,暫停服務(wù)了。
    網(wǎng)上好像有pdf版本的。
  •   泛泛的技術(shù)介紹,算是了解了行業(yè)知識(shí),開闊視野。
  •   有一些參考價(jià)值,但是內(nèi)容比較老
  •   參考教材,需要慢慢體會(huì)
  •   挺專業(yè)的對(duì)我這樣的非專業(yè)的很難懂
  •   書還OK,多加學(xué)習(xí)
  •   寫得中規(guī)中矩,內(nèi)容不是很新穎,與其他書相近
  •   像大學(xué)教材,粗略的看了一下,內(nèi)容比較難,不適合初學(xué)者。
  •   深不深,淺不淺,湊合看看吧,
  •   只是外觀略顯陳舊,看上去像是二手書
  •   如果用來入門還算可以吧!
  •   深度是夠了,看書的人就費(fèi)勁了。需要提前掌握很多知識(shí)再看吧。
  •   搞笑的是我買的一本居然還是裝訂錯(cuò)誤的,搞的我還要去退掉。好象那5元郵費(fèi)也沒退給我。
  •   入門的東西講了點(diǎn)吧。
  •   買了還沒什么時(shí)間去看
  •   買了一本,但是找不到源代碼。在網(wǎng)上下載的代碼不知道如何運(yùn)行,書中也沒有講解,只是一味的講解原理,不將如何搭建。該搜索引擎案例TES似乎是很多人知道,但我并不覺得好在哪里。那個(gè)什么北大的搜索也不外如是,似乎沒什么人用。搜索出來的東西有些還沒有
  •   完全是大學(xué)教材一樣的照本宣科
  •   這一本更加差了,我不知道是盜版的還是因?yàn)槌霭嫔绲脑?br /> 反正影響到了閱讀了!
  •   收到的書都搞到不像了麻煩給本新的好嗎?
  •   書還可以就是快遞公司不太好書也被他們折出痕跡送貨時(shí)間也慢
  •   不錯(cuò) 適合新手
  •   作為搜索引擎入門書非常好
  •   非?;A(chǔ)
  •   太基礎(chǔ)了 哈哈
  •   很不錯(cuò)哦啊
  •   介紹搜索引擎技術(shù)的
 

250萬本中文圖書簡介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7