鏈接分析

出版時間:2009-1  出版社:東南大學(xué)出版社  作者:邁克·塞沃爾  頁數(shù):225  
Tag標(biāo)簽:無  

前言

  網(wǎng)絡(luò)鏈接分析研究可以追溯到20世紀(jì)90年代中期。1995年,Brazilian Marcia J.Bossy首次提出可將信息技術(shù)應(yīng)用于因特網(wǎng)。1996年,Larson在《萬維網(wǎng)的文獻計量:網(wǎng)絡(luò)空間結(jié)構(gòu)初探》一文中明確將信息技術(shù)從文獻計量學(xué)移植到網(wǎng)絡(luò)中。早期的鏈接分析研究同時出現(xiàn)在幾個學(xué)科中,包括計算機科學(xué)領(lǐng)域中的搜索引擎開發(fā),數(shù)學(xué)領(lǐng)域中的結(jié)構(gòu)和復(fù)雜性分析。而在1997年,Almind和Ingwersen提出了“網(wǎng)絡(luò)計量學(xué)(webometrics)”一詞,旨在定量分析網(wǎng)絡(luò)現(xiàn)象。此后,鏈接分析便成了網(wǎng)絡(luò)計量學(xué)的主要研究內(nèi)容之一。1998年,Google的創(chuàng)始人Brin和Page公開了PageRank算法的核心部分,這一鏈接分析算法,作為Google的核心技術(shù)之一,支撐著Google在商業(yè)上取得了巨大的成功,同時,也彰顯了鏈接分析研究的魅力?! ≡谛畔⒖茖W(xué)研究領(lǐng)域,按照Mike Fhelwall的定義,鏈接分析就是采用并改進現(xiàn)有的信息技術(shù),借助文檔之間的相互關(guān)聯(lián),對文檔自身的特征進行深入分析。鏈接分析涉及的文檔包括四個層面:頁面、目錄、域名、站點。在理論方面,鏈接分析與文獻計量學(xué)中的引文分析有高度相似性?! ℃溄臃治龅膬?nèi)容主要包括:①Web結(jié)構(gòu)研究:將文檔視為節(jié)點,將文檔之間的鏈接視為連線,便可將Web理解為一張抽象的結(jié)構(gòu)圖(有向圖),圖中的節(jié)點與連線的屬性都值得深入研究;②鏈接增長規(guī)律研究:鏈接的建立不是隨機的(“均勻鏈接”),而是服從某種規(guī)律的,Web環(huán)境中,小世界現(xiàn)象已不再適用,不同類型的頁面間的鏈接增長規(guī)律不同,純粹的冪定律模型(“優(yōu)先鏈接”)已難以概括這些規(guī)律;③鏈接分類研究:鏈接可以傳達信息,因此,判斷創(chuàng)建鏈接的動機可用于判斷學(xué)術(shù)網(wǎng)絡(luò)上信息交流的類型;④鏈接分析算法:Pagerank算法、HITS算法等鏈接分析算法應(yīng)用于搜索引擎檢索結(jié)果排序,極大地提高了檢索效率,網(wǎng)絡(luò)在發(fā)展,這些算法也在不斷的更新;⑤鏈接分析工具研究:搜索引擎與網(wǎng)絡(luò)爬蟲一直是鏈接分析研究中獲取數(shù)據(jù)的主要工具,但二者都有自身的缺陷,如何合理地使用鏈接分析工具以提高鏈接分析數(shù)據(jù)的有效性則一直是鏈接分析研究中討論的主要問題?! ℃溄臃治鲅芯恐谐S玫墓ぞ吲c方法包括:搜索引擎、網(wǎng)絡(luò)檔案、網(wǎng)絡(luò)爬蟲、鏈接數(shù)據(jù)庫、數(shù)據(jù)清理技術(shù)、網(wǎng)絡(luò)空間分析法、虛擬民族志方法、社會網(wǎng)絡(luò)分析法、網(wǎng)絡(luò)可視化方法等?! ℃溄臃治隹蓱?yīng)用于多個領(lǐng)域,包括:①搜索引擎與網(wǎng)站設(shè)計:鏈接分析算法用于對檢索結(jié)果排序可有效提高檢索效率,而網(wǎng)站根據(jù)搜索引擎的工作原理和排序算法改進網(wǎng)站結(jié)構(gòu)、提高網(wǎng)站內(nèi)容質(zhì)量以增加其可見度;②網(wǎng)站健康度檢查:通過分析網(wǎng)站上的人鏈數(shù)與出鏈數(shù)、入鏈頁面類型與出鏈頁面類型等數(shù)據(jù)判斷網(wǎng)站在網(wǎng)絡(luò)中的影響力及健康狀況;③知識挖掘:從鏈接分析算法與鏈接網(wǎng)絡(luò)圖中可以挖掘出網(wǎng)頁、網(wǎng)站的潛在屬性及潛在關(guān)聯(lián),以獲得新知識,例如,可借助Pajek構(gòu)建知識地圖,將鏈接形成的網(wǎng)絡(luò)關(guān)系可視化為一張二維圖,從圖中可以明顯地判斷出節(jié)點的重要程度與節(jié)點間關(guān)聯(lián)的緊密程度。

內(nèi)容概要

鏈接分析,源于對Web結(jié)構(gòu)中超鏈接的多維分析。當(dāng)前其應(yīng)用主要體現(xiàn)在網(wǎng)絡(luò)信息檢索、網(wǎng)絡(luò)計量學(xué)、數(shù)據(jù)挖掘、Web結(jié)構(gòu)建模等方山。作為Google的核心技術(shù)之一,鏈接分析算法應(yīng)用已經(jīng)顯現(xiàn)出巨人的商業(yè)價值。本書作為英國信息科學(xué)專家邁克·塞沃爾(Mike Thelwall)教授的最新著作,從情報學(xué)的視角系統(tǒng)闡述了鏈接分析的理論、方法與應(yīng)用,具體分六部分:概述、網(wǎng)絡(luò)結(jié)構(gòu)背景、學(xué)術(shù)型鏈接分析、鏈接分析的應(yīng)用、鏈接分析的丁具和技術(shù)、總結(jié)。從結(jié)構(gòu)上看,本書邏輯嚴(yán)謹(jǐn),條分縷析;從內(nèi)容上看,本書資料翔實,通過大量的方法、工具、技術(shù)介紹及案例分析,向讀者展示了整個鏈接分析分析研究的全貌;從表達上看,本書文字深入淺出,用較簡潔的語言捕述了較復(fù)雜的理論與技術(shù)。    本書可供情報學(xué)、圖書館學(xué)、信息資源管理、信息管理與信息系統(tǒng)、計算機科學(xué)與技術(shù)等專業(yè)的師生課堂使用,同時,其翔實的資料町作為國內(nèi)情報學(xué)、計算機科學(xué)、傳播學(xué)、社會學(xué)等領(lǐng)域從事應(yīng)用統(tǒng)計研究時的重要參考。

書籍目錄

第一部分  理論  第1章  前言  第2章  網(wǎng)絡(luò)爬蟲與搜索引擎 第3章  鏈接統(tǒng)計的理論基礎(chǔ) 第4章  對鏈接數(shù)的解釋:隨機樣本與相關(guān)性第二部分  Web結(jié)構(gòu) 第5章  Web圖中的鏈接結(jié)構(gòu) 第6章  Web的內(nèi)容結(jié)構(gòu)第三部分  學(xué)術(shù)鏈接 第7章  大學(xué):鏈接類型 第8章  大學(xué):鏈接模型 第9章  大學(xué):國際鏈接 第10章  院系和學(xué)科 第11章  期刊和論文第四部分  應(yīng)用 第12章  搜索引擎與網(wǎng)站設(shè)計 第13章  西班牙大學(xué)網(wǎng)站健康度檢驗 第14章  鏈向大學(xué)網(wǎng)站的個人網(wǎng)頁 第15章  學(xué)術(shù)網(wǎng)絡(luò) 第16章  商業(yè)網(wǎng)站第五部分  工具和方法 第17章  商業(yè)搜索引擎和網(wǎng)絡(luò)檔案的使用 第18章  個人爬蟲 第19章  數(shù)據(jù)清理 第20章  大學(xué)在線鏈接數(shù)據(jù)庫 第21章  嵌入式鏈接分析方法 第22章  社會網(wǎng)絡(luò)分析 第23章  網(wǎng)絡(luò)可視化 第24章  學(xué)術(shù)鏈接指標(biāo)第六部分  總結(jié) 第25章  總結(jié) 第26章  術(shù)語表附錄:SocSciBot使用指南

章節(jié)摘錄

  第1章 前言  目標(biāo)  ·介紹本書的內(nèi)容和結(jié)構(gòu),以及一些關(guān)鍵術(shù)語。  ·介紹信息科學(xué)研究方法——鏈接分析?! ℃溄臃治觥 ℃溄臃治鲈谠S多領(lǐng)域中有著廣泛的應(yīng)用,如計算機技術(shù)、理論物理、信息科學(xué)、傳播學(xué)以及社會學(xué)等。之所以能有這樣廣泛的應(yīng)用,一方面是因為網(wǎng)絡(luò)的重要性;另一方面是因為人們普遍認(rèn)為:從網(wǎng)頁之間的超鏈接中能夠提取各種有用的信息。這種認(rèn)識主要源于一些相關(guān)的因素:①Google的巨大成功,主要是利用一種基于鏈接的算法來判斷網(wǎng)頁的相關(guān)度;②期刊引用、社會人際關(guān)系等類似現(xiàn)象;③網(wǎng)絡(luò)用戶每天都面對各種用于研究、或用于商業(yè)、或用于娛樂的鏈接。  在本書中,筆者的主要目的是向新讀者介紹什么是信息科學(xué)視角的鏈接分析。之后,讀者們就能夠評價現(xiàn)有的研究,甚至從事自己的研究項目、形成自己的研究方法。在本書中,筆者深信信息科學(xué)的方法對于其他學(xué)科的研究人員同樣有著廣泛的實用價值,尤其是那些對在線分析感興趣的社會學(xué)家。在研究過程中,如果將所有類型的鏈接分析都納入考慮范圍,必將一無所得,因為有些領(lǐng)域要求詳細(xì)的數(shù)學(xué)算法,而另一些領(lǐng)域則只需要定性的分析。本書中至少有一半的內(nèi)容是研究學(xué)術(shù)網(wǎng)絡(luò)或?qū)W術(shù)交流的,因此,讀者們也可以對學(xué)術(shù)交流有一些深入的了解。、

編輯推薦

  《鏈接分析:信息科學(xué)的研究方法》可供情報學(xué)、圖書館學(xué)、信息資源管理、信息管理與信息系統(tǒng)、計算機科學(xué)與技術(shù)等專業(yè)的師生課堂使用,同時,其翔實的資料町作為國內(nèi)情報學(xué)、計算機科學(xué)、傳播學(xué)、社會學(xué)等領(lǐng)域從事應(yīng)用統(tǒng)計研究時的重要參考。

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    鏈接分析 PDF格式下載


用戶評論 (總計10條)

 
 

  •   此書不錯!很專業(yè),并側(cè)重于應(yīng)用。
  •   內(nèi)容比較新,比較適合做相關(guān)研究的人閱讀,這方面的書本來就少
  •   很看好這本書,有點深,但很有用
  •   這是最正宗的專家寫的
  •   ,都是精華啊,而且引文很全面
  •   這書一般。
    感覺沒多大實際的內(nèi)容
  •   老師推薦的,應(yīng)該很實惠!
  •   送貨比想象的快
  •   國人寫的,還不錯。
  •   印刷質(zhì)量還行,但是內(nèi)容不敢恭維啊
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7