信息檢索可視化

出版時間:2009-6  出版社:科學(xué)出版社  作者:Jin Zhang  頁數(shù):233  
Tag標簽:無  

前言

飛速增長的互聯(lián)網(wǎng)上動態(tài)、多樣、異質(zhì)、復(fù)雜的信息和其他信息檢索系統(tǒng)給傳統(tǒng)的信息檢索技術(shù)和理論帶來了史無前例的挑戰(zhàn)。這些挑戰(zhàn)使人們對信息檢索提出了加強交互性、直觀性、有效性等要求,也使專家們必須集中精力尋找滿足用戶檢索相關(guān)信息的新方法。信息可視化技術(shù)可以在一個視覺的、明晰的、交互性的環(huán)境下論證數(shù)據(jù)之間的相關(guān)性,它已成為我們應(yīng)對挑戰(zhàn)的最大希望。信息可視化和信息檢索有著天然的聯(lián)系。事實上信息檢索就像一條線一樣貫穿著整個信息可視化系統(tǒng)。信息可視化向用戶提供獨特的方式去檢索信息,它可以把隱藏的信息用視覺的形式呈現(xiàn),并允許用戶以視覺形式進行檢索。瀏覽作為一種強有力的信息檢索方式將在可視化環(huán)境中被充分應(yīng)用??梢暬夹g(shù)給信息檢索帶來了希望,從信息檢索的角度來看待信息可視化,最終將使信息檢索和信息可視化都受益。本書從理論和實際應(yīng)用方面,對信息檢索可視化領(lǐng)域最新進展進行了體系化的闡明,評價了這個領(lǐng)域主要的技術(shù)和方法,說明了信息檢索和信息可視化的理論關(guān)聯(lián),并介紹了信息檢索可視化的主要算法和模型。本書也說明了信息檢索可視化的一些重要的和普遍的問題,如在深度應(yīng)用中出現(xiàn)的難以評價性、不精確性以及隱喻性。此外,它深度探討了信息檢索可視化在網(wǎng)絡(luò)流量分析、網(wǎng)絡(luò)信息搜尋、瀏覽等領(lǐng)域的理論和實際應(yīng)用。在本書的結(jié)束部分,作者多角度比較了他所介紹的幾個信息檢索可視化模型。最后,本書探討了信息檢索可視化的重要問題和檢索領(lǐng)域以后探索的方向。本書的讀者將通過此書更好地理解信息檢索可視化的現(xiàn)狀,獲悉主要學(xué)者的一些技術(shù)、理論發(fā)現(xiàn)和前沿進展,信息檢索可視化系統(tǒng)實現(xiàn)的一些充分的、有實用價值的細節(jié),以及這個領(lǐng)域的研究者所必須注意的問題。本書的結(jié)構(gòu)如下:第1章介紹了信息檢索可視化的一些基礎(chǔ)問題,如為什么信息可視化技術(shù)對于信息檢索非常關(guān)鍵;如何從查詢和瀏覽兩個方面加強信息檢索;什么是基礎(chǔ)的信息檢索可視化范例;在信息檢索中信息可視化的潛在應(yīng)用和影響是什么;什么是信息檢索可視化模型的基礎(chǔ)程序。第2章包含了信息檢索中一些基礎(chǔ)的概念和理論。這些概念和算法,如相似性方法、信息檢索模型、語詞加權(quán)算法等,都是后續(xù)章節(jié)中關(guān)于信息檢索可視化模型介紹的必要前提。把這些概念和理論放在一起組成一個章節(jié)不僅僅是為了避免在后續(xù)的章節(jié)中重復(fù)介紹,更是為了打好一個理論基礎(chǔ)。

內(nèi)容概要

本書從理論和實際應(yīng)用方面,對信息檢索可視化領(lǐng)域最新進展進行了系統(tǒng)的闡述,集中介紹了信息檢索可視化的基本原理及其結(jié)構(gòu)、方法和算法,較為系統(tǒng)地比較了多重參考點可視化模型(MRPBM)、基于歐幾里得空間特征的可視化模型(ESCBM)、探路者關(guān)聯(lián)網(wǎng)絡(luò)(PFNET)、多維尺度模型(MDS)、自組織圖模型(SOM)等五種主要的信息檢索可視化模型,討論了信息可視化系統(tǒng)的評估及信息可視化系統(tǒng)設(shè)計中人的行為,分析了信息可視化中的一些特有的歧義現(xiàn)象,并提出解決辦法。    通過本書,讀者可以了解和掌握信息檢索可視化的現(xiàn)狀,獲悉主要學(xué)者的一些技術(shù)、理論發(fā)現(xiàn)和前沿進展,信息檢索可視化系統(tǒng)實現(xiàn)的一些充分的、有實用價值的細節(jié),以及研究這個領(lǐng)域所必須注意的問題。    本書可作為信息科學(xué)、計算機科學(xué)及相關(guān)學(xué)科的研究人員、從業(yè)者、系統(tǒng)設(shè)計者和分析者、網(wǎng)絡(luò)管理員、圖書管理員、教育者和研究生的參考資料。

作者簡介

作者:(美國)Jin Zhang 譯者:夏立新 陸偉 沈吟東

書籍目錄

譯者序中文版的前言序前言第1章  信息檢索與可視化  1.1  可視化    1.1.1  定義    1.1.2  科學(xué)可視化和信息可視化  1.2  信息檢索    1.2.1  瀏覽與提問搜索    1.2.2  微觀信息與宏觀信息    1.2.3  信息空間的空間特性    1.2.4  瀏覽的空間特性  1.3  可視化的感知與認知    1.3.1  感知    1.3.2  認知  1.4  信息檢索的可視化    1.4.1  基本原理    1.4.2  三種信息檢索可視化模式    1.4.3  建立一個信息檢索可視化模型  1.5  小結(jié)第2章  信息檢索基礎(chǔ)  2.1  向量空間模型  2.2  詞語加權(quán)法    2.2.1  停用詞    2.2.2  逆文獻頻率    2.2.3  薩爾頓詞語加權(quán)法    2.2.4  另一個詞語加權(quán)法    2.2.5  概率詞語加權(quán)法  2.3  相似性方法    2.3.1  內(nèi)積相似性方法    2.3.2  戴斯系數(shù)法    2.3.3  加卡德相似性方法    2.3.4  重合系數(shù)相似性方法    2.3.5  余弦相似法    2.3.6  距離相似法    2.3.7  集成角度-距離相似性方法    2.3.8  皮爾森參數(shù)γ相關(guān)性法  2.4  信息檢索(評價)模型    2.4.1  基于方向的檢索(評價)模型    2.4.2  基于距離的檢索(評價)模型    2.4.3  橢圓檢索(評價)模型    2.4.4  合取檢索(評價)模型    2.4.5  析取檢索模型    2.4.6  卡斯尼橢圓檢索(評價)模型  2.5  聚類算法    2.5.1  非分級聚類算法    2.5.2  分級聚類算法  2.6  檢索結(jié)果評價  2.7  小結(jié)第3章  多重參考點可視化模型  3.1  多重參考點  3.2  多重固定參考點模型  3.3  可移動多重參考點模型    3.3.1  原始VIBE算法描述    3.3.2  關(guān)于模型的討論  3.4  自動旋轉(zhuǎn)參考點模型    3.4.1  視覺空間的定義    3.4.2  參考點的旋轉(zhuǎn)  3.5  信息檢索的含義  3.6  小結(jié)第4章  基于歐幾里得空間特征的可視化模型  4.1  歐幾里得空間及其特征  4.2  信息檢索評價模型介紹  4.3  基于距離-角度的可視化模型    4.3.1  視覺空間(visual space)的定義    4.3.2  信息檢索評價模型的可視化  4.4  基于角度-角度的可視化模型    4.4.1  視覺空間的定義    4.4.2  信息檢索評價模型的可視化  4.5  基于距離-距離的可視化模型    4.5.1  視覺空間的定義    4.5.2  信息檢索評價模型的可視化  4.6  小結(jié)第5章  Kohonen自組織圖——一種人造神經(jīng)網(wǎng)絡(luò)  5.1  神經(jīng)網(wǎng)絡(luò)介紹    5.1.1  神經(jīng)網(wǎng)絡(luò)的定義    5.1.2  神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和特性  5.2  Kohonen自組織圖    5.2.1  Kohonen自組織圖結(jié)構(gòu)    5.2.2  SOM算法的學(xué)習(xí)過程    5.2.3  特征圖標識    5.2.4  SOM算法描述  5.3  SOM于信息檢索領(lǐng)域的意義  5.4  小結(jié)第6章  探路者關(guān)聯(lián)網(wǎng)絡(luò)  6.1  探路者關(guān)聯(lián)網(wǎng)絡(luò)的特性/性能和描述    6.1.1  探路者關(guān)聯(lián)網(wǎng)絡(luò)的定義及說明    6.1.2  算法的描述    6.1.3  圖布局法  6.2  信息檢索的含義    6.2.1  作者同被引分析    6.2.2  語詞關(guān)聯(lián)網(wǎng)絡(luò)    6.2.3  Hyperlink超級鏈接    6.2.4  探路者關(guān)聯(lián)網(wǎng)絡(luò)中的搜索  6.3  小結(jié)第7章  多維尺度法  7.1  多維尺度法簡介    7.1.1  經(jīng)典MDS算法    7.1.2  非計量MDS    7.1.3  計量MDS  7.2  MDS技術(shù)對信息檢索的啟示    7.2.1  顯示對象和對象之間的距離的定義    7.2.2  MDS顯示空間的開發(fā)    7.2.3  討論  7.3  小結(jié)第8章  因特網(wǎng)的信息可視化  8.1  引言    8.1.1  因特網(wǎng)的特征    8.1.2  因特網(wǎng)的信息組織和顯示的方法    8.1.3  因特網(wǎng)信息的利用    8.1.4  因特網(wǎng)的挑戰(zhàn)  8.2  因特網(wǎng)的信息可視化    8.2.1  因特網(wǎng)信息結(jié)構(gòu)的可視化    8.2.2  因特網(wǎng)信息查詢的可視化    8.2.3  網(wǎng)絡(luò)交通流量的可視化    8.2.4  聯(lián)機討論歷史記錄的可視化  8.3  小結(jié)第9章  信息可視化中的歧義性  9.1  信息可視化的歧義性及其影響    9.1.1  信息可視化中歧義性的原因    9.1.2  歧義信息可視化的影響  9.2  信息檢索可視化模型中的歧義性分析    9.2.1  歐幾里得空間特征為基礎(chǔ)的信息模型的歧義性    9.2.2  基于多參考點的信息可視化模型中的歧義性    9.2.3  探路者網(wǎng)絡(luò)中的歧義性    9.2.4  SOM中的歧義化    9.2.5  多維排列的歧義化  9.3  小結(jié)第10章  隱喻在信息可視化中的意義  10.1  隱喻的定義、基本要素和特征  10.2  隱喻的認知基礎(chǔ)  10.3  心智模型、隱喻和人機交互    10.3.1  人機交互中的隱喻    10.3.2  心智模型    10.3.3  HCI中的心智模型  10.4  信息可視化檢索中的隱喻    10.4.1  使用隱喻的基本原理    10.4.2  隱喻性信息檢索可視化環(huán)境  10.5  隱喻應(yīng)用的步驟和原則    10.5.1  隱喻應(yīng)用的步驟    10.5.2  設(shè)計良好的隱喻視覺信息檢索環(huán)境的建議  10.6  小結(jié)第11章  信息檢索可視化的基準和評價標準  11.1  信息檢索可視化的評價  11.2  基準和評價標準    11.2.1  評價標準的影響因素    11.2.2  開發(fā)評價基準的原則    11.2.3  評價標準的四種類型    11.2.4  基準的描述  11.3  小結(jié)第12章  后記  12.1  簡介  12.2  各種可視化模型的比較  12.3  問題  12.4  小結(jié)參考文獻中英文術(shù)語對照表

章節(jié)摘錄

插圖:廣泛存在于因特網(wǎng)、OPAC系統(tǒng)、數(shù)字圖書館以及其他形式的信息檢索系統(tǒng)中的數(shù)字信息正在以指數(shù)倍增長。每年大約要產(chǎn)生一百萬特字節(jié)(1TB一1024GB)的數(shù)據(jù),其中,99%的是以數(shù)字化形式存在(Keim,2001)。這些信息系統(tǒng)中的數(shù)據(jù)變得越來越復(fù)雜,更新速度也越來越快,在日常生活中正在被越來越多的人利用。當(dāng)具有不同背景、特性、能力、喜好和目的的用戶數(shù)顯著增長時,用戶的需求也開始變得更加多樣和復(fù)雜。因此,迫切需要一種更高效的信息檢索手段——這向當(dāng)前信息檢索系統(tǒng)中使用的傳統(tǒng)方法與技術(shù)提出了挑戰(zhàn)。在傳統(tǒng)的信息檢索系統(tǒng)中,信息檢索主要是基于關(guān)鍵詞查詢,并且,由于用戶無法控制內(nèi)部匹配過程,查詢過程是非連續(xù)的。傳統(tǒng)的信息檢索系統(tǒng)還存在一些固有缺陷:內(nèi)部匹配過程對用戶不透明,檢索結(jié)果以線性列表的形式顯示,一次可顯示的結(jié)果有限,文檔間的關(guān)系極少用圖示展現(xiàn),檢索環(huán)境缺乏供用戶瀏覽的交互機制等。這些固有缺陷使得傳統(tǒng)的信息檢索系統(tǒng)面對信息需求的極度復(fù)雜性與海量多維數(shù)據(jù)束手無策。當(dāng)前計算機已擁有高速運算能力和巨大存儲容量,進而擁有了強大的圖形處理能力。這些技術(shù)與成熟的現(xiàn)代信息檢索理論和人機交互理論相結(jié)合促生了信息可視化技術(shù)。為了克服傳統(tǒng)信息檢索系統(tǒng)固有的缺陷,信息可視化技術(shù)應(yīng)運而生。信息可視化是一個新興的領(lǐng)域,其主要目的是將信息形象化以方便與用戶交互。它通過視窗、圖標、菜單和定點裝置提供前所未有的交互能力。當(dāng)今計算機強大的圖形處理能力已使得這種復(fù)雜的可視化展示成為可能。因此,用于信息組織、表示、解釋和檢索,并且具有直觀性與交互性的新的信息可視化方法能夠洞察數(shù)據(jù)集內(nèi)部,獲取豐富的數(shù)據(jù)關(guān)聯(lián)和數(shù)據(jù)內(nèi)容,挖掘數(shù)據(jù)特點。這種信息檢索可視化方法使得人們能夠充分發(fā)揮自己的靈活性、創(chuàng)造力和想象力來搜尋信息。對于各種類型用戶——無論老少、無論是否有使用經(jīng)驗、無論是否有信息檢索專業(yè)知識、無論是否懂英語——真正優(yōu)秀的信息檢索可視化技術(shù)都應(yīng)該能夠滿足其需求。圖像是信息表達與交流的主要工具。在人類文明進程中,它一直貫穿于人類的智力活動中。早期的可視化展示可以追溯到14世紀甚至更早。當(dāng)時的宇宙圖中,地球處于宇宙的中心,由分別代表四種基本元素、七大行星、黃道十二宮和月相的同心圓圍繞著(cresques,1978)?;谟嬎銠C的可視化應(yīng)用幾乎是隨著現(xiàn)代計算機的發(fā)明而誕生的。可是,現(xiàn)代圖形理論卻是始于定量數(shù)據(jù)的可視化展示原理及理論的提出(Tufte,1983)。

編輯推薦

《信息檢索可視化》的讀者將通過此書更好地理解信息檢索可視化的現(xiàn)狀,獲悉主要學(xué)者的一些技術(shù)、理論發(fā)現(xiàn)和前沿進展,信息檢索可視化系統(tǒng)實現(xiàn)的一些充分的、有實用價值的細節(jié),以及這個領(lǐng)域的研究者所必須注意的問題。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    信息檢索可視化 PDF格式下載


用戶評論 (總計3條)

 
 

  •   不知道老外怎么想的,雖然模型是可視化的基礎(chǔ),不過只是模型數(shù)學(xué)公式不至于叫visualization吧
  •   內(nèi)容不錯,曾經(jīng)聽過一次作者的一次講座
  •   正在做聚類的可視化展示,這本書幫助很大。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7