出版時(shí)間:2009-6 出版社:科學(xué)出版社 作者:Jin Zhang 頁數(shù):233
Tag標(biāo)簽:無
前言
飛速增長的互聯(lián)網(wǎng)上動(dòng)態(tài)、多樣、異質(zhì)、復(fù)雜的信息和其他信息檢索系統(tǒng)給傳統(tǒng)的信息檢索技術(shù)和理論帶來了史無前例的挑戰(zhàn)。這些挑戰(zhàn)使人們對(duì)信息檢索提出了加強(qiáng)交互性、直觀性、有效性等要求,也使專家們必須集中精力尋找滿足用戶檢索相關(guān)信息的新方法。信息可視化技術(shù)可以在一個(gè)視覺的、明晰的、交互性的環(huán)境下論證數(shù)據(jù)之間的相關(guān)性,它已成為我們應(yīng)對(duì)挑戰(zhàn)的最大希望。信息可視化和信息檢索有著天然的聯(lián)系。事實(shí)上信息檢索就像一條線一樣貫穿著整個(gè)信息可視化系統(tǒng)。信息可視化向用戶提供獨(dú)特的方式去檢索信息,它可以把隱藏的信息用視覺的形式呈現(xiàn),并允許用戶以視覺形式進(jìn)行檢索。瀏覽作為一種強(qiáng)有力的信息檢索方式將在可視化環(huán)境中被充分應(yīng)用??梢暬夹g(shù)給信息檢索帶來了希望,從信息檢索的角度來看待信息可視化,最終將使信息檢索和信息可視化都受益。本書從理論和實(shí)際應(yīng)用方面,對(duì)信息檢索可視化領(lǐng)域最新進(jìn)展進(jìn)行了體系化的闡明,評(píng)價(jià)了這個(gè)領(lǐng)域主要的技術(shù)和方法,說明了信息檢索和信息可視化的理論關(guān)聯(lián),并介紹了信息檢索可視化的主要算法和模型。本書也說明了信息檢索可視化的一些重要的和普遍的問題,如在深度應(yīng)用中出現(xiàn)的難以評(píng)價(jià)性、不精確性以及隱喻性。此外,它深度探討了信息檢索可視化在網(wǎng)絡(luò)流量分析、網(wǎng)絡(luò)信息搜尋、瀏覽等領(lǐng)域的理論和實(shí)際應(yīng)用。在本書的結(jié)束部分,作者多角度比較了他所介紹的幾個(gè)信息檢索可視化模型。最后,本書探討了信息檢索可視化的重要問題和檢索領(lǐng)域以后探索的方向。本書的讀者將通過此書更好地理解信息檢索可視化的現(xiàn)狀,獲悉主要學(xué)者的一些技術(shù)、理論發(fā)現(xiàn)和前沿進(jìn)展,信息檢索可視化系統(tǒng)實(shí)現(xiàn)的一些充分的、有實(shí)用價(jià)值的細(xì)節(jié),以及這個(gè)領(lǐng)域的研究者所必須注意的問題。本書的結(jié)構(gòu)如下:第1章介紹了信息檢索可視化的一些基礎(chǔ)問題,如為什么信息可視化技術(shù)對(duì)于信息檢索非常關(guān)鍵;如何從查詢和瀏覽兩個(gè)方面加強(qiáng)信息檢索;什么是基礎(chǔ)的信息檢索可視化范例;在信息檢索中信息可視化的潛在應(yīng)用和影響是什么;什么是信息檢索可視化模型的基礎(chǔ)程序。第2章包含了信息檢索中一些基礎(chǔ)的概念和理論。這些概念和算法,如相似性方法、信息檢索模型、語詞加權(quán)算法等,都是后續(xù)章節(jié)中關(guān)于信息檢索可視化模型介紹的必要前提。把這些概念和理論放在一起組成一個(gè)章節(jié)不僅僅是為了避免在后續(xù)的章節(jié)中重復(fù)介紹,更是為了打好一個(gè)理論基礎(chǔ)。
內(nèi)容概要
本書從理論和實(shí)際應(yīng)用方面,對(duì)信息檢索可視化領(lǐng)域最新進(jìn)展進(jìn)行了系統(tǒng)的闡述,集中介紹了信息檢索可視化的基本原理及其結(jié)構(gòu)、方法和算法,較為系統(tǒng)地比較了多重參考點(diǎn)可視化模型(MRPBM)、基于歐幾里得空間特征的可視化模型(ESCBM)、探路者關(guān)聯(lián)網(wǎng)絡(luò)(PFNET)、多維尺度模型(MDS)、自組織圖模型(SOM)等五種主要的信息檢索可視化模型,討論了信息可視化系統(tǒng)的評(píng)估及信息可視化系統(tǒng)設(shè)計(jì)中人的行為,分析了信息可視化中的一些特有的歧義現(xiàn)象,并提出解決辦法。 通過本書,讀者可以了解和掌握信息檢索可視化的現(xiàn)狀,獲悉主要學(xué)者的一些技術(shù)、理論發(fā)現(xiàn)和前沿進(jìn)展,信息檢索可視化系統(tǒng)實(shí)現(xiàn)的一些充分的、有實(shí)用價(jià)值的細(xì)節(jié),以及研究這個(gè)領(lǐng)域所必須注意的問題。 本書可作為信息科學(xué)、計(jì)算機(jī)科學(xué)及相關(guān)學(xué)科的研究人員、從業(yè)者、系統(tǒng)設(shè)計(jì)者和分析者、網(wǎng)絡(luò)管理員、圖書管理員、教育者和研究生的參考資料。
作者簡介
作者:(美國)Jin Zhang 譯者:夏立新 陸偉 沈吟東
書籍目錄
譯者序中文版的前言序前言第1章 信息檢索與可視化 1.1 可視化 1.1.1 定義 1.1.2 科學(xué)可視化和信息可視化 1.2 信息檢索 1.2.1 瀏覽與提問搜索 1.2.2 微觀信息與宏觀信息 1.2.3 信息空間的空間特性 1.2.4 瀏覽的空間特性 1.3 可視化的感知與認(rèn)知 1.3.1 感知 1.3.2 認(rèn)知 1.4 信息檢索的可視化 1.4.1 基本原理 1.4.2 三種信息檢索可視化模式 1.4.3 建立一個(gè)信息檢索可視化模型 1.5 小結(jié)第2章 信息檢索基礎(chǔ) 2.1 向量空間模型 2.2 詞語加權(quán)法 2.2.1 停用詞 2.2.2 逆文獻(xiàn)頻率 2.2.3 薩爾頓詞語加權(quán)法 2.2.4 另一個(gè)詞語加權(quán)法 2.2.5 概率詞語加權(quán)法 2.3 相似性方法 2.3.1 內(nèi)積相似性方法 2.3.2 戴斯系數(shù)法 2.3.3 加卡德相似性方法 2.3.4 重合系數(shù)相似性方法 2.3.5 余弦相似法 2.3.6 距離相似法 2.3.7 集成角度-距離相似性方法 2.3.8 皮爾森參數(shù)γ相關(guān)性法 2.4 信息檢索(評(píng)價(jià))模型 2.4.1 基于方向的檢索(評(píng)價(jià))模型 2.4.2 基于距離的檢索(評(píng)價(jià))模型 2.4.3 橢圓檢索(評(píng)價(jià))模型 2.4.4 合取檢索(評(píng)價(jià))模型 2.4.5 析取檢索模型 2.4.6 卡斯尼橢圓檢索(評(píng)價(jià))模型 2.5 聚類算法 2.5.1 非分級(jí)聚類算法 2.5.2 分級(jí)聚類算法 2.6 檢索結(jié)果評(píng)價(jià) 2.7 小結(jié)第3章 多重參考點(diǎn)可視化模型 3.1 多重參考點(diǎn) 3.2 多重固定參考點(diǎn)模型 3.3 可移動(dòng)多重參考點(diǎn)模型 3.3.1 原始VIBE算法描述 3.3.2 關(guān)于模型的討論 3.4 自動(dòng)旋轉(zhuǎn)參考點(diǎn)模型 3.4.1 視覺空間的定義 3.4.2 參考點(diǎn)的旋轉(zhuǎn) 3.5 信息檢索的含義 3.6 小結(jié)第4章 基于歐幾里得空間特征的可視化模型 4.1 歐幾里得空間及其特征 4.2 信息檢索評(píng)價(jià)模型介紹 4.3 基于距離-角度的可視化模型 4.3.1 視覺空間(visual space)的定義 4.3.2 信息檢索評(píng)價(jià)模型的可視化 4.4 基于角度-角度的可視化模型 4.4.1 視覺空間的定義 4.4.2 信息檢索評(píng)價(jià)模型的可視化 4.5 基于距離-距離的可視化模型 4.5.1 視覺空間的定義 4.5.2 信息檢索評(píng)價(jià)模型的可視化 4.6 小結(jié)第5章 Kohonen自組織圖——一種人造神經(jīng)網(wǎng)絡(luò) 5.1 神經(jīng)網(wǎng)絡(luò)介紹 5.1.1 神經(jīng)網(wǎng)絡(luò)的定義 5.1.2 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和特性 5.2 Kohonen自組織圖 5.2.1 Kohonen自組織圖結(jié)構(gòu) 5.2.2 SOM算法的學(xué)習(xí)過程 5.2.3 特征圖標(biāo)識(shí) 5.2.4 SOM算法描述 5.3 SOM于信息檢索領(lǐng)域的意義 5.4 小結(jié)第6章 探路者關(guān)聯(lián)網(wǎng)絡(luò) 6.1 探路者關(guān)聯(lián)網(wǎng)絡(luò)的特性/性能和描述 6.1.1 探路者關(guān)聯(lián)網(wǎng)絡(luò)的定義及說明 6.1.2 算法的描述 6.1.3 圖布局法 6.2 信息檢索的含義 6.2.1 作者同被引分析 6.2.2 語詞關(guān)聯(lián)網(wǎng)絡(luò) 6.2.3 Hyperlink超級(jí)鏈接 6.2.4 探路者關(guān)聯(lián)網(wǎng)絡(luò)中的搜索 6.3 小結(jié)第7章 多維尺度法 7.1 多維尺度法簡介 7.1.1 經(jīng)典MDS算法 7.1.2 非計(jì)量MDS 7.1.3 計(jì)量MDS 7.2 MDS技術(shù)對(duì)信息檢索的啟示 7.2.1 顯示對(duì)象和對(duì)象之間的距離的定義 7.2.2 MDS顯示空間的開發(fā) 7.2.3 討論 7.3 小結(jié)第8章 因特網(wǎng)的信息可視化 8.1 引言 8.1.1 因特網(wǎng)的特征 8.1.2 因特網(wǎng)的信息組織和顯示的方法 8.1.3 因特網(wǎng)信息的利用 8.1.4 因特網(wǎng)的挑戰(zhàn) 8.2 因特網(wǎng)的信息可視化 8.2.1 因特網(wǎng)信息結(jié)構(gòu)的可視化 8.2.2 因特網(wǎng)信息查詢的可視化 8.2.3 網(wǎng)絡(luò)交通流量的可視化 8.2.4 聯(lián)機(jī)討論歷史記錄的可視化 8.3 小結(jié)第9章 信息可視化中的歧義性 9.1 信息可視化的歧義性及其影響 9.1.1 信息可視化中歧義性的原因 9.1.2 歧義信息可視化的影響 9.2 信息檢索可視化模型中的歧義性分析 9.2.1 歐幾里得空間特征為基礎(chǔ)的信息模型的歧義性 9.2.2 基于多參考點(diǎn)的信息可視化模型中的歧義性 9.2.3 探路者網(wǎng)絡(luò)中的歧義性 9.2.4 SOM中的歧義化 9.2.5 多維排列的歧義化 9.3 小結(jié)第10章 隱喻在信息可視化中的意義 10.1 隱喻的定義、基本要素和特征 10.2 隱喻的認(rèn)知基礎(chǔ) 10.3 心智模型、隱喻和人機(jī)交互 10.3.1 人機(jī)交互中的隱喻 10.3.2 心智模型 10.3.3 HCI中的心智模型 10.4 信息可視化檢索中的隱喻 10.4.1 使用隱喻的基本原理 10.4.2 隱喻性信息檢索可視化環(huán)境 10.5 隱喻應(yīng)用的步驟和原則 10.5.1 隱喻應(yīng)用的步驟 10.5.2 設(shè)計(jì)良好的隱喻視覺信息檢索環(huán)境的建議 10.6 小結(jié)第11章 信息檢索可視化的基準(zhǔn)和評(píng)價(jià)標(biāo)準(zhǔn) 11.1 信息檢索可視化的評(píng)價(jià) 11.2 基準(zhǔn)和評(píng)價(jià)標(biāo)準(zhǔn) 11.2.1 評(píng)價(jià)標(biāo)準(zhǔn)的影響因素 11.2.2 開發(fā)評(píng)價(jià)基準(zhǔn)的原則 11.2.3 評(píng)價(jià)標(biāo)準(zhǔn)的四種類型 11.2.4 基準(zhǔn)的描述 11.3 小結(jié)第12章 后記 12.1 簡介 12.2 各種可視化模型的比較 12.3 問題 12.4 小結(jié)參考文獻(xiàn)中英文術(shù)語對(duì)照表
章節(jié)摘錄
插圖:廣泛存在于因特網(wǎng)、OPAC系統(tǒng)、數(shù)字圖書館以及其他形式的信息檢索系統(tǒng)中的數(shù)字信息正在以指數(shù)倍增長。每年大約要產(chǎn)生一百萬特字節(jié)(1TB一1024GB)的數(shù)據(jù),其中,99%的是以數(shù)字化形式存在(Keim,2001)。這些信息系統(tǒng)中的數(shù)據(jù)變得越來越復(fù)雜,更新速度也越來越快,在日常生活中正在被越來越多的人利用。當(dāng)具有不同背景、特性、能力、喜好和目的的用戶數(shù)顯著增長時(shí),用戶的需求也開始變得更加多樣和復(fù)雜。因此,迫切需要一種更高效的信息檢索手段——這向當(dāng)前信息檢索系統(tǒng)中使用的傳統(tǒng)方法與技術(shù)提出了挑戰(zhàn)。在傳統(tǒng)的信息檢索系統(tǒng)中,信息檢索主要是基于關(guān)鍵詞查詢,并且,由于用戶無法控制內(nèi)部匹配過程,查詢過程是非連續(xù)的。傳統(tǒng)的信息檢索系統(tǒng)還存在一些固有缺陷:內(nèi)部匹配過程對(duì)用戶不透明,檢索結(jié)果以線性列表的形式顯示,一次可顯示的結(jié)果有限,文檔間的關(guān)系極少用圖示展現(xiàn),檢索環(huán)境缺乏供用戶瀏覽的交互機(jī)制等。這些固有缺陷使得傳統(tǒng)的信息檢索系統(tǒng)面對(duì)信息需求的極度復(fù)雜性與海量多維數(shù)據(jù)束手無策。當(dāng)前計(jì)算機(jī)已擁有高速運(yùn)算能力和巨大存儲(chǔ)容量,進(jìn)而擁有了強(qiáng)大的圖形處理能力。這些技術(shù)與成熟的現(xiàn)代信息檢索理論和人機(jī)交互理論相結(jié)合促生了信息可視化技術(shù)。為了克服傳統(tǒng)信息檢索系統(tǒng)固有的缺陷,信息可視化技術(shù)應(yīng)運(yùn)而生。信息可視化是一個(gè)新興的領(lǐng)域,其主要目的是將信息形象化以方便與用戶交互。它通過視窗、圖標(biāo)、菜單和定點(diǎn)裝置提供前所未有的交互能力。當(dāng)今計(jì)算機(jī)強(qiáng)大的圖形處理能力已使得這種復(fù)雜的可視化展示成為可能。因此,用于信息組織、表示、解釋和檢索,并且具有直觀性與交互性的新的信息可視化方法能夠洞察數(shù)據(jù)集內(nèi)部,獲取豐富的數(shù)據(jù)關(guān)聯(lián)和數(shù)據(jù)內(nèi)容,挖掘數(shù)據(jù)特點(diǎn)。這種信息檢索可視化方法使得人們能夠充分發(fā)揮自己的靈活性、創(chuàng)造力和想象力來搜尋信息。對(duì)于各種類型用戶——無論老少、無論是否有使用經(jīng)驗(yàn)、無論是否有信息檢索專業(yè)知識(shí)、無論是否懂英語——真正優(yōu)秀的信息檢索可視化技術(shù)都應(yīng)該能夠滿足其需求。圖像是信息表達(dá)與交流的主要工具。在人類文明進(jìn)程中,它一直貫穿于人類的智力活動(dòng)中。早期的可視化展示可以追溯到14世紀(jì)甚至更早。當(dāng)時(shí)的宇宙圖中,地球處于宇宙的中心,由分別代表四種基本元素、七大行星、黃道十二宮和月相的同心圓圍繞著(cresques,1978)?;谟?jì)算機(jī)的可視化應(yīng)用幾乎是隨著現(xiàn)代計(jì)算機(jī)的發(fā)明而誕生的??墒?,現(xiàn)代圖形理論卻是始于定量數(shù)據(jù)的可視化展示原理及理論的提出(Tufte,1983)。
編輯推薦
《信息檢索可視化》的讀者將通過此書更好地理解信息檢索可視化的現(xiàn)狀,獲悉主要學(xué)者的一些技術(shù)、理論發(fā)現(xiàn)和前沿進(jìn)展,信息檢索可視化系統(tǒng)實(shí)現(xiàn)的一些充分的、有實(shí)用價(jià)值的細(xì)節(jié),以及這個(gè)領(lǐng)域的研究者所必須注意的問題。
圖書封面
圖書標(biāo)簽Tags
無
評(píng)論、評(píng)分、閱讀與下載