XML文檔全文檢索的理論與方法

出版時間:2011-8  出版社:科學(xué)  作者:夏立新|主編:王偉軍  頁數(shù):171  
Tag標(biāo)簽:無  

內(nèi)容概要

  本書是《知識管理與知識服務(wù)研究》叢書之一。
  本書對XML全文檢索的有關(guān)問題進(jìn)行了全面系統(tǒng)的研究,既有對其基本理論、方法、技術(shù)的論述,也有對其最新研究進(jìn)展的系統(tǒng)闡述。在深入分析文檔的描述方法、用戶的信息需求、檢索方法和用戶任務(wù)的基礎(chǔ)上,總結(jié)了XML語言在文檔描述、信息檢索等方面的優(yōu)勢,研究了XML文檔的索引實現(xiàn)方法,并以檢索實驗系統(tǒng)Okapi為例,探討了如何在傳統(tǒng)信息檢索系統(tǒng)上實現(xiàn)XML文檔的索引以支持XML檢索并保持與原系統(tǒng)的兼容性,開發(fā)了基于XML的全文檢索原型系統(tǒng)。
  本書可作為計算機(jī)科學(xué)與技術(shù)、信息管理與信息系統(tǒng)、情報學(xué)、圖書館學(xué)等專業(yè)的教材或教學(xué)參考書,也可供信息中心、情報研究所、圖書館等機(jī)構(gòu)的工作人員及廣大信息用戶學(xué)習(xí)參考。

作者簡介

王偉軍,華中師范大學(xué)教授、博士生導(dǎo)師。
現(xiàn)任華中師范大學(xué)信息管理系副主任;華中師范大學(xué)教學(xué)委員會委員、學(xué)位評定委員會管理學(xué)分會委員、知識管理與知識服務(wù)研究中心主任;兼任教育部高等學(xué)校圖書館學(xué)科教學(xué)指導(dǎo)委員會委員,中國索引學(xué)會常務(wù)理事,中國社會科學(xué)情報學(xué)會理事,中國信息經(jīng)濟(jì)學(xué)會電子商務(wù)專業(yè)委員會副秘書長,湖北省電子商務(wù)學(xué)會常務(wù)理事、副秘書長,湖北省信息學(xué)會常務(wù)理事;《情報科學(xué)》、《評價與管理》、《湖北信息化》等雜志的編委和《情報資料工作》學(xué)術(shù)指導(dǎo)委員會委員;曾擔(dān)任第七屆IFIP電子商務(wù)、電子服務(wù)與電子社會(I3E2007)國際會議主席。2007年入選教育部新世紀(jì)優(yōu)秀人才支持計劃。
一直從事信息資源管理、知識管理與知識服務(wù)、電子商務(wù)等領(lǐng)域的教學(xué)和研究工作;公開發(fā)表學(xué)術(shù)論文80余篇,出版著作8部(含合著);近5年來,主持或參與國家自然科學(xué)基金、國家社會科學(xué)基金、國家“863”計劃、教育部高等學(xué)校學(xué)科創(chuàng)新引智計劃、教育部人文社會科學(xué)研究和武漢市社會科學(xué)基金等10多項課題;曾榮獲湖北省社會科學(xué)優(yōu)秀成果一等獎和三等獎、湖北省自然科學(xué)優(yōu)秀學(xué)術(shù)論文三等獎、第六屆全國多媒體課件大賽優(yōu)秀獎、武漢市社會科學(xué)優(yōu)秀科研成果獎等多項獎勵。

書籍目錄

總序

第1章 緒論
 1.1 研究意義與研究背景
 1.2 國內(nèi)外研究現(xiàn)狀
  1.2.1 XML上下文的相關(guān)性研究
  1.2.2 重復(fù)元素的過濾
  1.2.3 元素大小的處理
 1.3 研究內(nèi)容
 1.4 結(jié)構(gòu)安排
第2章 信息檢索研究概述
 2.1 信息檢索的基本概念
  2.1.1 信息檢索
  2.1.2 信息檢索方法
  2.1.3 信息檢索系統(tǒng)
  2.1.4 信息檢索入口
 2.2 文檔描述與用戶信息需求
  2.2.1 文檔描述中的索引理論
  2.2.2 文檔-索引詞二維矩陣
  2.2.3 索引詞的權(quán)重計算方法
  2.2.4 用戶信息需求
 2.3 信息檢索方法
  2.3.1 布爾模型
  2.3.2 向量空間模型
  2.3.3 概率模型
 2.4 信息檢索系統(tǒng)
  2.4.1 信息檢索系統(tǒng)構(gòu)成
  2.4.2 信息檢索原理
 2.5 用戶目標(biāo)與任務(wù)
  2.5.1 用戶目標(biāo)
  2.5.2 用戶目標(biāo)與任務(wù)層次
第3章 XML置標(biāo)語言
 3.1 文檔特征
  3.1.1 內(nèi)容特征
  3.1.2 結(jié)構(gòu)特征
  3.1.3 屬性特征
  3.1.4 布局特征
 3.2 文檔置標(biāo)與置標(biāo)語言
  3.2.1 特殊置標(biāo)和一般置標(biāo)
  3.2.2 通用置標(biāo)語言的發(fā)展
 3.3 XML文檔
  3.3.1 XML標(biāo)準(zhǔn)組成
  3.3.2 XML文檔規(guī)范
  3.3.3 XML文檔特征描述
  3.3.4 XML文檔組織結(jié)構(gòu)剖析
 3.4 良構(gòu)的XML文檔與XML名稱空間
  3.4.1 XML語法規(guī)則
  3.4.2 建立一個良構(gòu)的XML文檔
  3.4.3 良構(gòu)XML文檔中的錯誤
  3.4.4 XML名稱空間
 3.5 XML文檔的運(yùn)行實例
  3.5.1 元素聲明規(guī)則
  3.5.2 屬性聲明規(guī)則
  3.5.3 實體聲明規(guī)則
  3.5.4 注釋聲明規(guī)則
 3.6 XML文檔的驗證實例
  3.6.1 用DTD驗證一個文檔
  3.6.2 用XMLSchema描述一個文檔
  3.6.3 RELAX NG技術(shù)
第4章 XML文檔的索引方法
 4.1 基于XML文檔的索引
  4.1.1 前序一后序節(jié)點(diǎn)標(biāo)號法
  4.1.2 擴(kuò)展的前序標(biāo)號法
  4.1.3 基于路徑的標(biāo)號法
  4.1.4 節(jié)點(diǎn)定義法
  4.1.5 XML文檔樹的節(jié)點(diǎn)編碼
  4.1.6 倒排索引
  4.1.7 結(jié)構(gòu)索引
  4.1.8 索引策略
 4.2 基于XML文檔的結(jié)構(gòu)索引分析
  4.2.1 結(jié)構(gòu)索引的方法及特點(diǎn)
  4.2.2 結(jié)構(gòu)索引的潛在優(yōu)勢
 4.3 基于XML文檔的索引機(jī)制的改良
第5章 XML信息檢索
 5.1 XML信息檢索的特點(diǎn)
 5.2 與XML相關(guān)的檢索方式
  5.2.1 XML信息檢索與XML數(shù)據(jù)庫查詢
  5.2.2 XML信息檢索與HTML文檔檢索
 5.3 XML查詢方法與查詢語言
  5.3.1 XPath路徑查詢語言
  5.3.2 XQuery查詢語言
  5.3.3 IR-Query,一種擴(kuò)展的XQuery查詢語言
 5.4 XML檢索查詢代數(shù)
  5.4.1 傳統(tǒng)關(guān)系代數(shù)表達(dá)式
  5.4.2 lAX查詢代數(shù)
  5.4.3 XML查詢操作符
  5.4.4 OrientXA查詢代數(shù)
 5.5 面向XML信息檢索的查詢模型
  5.5.1 基于簡單關(guān)鍵字的查詢方式
  5.5.2 基于嚴(yán)格結(jié)構(gòu)匹配與關(guān)鍵字相結(jié)合的查詢模型
  5.5.3 基于非嚴(yán)格結(jié)構(gòu)匹配與關(guān)鍵字相結(jié)合的查詢模型
 5.6 XML信息檢索的評價
  5.6.1 檢索性能的評價
  5.6.2 XML信息檢索評價
  5.6.3 INEX檢索評價實驗
第6章 基于傳統(tǒng)文本檢索系統(tǒng)的XML索引實現(xiàn)
 6.1 傳統(tǒng)文本檢索系統(tǒng)概況
 6.2 Okapi的索引結(jié)構(gòu)
 6.3 XML索引與實現(xiàn)
  6.3.1 XML文檔預(yù)處理
  6.3.2 路徑索引
  6.3.3 內(nèi)容索引
 6.4 實驗評價
  6.4.1 XML數(shù)據(jù)集
  6.4.2 結(jié)果評價
第7章 基于XML的全文檢索原型系統(tǒng)
 7.1 基于中文XML文檔的全文檢索軟件的原型系統(tǒng)開發(fā)
  7.1.1 系統(tǒng)設(shè)計目標(biāo)
  7.1.2 全文檢索系統(tǒng)的實現(xiàn)平臺
  7.1.3 基于XML的全文檢索系統(tǒng)的功能模塊設(shè)計
  7.1.4 系統(tǒng)詳細(xì)設(shè)計方案
  7.1.5 XML文檔的解析
 7.2 為XML文檔建立全文索引
 7.3 XML文檔查詢
 7.4 基于XML的全文檢索模型說明文檔
  7.4.1 系統(tǒng)配置
  7.4.2 運(yùn)行環(huán)境
  7.4.3 運(yùn)行說明
第8章 結(jié)論
參考文獻(xiàn)
附錄

章節(jié)摘錄

版權(quán)頁:插圖:信息檢索人口又稱檢索點(diǎn)或檢索標(biāo)識,是指用以標(biāo)識信息的外部特征和內(nèi)部特征的屬性值的集合。檢索標(biāo)識是用戶作為檢索的出發(fā)點(diǎn)和依據(jù),用戶和信息檢索系統(tǒng)之間的交流必須有一定的檢索標(biāo)識,否則會導(dǎo)致檢索失敗。檢索標(biāo)識包括主題詞、分類號、著者、標(biāo)題、機(jī)構(gòu)、代碼等,它們通常由人工賦予,或由計算機(jī)自動生成。2.2 文檔描述與用戶信息需求無論是非線性結(jié)構(gòu)還是半結(jié)構(gòu)文檔,都是按一定結(jié)構(gòu)組織的相關(guān)記錄的集合。本小節(jié)本著從用戶信息需求的角度出發(fā),對信息檢索系統(tǒng)的邏輯視圖等涉及文檔描述的檢索問題進(jìn)行了分析,在索引的理論基礎(chǔ)上,提出了文檔一索引語詞二維矩陣、文檔一索引語詞加權(quán)矩陣兩種文檔的描述方法,為XML文檔的索引與檢索問題的研究提供了理論和方法的支持。

編輯推薦

《XML文檔全文檢索的理論與方法》為知識管理與知識服務(wù)研究之一。

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    XML文檔全文檢索的理論與方法 PDF格式下載


用戶評論 (總計2條)

 
 

  •   作為教學(xué)指導(dǎo)書 還不錯
  •   還沒看完,理論性比較強(qiáng),是本專著。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號-7