XML文檔全文檢索的理論與方法

出版時(shí)間:2011-8  出版社:科學(xué)  作者:夏立新|主編:王偉軍  頁(yè)數(shù):171  
Tag標(biāo)簽:無(wú)  

內(nèi)容概要

  本書是《知識(shí)管理與知識(shí)服務(wù)研究》叢書之一。
  本書對(duì)XML全文檢索的有關(guān)問(wèn)題進(jìn)行了全面系統(tǒng)的研究,既有對(duì)其基本理論、方法、技術(shù)的論述,也有對(duì)其最新研究進(jìn)展的系統(tǒng)闡述。在深入分析文檔的描述方法、用戶的信息需求、檢索方法和用戶任務(wù)的基礎(chǔ)上,總結(jié)了XML語(yǔ)言在文檔描述、信息檢索等方面的優(yōu)勢(shì),研究了XML文檔的索引實(shí)現(xiàn)方法,并以檢索實(shí)驗(yàn)系統(tǒng)Okapi為例,探討了如何在傳統(tǒng)信息檢索系統(tǒng)上實(shí)現(xiàn)XML文檔的索引以支持XML檢索并保持與原系統(tǒng)的兼容性,開發(fā)了基于XML的全文檢索原型系統(tǒng)。
  本書可作為計(jì)算機(jī)科學(xué)與技術(shù)、信息管理與信息系統(tǒng)、情報(bào)學(xué)、圖書館學(xué)等專業(yè)的教材或教學(xué)參考書,也可供信息中心、情報(bào)研究所、圖書館等機(jī)構(gòu)的工作人員及廣大信息用戶學(xué)習(xí)參考。

作者簡(jiǎn)介

王偉軍,華中師范大學(xué)教授、博士生導(dǎo)師。
現(xiàn)任華中師范大學(xué)信息管理系副主任;華中師范大學(xué)教學(xué)委員會(huì)委員、學(xué)位評(píng)定委員會(huì)管理學(xué)分會(huì)委員、知識(shí)管理與知識(shí)服務(wù)研究中心主任;兼任教育部高等學(xué)校圖書館學(xué)科教學(xué)指導(dǎo)委員會(huì)委員,中國(guó)索引學(xué)會(huì)常務(wù)理事,中國(guó)社會(huì)科學(xué)情報(bào)學(xué)會(huì)理事,中國(guó)信息經(jīng)濟(jì)學(xué)會(huì)電子商務(wù)專業(yè)委員會(huì)副秘書長(zhǎng),湖北省電子商務(wù)學(xué)會(huì)常務(wù)理事、副秘書長(zhǎng),湖北省信息學(xué)會(huì)常務(wù)理事;《情報(bào)科學(xué)》、《評(píng)價(jià)與管理》、《湖北信息化》等雜志的編委和《情報(bào)資料工作》學(xué)術(shù)指導(dǎo)委員會(huì)委員;曾擔(dān)任第七屆IFIP電子商務(wù)、電子服務(wù)與電子社會(huì)(I3E2007)國(guó)際會(huì)議主席。2007年入選教育部新世紀(jì)優(yōu)秀人才支持計(jì)劃。
一直從事信息資源管理、知識(shí)管理與知識(shí)服務(wù)、電子商務(wù)等領(lǐng)域的教學(xué)和研究工作;公開發(fā)表學(xué)術(shù)論文80余篇,出版著作8部(含合著);近5年來(lái),主持或參與國(guó)家自然科學(xué)基金、國(guó)家社會(huì)科學(xué)基金、國(guó)家“863”計(jì)劃、教育部高等學(xué)校學(xué)科創(chuàng)新引智計(jì)劃、教育部人文社會(huì)科學(xué)研究和武漢市社會(huì)科學(xué)基金等10多項(xiàng)課題;曾榮獲湖北省社會(huì)科學(xué)優(yōu)秀成果一等獎(jiǎng)和三等獎(jiǎng)、湖北省自然科學(xué)優(yōu)秀學(xué)術(shù)論文三等獎(jiǎng)、第六屆全國(guó)多媒體課件大賽優(yōu)秀獎(jiǎng)、武漢市社會(huì)科學(xué)優(yōu)秀科研成果獎(jiǎng)等多項(xiàng)獎(jiǎng)勵(lì)。

書籍目錄

總序

第1章 緒論
 1.1 研究意義與研究背景
 1.2 國(guó)內(nèi)外研究現(xiàn)狀
  1.2.1 XML上下文的相關(guān)性研究
  1.2.2 重復(fù)元素的過(guò)濾
  1.2.3 元素大小的處理
 1.3 研究?jī)?nèi)容
 1.4 結(jié)構(gòu)安排
第2章 信息檢索研究概述
 2.1 信息檢索的基本概念
  2.1.1 信息檢索
  2.1.2 信息檢索方法
  2.1.3 信息檢索系統(tǒng)
  2.1.4 信息檢索入口
 2.2 文檔描述與用戶信息需求
  2.2.1 文檔描述中的索引理論
  2.2.2 文檔-索引詞二維矩陣
  2.2.3 索引詞的權(quán)重計(jì)算方法
  2.2.4 用戶信息需求
 2.3 信息檢索方法
  2.3.1 布爾模型
  2.3.2 向量空間模型
  2.3.3 概率模型
 2.4 信息檢索系統(tǒng)
  2.4.1 信息檢索系統(tǒng)構(gòu)成
  2.4.2 信息檢索原理
 2.5 用戶目標(biāo)與任務(wù)
  2.5.1 用戶目標(biāo)
  2.5.2 用戶目標(biāo)與任務(wù)層次
第3章 XML置標(biāo)語(yǔ)言
 3.1 文檔特征
  3.1.1 內(nèi)容特征
  3.1.2 結(jié)構(gòu)特征
  3.1.3 屬性特征
  3.1.4 布局特征
 3.2 文檔置標(biāo)與置標(biāo)語(yǔ)言
  3.2.1 特殊置標(biāo)和一般置標(biāo)
  3.2.2 通用置標(biāo)語(yǔ)言的發(fā)展
 3.3 XML文檔
  3.3.1 XML標(biāo)準(zhǔn)組成
  3.3.2 XML文檔規(guī)范
  3.3.3 XML文檔特征描述
  3.3.4 XML文檔組織結(jié)構(gòu)剖析
 3.4 良構(gòu)的XML文檔與XML名稱空間
  3.4.1 XML語(yǔ)法規(guī)則
  3.4.2 建立一個(gè)良構(gòu)的XML文檔
  3.4.3 良構(gòu)XML文檔中的錯(cuò)誤
  3.4.4 XML名稱空間
 3.5 XML文檔的運(yùn)行實(shí)例
  3.5.1 元素聲明規(guī)則
  3.5.2 屬性聲明規(guī)則
  3.5.3 實(shí)體聲明規(guī)則
  3.5.4 注釋聲明規(guī)則
 3.6 XML文檔的驗(yàn)證實(shí)例
  3.6.1 用DTD驗(yàn)證一個(gè)文檔
  3.6.2 用XMLSchema描述一個(gè)文檔
  3.6.3 RELAX NG技術(shù)
第4章 XML文檔的索引方法
 4.1 基于XML文檔的索引
  4.1.1 前序一后序節(jié)點(diǎn)標(biāo)號(hào)法
  4.1.2 擴(kuò)展的前序標(biāo)號(hào)法
  4.1.3 基于路徑的標(biāo)號(hào)法
  4.1.4 節(jié)點(diǎn)定義法
  4.1.5 XML文檔樹的節(jié)點(diǎn)編碼
  4.1.6 倒排索引
  4.1.7 結(jié)構(gòu)索引
  4.1.8 索引策略
 4.2 基于XML文檔的結(jié)構(gòu)索引分析
  4.2.1 結(jié)構(gòu)索引的方法及特點(diǎn)
  4.2.2 結(jié)構(gòu)索引的潛在優(yōu)勢(shì)
 4.3 基于XML文檔的索引機(jī)制的改良
第5章 XML信息檢索
 5.1 XML信息檢索的特點(diǎn)
 5.2 與XML相關(guān)的檢索方式
  5.2.1 XML信息檢索與XML數(shù)據(jù)庫(kù)查詢
  5.2.2 XML信息檢索與HTML文檔檢索
 5.3 XML查詢方法與查詢語(yǔ)言
  5.3.1 XPath路徑查詢語(yǔ)言
  5.3.2 XQuery查詢語(yǔ)言
  5.3.3 IR-Query,一種擴(kuò)展的XQuery查詢語(yǔ)言
 5.4 XML檢索查詢代數(shù)
  5.4.1 傳統(tǒng)關(guān)系代數(shù)表達(dá)式
  5.4.2 lAX查詢代數(shù)
  5.4.3 XML查詢操作符
  5.4.4 OrientXA查詢代數(shù)
 5.5 面向XML信息檢索的查詢模型
  5.5.1 基于簡(jiǎn)單關(guān)鍵字的查詢方式
  5.5.2 基于嚴(yán)格結(jié)構(gòu)匹配與關(guān)鍵字相結(jié)合的查詢模型
  5.5.3 基于非嚴(yán)格結(jié)構(gòu)匹配與關(guān)鍵字相結(jié)合的查詢模型
 5.6 XML信息檢索的評(píng)價(jià)
  5.6.1 檢索性能的評(píng)價(jià)
  5.6.2 XML信息檢索評(píng)價(jià)
  5.6.3 INEX檢索評(píng)價(jià)實(shí)驗(yàn)
第6章 基于傳統(tǒng)文本檢索系統(tǒng)的XML索引實(shí)現(xiàn)
 6.1 傳統(tǒng)文本檢索系統(tǒng)概況
 6.2 Okapi的索引結(jié)構(gòu)
 6.3 XML索引與實(shí)現(xiàn)
  6.3.1 XML文檔預(yù)處理
  6.3.2 路徑索引
  6.3.3 內(nèi)容索引
 6.4 實(shí)驗(yàn)評(píng)價(jià)
  6.4.1 XML數(shù)據(jù)集
  6.4.2 結(jié)果評(píng)價(jià)
第7章 基于XML的全文檢索原型系統(tǒng)
 7.1 基于中文XML文檔的全文檢索軟件的原型系統(tǒng)開發(fā)
  7.1.1 系統(tǒng)設(shè)計(jì)目標(biāo)
  7.1.2 全文檢索系統(tǒng)的實(shí)現(xiàn)平臺(tái)
  7.1.3 基于XML的全文檢索系統(tǒng)的功能模塊設(shè)計(jì)
  7.1.4 系統(tǒng)詳細(xì)設(shè)計(jì)方案
  7.1.5 XML文檔的解析
 7.2 為XML文檔建立全文索引
 7.3 XML文檔查詢
 7.4 基于XML的全文檢索模型說(shuō)明文檔
  7.4.1 系統(tǒng)配置
  7.4.2 運(yùn)行環(huán)境
  7.4.3 運(yùn)行說(shuō)明
第8章 結(jié)論
參考文獻(xiàn)
附錄

章節(jié)摘錄

版權(quán)頁(yè):插圖:信息檢索人口又稱檢索點(diǎn)或檢索標(biāo)識(shí),是指用以標(biāo)識(shí)信息的外部特征和內(nèi)部特征的屬性值的集合。檢索標(biāo)識(shí)是用戶作為檢索的出發(fā)點(diǎn)和依據(jù),用戶和信息檢索系統(tǒng)之間的交流必須有一定的檢索標(biāo)識(shí),否則會(huì)導(dǎo)致檢索失敗。檢索標(biāo)識(shí)包括主題詞、分類號(hào)、著者、標(biāo)題、機(jī)構(gòu)、代碼等,它們通常由人工賦予,或由計(jì)算機(jī)自動(dòng)生成。2.2 文檔描述與用戶信息需求無(wú)論是非線性結(jié)構(gòu)還是半結(jié)構(gòu)文檔,都是按一定結(jié)構(gòu)組織的相關(guān)記錄的集合。本小節(jié)本著從用戶信息需求的角度出發(fā),對(duì)信息檢索系統(tǒng)的邏輯視圖等涉及文檔描述的檢索問(wèn)題進(jìn)行了分析,在索引的理論基礎(chǔ)上,提出了文檔一索引語(yǔ)詞二維矩陣、文檔一索引語(yǔ)詞加權(quán)矩陣兩種文檔的描述方法,為XML文檔的索引與檢索問(wèn)題的研究提供了理論和方法的支持。

編輯推薦

《XML文檔全文檢索的理論與方法》為知識(shí)管理與知識(shí)服務(wù)研究之一。

圖書封面

圖書標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    XML文檔全文檢索的理論與方法 PDF格式下載


用戶評(píng)論 (總計(jì)2條)

 
 

  •   作為教學(xué)指導(dǎo)書 還不錯(cuò)
  •   還沒(méi)看完,理論性比較強(qiáng),是本專著。
 

250萬(wàn)本中文圖書簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7