語(yǔ)義網(wǎng)數(shù)據(jù)管理技術(shù)及應(yīng)用

出版時(shí)間:2010-2  出版社:科學(xué)出版社  作者:金海,袁平鵬 著  頁(yè)數(shù):304  
Tag標(biāo)簽:無(wú)  

前言

  國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃項(xiàng)目“語(yǔ)義網(wǎng)格的基礎(chǔ)理論、模型與方法研究”從2003年開始圍繞“規(guī)范重構(gòu),語(yǔ)義互聯(lián),智能聚融”這三個(gè)科學(xué)問題系統(tǒng)地探索了未來(lái)互聯(lián)環(huán)境的語(yǔ)義基礎(chǔ)問題,取得了一系列成果,本書是其中的重要成果之一?! ∽詮挠?jì)算機(jī)誕生以來(lái),數(shù)據(jù)管理一直是計(jì)算機(jī)科學(xué)的核心問題之一。特別是隨著信息技術(shù)的快速發(fā)展與普及,個(gè)人與社會(huì)每時(shí)每刻都在大量產(chǎn)生數(shù)據(jù)。人類將生活在一個(gè)充滿數(shù)據(jù)的世界里。如何對(duì)海量數(shù)據(jù)進(jìn)行有效管理就成為一個(gè)重要的研究問題?! ∫獙?shí)現(xiàn)海量數(shù)據(jù)的有效管理首先要解決語(yǔ)義問題。有效利用海量數(shù)據(jù)更加依賴語(yǔ)義問題的解決。計(jì)算機(jī)科學(xué)乃至信息科學(xué)的許多問題在本質(zhì)上都可以歸結(jié)為語(yǔ)義問題。雖然人們自覺不自覺地都在使用語(yǔ)義,但不同的領(lǐng)域?qū)φZ(yǔ)義有不同的認(rèn)識(shí)。例如,語(yǔ)義網(wǎng)研究領(lǐng)域希望對(duì)萬(wàn)維網(wǎng)中的數(shù)據(jù)增加機(jī)器可理解的語(yǔ)義,以使機(jī)器能快速、準(zhǔn)確地從萬(wàn)維網(wǎng)上獲取全面有用的信息并進(jìn)行自動(dòng)處理。但大量加上標(biāo)注的數(shù)據(jù)如何進(jìn)行管理就成為了一個(gè)新的問題。傳統(tǒng)的數(shù)據(jù)庫(kù)模型難以適應(yīng)如今的網(wǎng)絡(luò)數(shù)據(jù)管理,從而研究規(guī)范組織的語(yǔ)義網(wǎng)數(shù)據(jù)模型就成為問題的核心?! ≡摃Y(jié)合作者的研究體會(huì),吸收了新的技術(shù)和方法,大跨度地闡述了語(yǔ)義數(shù)據(jù)管理的技術(shù)和研究問題,涉及諸如數(shù)據(jù)模型、抽取、分類、存儲(chǔ)、檢索、呈現(xiàn)等。適應(yīng)了語(yǔ)義網(wǎng)數(shù)據(jù)管理開發(fā)、應(yīng)用和研究的需要?! ≡摃鴥?nèi)容豐富,希望讀者能從中獲得對(duì)語(yǔ)義數(shù)據(jù)管理的知識(shí),對(duì)相關(guān)研究有所啟示。故向讀者鄭重推薦。

內(nèi)容概要

  萬(wàn)維網(wǎng)已經(jīng)深刻影響到社會(huì)生活的各個(gè)方面?!墩Z(yǔ)義網(wǎng)數(shù)據(jù)管理技術(shù)及應(yīng)用》圍繞Web科學(xué)的核心問題之一——數(shù)據(jù)管理技術(shù)進(jìn)行闡述。首先,介紹了語(yǔ)義網(wǎng)的意義及語(yǔ)義網(wǎng)的標(biāo)準(zhǔn)規(guī)范;然后,研究了語(yǔ)義數(shù)據(jù)模型及存儲(chǔ)技術(shù),以實(shí)現(xiàn)語(yǔ)義數(shù)據(jù)的高效存儲(chǔ)、快速查詢和動(dòng)態(tài)添加。由于現(xiàn)實(shí)中的數(shù)據(jù)通常為半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),為了從中獲取語(yǔ)義數(shù)據(jù),《語(yǔ)義網(wǎng)數(shù)據(jù)管理技術(shù)及應(yīng)用》介紹了信息抽取技術(shù)、數(shù)據(jù)分類技術(shù)。在此基礎(chǔ)上,介紹了語(yǔ)義數(shù)據(jù)檢索、語(yǔ)義數(shù)據(jù)可視化技術(shù),以便為用戶提供高質(zhì)量的檢索結(jié)果,并向用戶可視化地呈現(xiàn)豐富的數(shù)據(jù)間語(yǔ)義關(guān)聯(lián)。最后,介紹了一些語(yǔ)義網(wǎng)應(yīng)用系統(tǒng)?!  墩Z(yǔ)義網(wǎng)數(shù)據(jù)管理技術(shù)及應(yīng)用》可供計(jì)算機(jī)科學(xué)與技術(shù)、模式識(shí)別等相關(guān)專業(yè)的研究人員、工程技術(shù)人員、教師、研究生和本科生學(xué)習(xí)參考。

作者簡(jiǎn)介

袁平鵬,博士,副教授,中國(guó)計(jì)算機(jī)學(xué)會(huì)高級(jí)會(huì)員,1972年生.2002年于浙江大學(xué)獲得工學(xué)博士學(xué)位。擔(dān)任多個(gè)國(guó)內(nèi)外期刊與學(xué)術(shù)會(huì)議審稿人.湖北省創(chuàng)新群體主要成員之一。主要從事語(yǔ)義網(wǎng)、分布式系統(tǒng)等方面的研究。在國(guó)內(nèi)外發(fā)表學(xué)術(shù)論文40余篇.其中被SCI、EI等收錄20余篇次。獲得國(guó)

書籍目錄

序前言第一章 緒論 1.1 語(yǔ)義網(wǎng)及其面臨的挑戰(zhàn) 1.2 與web1.0和Web2.0的區(qū)別 1.3 語(yǔ)義網(wǎng)體系結(jié)構(gòu) 1.4 語(yǔ)義網(wǎng)規(guī)范  1.4.1 資源描述框架  1.4.2 RDFS/OWL  1.4.3 SPARQL  1.4.4 GRDDL  1.4.5 RDFa 1.5 本章小結(jié) 參考文獻(xiàn)第二章  語(yǔ)義數(shù)據(jù)模型 2.1 數(shù)據(jù)模型簡(jiǎn)介  2.1.1 語(yǔ)義及數(shù)據(jù)模型  2.1.2 語(yǔ)義數(shù)據(jù)模型特征  2.1.3 語(yǔ)義數(shù)據(jù)模型分類 2.2 邏輯及物理數(shù)據(jù)模型  2.2.1 層次和網(wǎng)狀數(shù)據(jù)模型  2.2.2 關(guān)系數(shù)據(jù)模型  2.2.3 面向?qū)ο蟮臄?shù)據(jù)模型  2.2.4 模糊語(yǔ)義模型  2.2.5 圖模型 2.3 概念數(shù)據(jù)模型  2.3.1 實(shí)體一關(guān)系模型  2.3.2 RM/T  2.3.3 SDM  2.3.4 資源空間模型及語(yǔ)義鏈網(wǎng)絡(luò) 2.4 主動(dòng)語(yǔ)義數(shù)據(jù)模型  2.4.1 主動(dòng)語(yǔ)義數(shù)據(jù)模型概述  2.4.2 事件模型研究現(xiàn)狀  2.4.3 FEM  2.4.4 事件探測(cè) 2.5 本章小結(jié) 參考文獻(xiàn)第三章  語(yǔ)義數(shù)據(jù)抽取 3.1 信息抽取技術(shù)簡(jiǎn)介  3.1.1 國(guó)內(nèi)外研究現(xiàn)狀  3.1.2 信息抽取技術(shù)分類 3.2 科技文獻(xiàn)元數(shù)據(jù)抽取  3.2.1 科技文獻(xiàn)特征  3.2.2 信息抽取預(yù)處理  3.2.3 基于模板匹配的頭部信息抽取  3.2.4 基于統(tǒng)計(jì)的尾部信息抽取  3.2.5 信息封裝 3.3 科技文獻(xiàn)信息抽取系統(tǒng)及其性能評(píng)價(jià)  3.3.1 科技文獻(xiàn)信息抽取系統(tǒng)  3.3.2 評(píng)價(jià)指標(biāo)  3.3.3 實(shí)驗(yàn)結(jié)果及分析 3.4 語(yǔ)義數(shù)據(jù)清理  3.4.1 語(yǔ)義數(shù)據(jù)清理概述  3.4.2 歧義實(shí)體的識(shí)別  3.4.3 重復(fù)數(shù)據(jù)的發(fā)現(xiàn) 3.5 本章小結(jié) 參考文獻(xiàn)第四章  數(shù)據(jù)分類 4.1 數(shù)據(jù)分類意義 4.2 研究現(xiàn)狀  4.2.1 傳統(tǒng)文本分類  4.2.2 層次分類  4.2.3 基于知識(shí)的分類 4.3 多類別文本自動(dòng)分類方法  4.3.1 支持向量機(jī)分類方法  4.3.2 k近鄰分類方法  4.3.3 多類別單標(biāo)簽分類方法MSVM-kNN  4.3.4 多類別多標(biāo)簽分類方法 4.4 多類別文本分類實(shí)現(xiàn)技術(shù)  4.4.1 文獻(xiàn)預(yù)處理  4.4.2 特征降維  4.4.3 權(quán)重計(jì)算  4.4.4 分類器設(shè)計(jì) 4.5 多類別分類方法性能評(píng)價(jià)  4.6 本章小結(jié) 參考文獻(xiàn)第五章  語(yǔ)義網(wǎng)數(shù)據(jù)存儲(chǔ)技術(shù) 5.1 語(yǔ)義網(wǎng)數(shù)據(jù)存儲(chǔ)技術(shù)現(xiàn)狀  5.1.1 RDF數(shù)據(jù)模型  5.1.2 RDF存儲(chǔ)結(jié)構(gòu)  5.1.3 RDF查詢語(yǔ)言  5.1.4 語(yǔ)義數(shù)據(jù)索引技術(shù)  5.1.5 語(yǔ)義網(wǎng)數(shù)據(jù)存儲(chǔ)系統(tǒng) 5.2 語(yǔ)義網(wǎng)數(shù)據(jù)管理系統(tǒng)DBLink  5.2.1 DBI,ink的體系結(jié)構(gòu)  5.2.2 基于主存的面向?qū)ο蟠鎯?chǔ)模型  5.2.3 URI映射與內(nèi)置數(shù)據(jù)類型  5.2.4 語(yǔ)義網(wǎng)數(shù)據(jù)分割與映射  5.2.5 語(yǔ)義網(wǎng)數(shù)據(jù)的壓縮存儲(chǔ)  5.2.6 模式空間與實(shí)例空間分離 5.3 DBLink性能評(píng)價(jià)  5.3.1 測(cè)試數(shù)據(jù)集  5.3.2 實(shí)驗(yàn)環(huán)境  5.3.3 測(cè)試查詢集  5.3.4 實(shí)驗(yàn)結(jié)果 5.4 本章小結(jié) 參考文獻(xiàn)第六章  語(yǔ)義數(shù)據(jù)檢索技術(shù) 6.1 語(yǔ)義數(shù)據(jù)檢索的分類  6.1.1 傳統(tǒng)數(shù)據(jù)/信息檢索  6.1.2 語(yǔ)義網(wǎng)數(shù)據(jù)檢索  6.1.3 語(yǔ)義網(wǎng)格/知識(shí)網(wǎng)格中的數(shù)據(jù)檢索  6.1.4 對(duì)等網(wǎng)絡(luò)中的信息檢索 6.2 語(yǔ)義關(guān)聯(lián)數(shù)據(jù)模型及其檢索的關(guān)鍵問題  6.2.1 支持知識(shí)評(píng)價(jià)的語(yǔ)義關(guān)聯(lián)數(shù)據(jù)模型  6.2.2 實(shí)用且有效的語(yǔ)義數(shù)據(jù)檢索機(jī)制  6.2.3 模糊語(yǔ)義數(shù)據(jù)的表達(dá)及檢索  6.2.4 基于語(yǔ)義的對(duì)等網(wǎng)數(shù)據(jù)組織及其檢索 6.3 支持知識(shí)評(píng)價(jià)的語(yǔ)義關(guān)聯(lián)數(shù)據(jù)模型  6.3.1 語(yǔ)義關(guān)聯(lián)數(shù)據(jù)模型  6.3.2 數(shù)據(jù)的檢索及回答 6.4 基于關(guān)鍵字的語(yǔ)義數(shù)據(jù)檢索  6.4.1 問題描述  6.4.2 近似搜索算法及分析  6.4.3 相關(guān)問題討論 6.5 基于語(yǔ)義模糊性和用戶偏好的檢索機(jī)制  6.5.1 后臺(tái)知識(shí)庫(kù)的語(yǔ)義模糊性  6.5.2 用戶檢索請(qǐng)求的規(guī)范化  6.5.3 檢索結(jié)果的排序 6.6 基于語(yǔ)義小世界的數(shù)據(jù)檢索  6.6.1 語(yǔ)義小世界的構(gòu)建  6.6.2 數(shù)據(jù)檢索算法 6.7 本章小結(jié) 參考文獻(xiàn)第七章  語(yǔ)義數(shù)據(jù)檢索可視化第八章  語(yǔ)義網(wǎng)數(shù)據(jù)應(yīng)用系統(tǒng)參考文獻(xiàn)

章節(jié)摘錄

  萬(wàn)維網(wǎng)已經(jīng)成為人們獲取信息的主要渠道之一,深刻影響到人類社會(huì)生活的各個(gè)方面:人們?cè)赪eb上瀏覽新聞、搜索信息、買賣商品及服務(wù)。然而,目前的萬(wàn)維網(wǎng)是面向人而不是面向機(jī)器的。換句話說,人可以理解萬(wàn)維網(wǎng)上的內(nèi)容,而機(jī)器則不能理解。隨著萬(wàn)維網(wǎng)上的內(nèi)容越來(lái)越多(據(jù)Google的官方Blog公布的數(shù)據(jù),目前Google索引了IT個(gè)URL),人們準(zhǔn)確、快速、全面獲取到信息也越來(lái)越難。  對(duì)此,Www、URIs、HTTP和}tTMI,的發(fā)明人Berners-Lee提出了語(yǔ)義網(wǎng)概念。他認(rèn)為“The Semantic Web will bring structure to the meaningful contentof web pages。creating an environment where software agents roaming from pageto page can readily carry out sophisticated tasks for users”自從提出語(yǔ)義網(wǎng)之后,語(yǔ)義網(wǎng)得到了學(xué)術(shù)界和工業(yè)界的重視。Gartner認(rèn)為企業(yè)語(yǔ)義網(wǎng)是3個(gè)具有影響力的萬(wàn)維網(wǎng)技術(shù)之一。許多語(yǔ)義網(wǎng)公司,如Siderean、SandPiper、Intellidimension等在興起。一些大公司,如Adobe、HP、IBM、Nokia、Oracle、’Vodaphone等紛紛對(duì)語(yǔ)義網(wǎng)技術(shù)進(jìn)行研發(fā)。一些國(guó)家和國(guó)際組織,如英國(guó)、歐盟、美國(guó)也投入資金資助相關(guān)研究?! ≌Z(yǔ)義網(wǎng)是關(guān)于萬(wàn)維網(wǎng)的元數(shù)據(jù)網(wǎng)。數(shù)據(jù)一直是語(yǔ)義網(wǎng)的核心問題,Berners-Lee曾經(jīng)公開表示,他認(rèn)為對(duì)語(yǔ)義網(wǎng)更準(zhǔn)確的名稱應(yīng)該是數(shù)據(jù)網(wǎng)(data web)。語(yǔ)義網(wǎng)存在及互聯(lián)的目的是使得計(jì)算機(jī)能夠自動(dòng)處理、集成來(lái)自不同數(shù)據(jù)源的數(shù)據(jù),而不僅僅是為了讓計(jì)算機(jī)能夠正確顯示。為了實(shí)現(xiàn)讓機(jī)器或設(shè)備能夠自動(dòng)識(shí)別和處理網(wǎng)上數(shù)據(jù),需要在內(nèi)容中加入標(biāo)記,即需要采用標(biāo)記語(yǔ)言??紤]到適應(yīng)不同領(lǐng)域的標(biāo)記需要,標(biāo)記語(yǔ)言必須是靈活、可擴(kuò)展的。為了實(shí)現(xiàn)此目標(biāo),研究和制定在萬(wàn)維網(wǎng)上發(fā)布能夠幫助計(jì)算機(jī)理解內(nèi)容的設(shè)施、技術(shù)和規(guī)范成為迫切需要解決的問題?! ?duì)此,研究人員、標(biāo)準(zhǔn)化組織包括互聯(lián)網(wǎng)工程任務(wù)組和W3C等都致力于增強(qiáng)、擴(kuò)展語(yǔ)義網(wǎng)能力,在研究、制定以及部署能夠共享語(yǔ)義的語(yǔ)言以及工具方面進(jìn)行了大量工作。這些語(yǔ)言為語(yǔ)義互操作提供了基礎(chǔ)。1997年,W3C定義了資源描述框架規(guī)范RDF。此后,相繼提出了RDFS/OWL、GRDDL、RDFa等規(guī)范或建議規(guī)范。研究人員也開發(fā)了許多工具,如Kowari、RDFLib、Jena、Sesame、Protege、SWOOP等。w3C將其中的部分技術(shù)標(biāo)準(zhǔn)化,形成了一些標(biāo)準(zhǔn),包括資源描述框架RDF、RDFS/0WL等。

圖書封面

圖書標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    語(yǔ)義網(wǎng)數(shù)據(jù)管理技術(shù)及應(yīng)用 PDF格式下載


用戶評(píng)論 (總計(jì)2條)

 
 

  •   對(duì)語(yǔ)義數(shù)據(jù)的管理很有幫助
  •   內(nèi)容全面,但比較泛泛。適合對(duì)語(yǔ)義網(wǎng)方面希望有個(gè)全面而大致的了解的專業(yè)人士
 

250萬(wàn)本中文圖書簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7