海量語義數(shù)據(jù)處理

出版時(shí)間:2012-10  出版社:高等教育出版社  作者:黃智生 等編著  頁數(shù):255  字?jǐn)?shù):320000  
Tag標(biāo)簽:無  

內(nèi)容概要

語義萬維網(wǎng)所面臨的一個(gè)重大問題,就是如何處理海量語義數(shù)據(jù),它一直被認(rèn)為是制約語義技術(shù)發(fā)展的瓶頸。本書系統(tǒng)地介紹了海量語義數(shù)據(jù)處理的最新技術(shù)和進(jìn)展,通過介紹LarKC項(xiàng)目所開發(fā)的海量語義處理平臺(tái)及其應(yīng)用,來闡述海量語義數(shù)據(jù)處理技術(shù)的基本原理、實(shí)現(xiàn)方法和應(yīng)用開發(fā)等一系列關(guān)鍵問題。
《海量語義數(shù)據(jù)處理——平臺(tái)技術(shù)與應(yīng)用》由黃智生、鐘寧著,全書共
13章,分為上、下篇。上篇為技術(shù)篇,內(nèi)容包括海量語義數(shù)據(jù)處理基本原理、海量語義數(shù)據(jù)處理平臺(tái)體系結(jié)構(gòu)、識(shí)別與選擇技術(shù)、抽象與學(xué)習(xí)技術(shù)、推理與決策技術(shù)及LarKC平臺(tái)應(yīng)用開發(fā)技術(shù)等。下篇為應(yīng)用篇,內(nèi)容涉及LarKC
平臺(tái)開發(fā)的一系列應(yīng)用系統(tǒng),包括關(guān)聯(lián)生命數(shù)據(jù)集、基于語義技術(shù)的醫(yī)學(xué)文獻(xiàn)檢索、語義技術(shù)在生命科學(xué)中的應(yīng)用、語義技術(shù)與城市計(jì)算以及語義技術(shù)在智能交通中的應(yīng)用等。
《海量語義數(shù)據(jù)處理--平臺(tái)技術(shù)與應(yīng)用》不僅是一本介紹海量語義數(shù)據(jù)處理LarKC平臺(tái)及其技術(shù)與應(yīng)用的參考書,同時(shí)對(duì)語義數(shù)據(jù)處理技術(shù)問題的研究人員、語義數(shù)據(jù)處理平臺(tái)實(shí)現(xiàn)的技術(shù)人員以及語義技術(shù)的應(yīng)用開發(fā)人員均具有一定的參考價(jià)值。

作者簡(jiǎn)介

北京市特聘專家(海聚工程特聘教授),北京工業(yè)大學(xué)國(guó)際WlC研究院學(xué)術(shù)帶頭人。日本東京大學(xué)博士,日本前橋工業(yè)大學(xué)研究生院及生命信息系教授,國(guó)際學(xué)術(shù)組織Web
Intelligence Coortium(WlC)主席,國(guó)際學(xué)術(shù)期刊Web Intelligence andAgent
Systems主編,IEEE計(jì)算智能學(xué)會(huì)腦信息學(xué)任務(wù)組主席。 黃智生(Zhisheng Huang)
荷蘭阿姆斯特丹自由大學(xué)計(jì)算機(jī)系高級(jí)研究員,北京工業(yè)大學(xué)國(guó)際WIC研究院等多個(gè)大學(xué)兼職教授。主持歐盟第七研究框架重大語義技術(shù)研究項(xiàng)目LarKC中的推理工作組的研究。在國(guó)際期刊和會(huì)議上發(fā)表、交流學(xué)術(shù)論文百余篇。
擔(dān)任近七十個(gè)國(guó)際學(xué)術(shù)會(huì)議組織委員會(huì)或程序委員會(huì)的委員或聯(lián)合主席。

書籍目錄

第1章  導(dǎo)論
1.1 語義技術(shù)概述
1.2 海量語義數(shù)據(jù)處理
1.3 LarKC概述
1.3.1.LarKC項(xiàng)目
1.3.2 LarKC技術(shù)概述
1.3.3 LarKC海量語義數(shù)據(jù)處理平臺(tái)概述
1.3.4 LarKC應(yīng)用技術(shù)開發(fā)概述
1.4 本章小結(jié)
參考文獻(xiàn)
第一部分 技術(shù)篇
第2章 LarKC海量語義數(shù)據(jù)處理平臺(tái)
2.1 LarKC體系結(jié)構(gòu)
2.2 LarKC平臺(tái)的安裝與使用
2.2.1 獲取LarKC
2.2.2 運(yùn)行LarKC
2.2.3 一個(gè)簡(jiǎn)單工作流實(shí)例
2.3 工作流設(shè)計(jì)器
2.3.1 工作流設(shè)計(jì)器概覽
2.3.2 安裝及主要操作
2.4 LarKC插件概述
2.5 用戶支持和版權(quán)信息
2.6 本章小結(jié)
參考文獻(xiàn)
第3章 識(shí)別與選擇
3.1 識(shí)別方法與識(shí)別插件
3.2 基于興趣的選擇方法與插件實(shí)現(xiàn)
3.2.1 基本原理與基本算法
3.2.2 方法的可擴(kuò)展性與效率比較
3.2.3 基于興趣的選擇插件設(shè)計(jì)與實(shí)現(xiàn)
3.3 隨機(jī)索引選擇方法與插件實(shí)現(xiàn)
3.3.1 語義索引
3.3.2 基于隨機(jī)索引與Lcene索引的檢索比較
3.4 選擇方法與選擇插件的應(yīng)用
3.4.1 基于興趣的選擇插件應(yīng)用示例
3.4.2 隨機(jī)索引選擇插件應(yīng)用示例
3.5 本章小結(jié)
附錄 第3.3.2 節(jié)相關(guān)詢問
參考文獻(xiàn)
第4章 抽象與轉(zhuǎn)換
4.1 機(jī)器學(xué)習(xí)
4.1.1 SUNS
4.1.2 機(jī)器學(xué)習(xí)插件
4.2 數(shù)據(jù)流
4.2.1 C-SPARQL
4.2.2 數(shù)據(jù)流插件
4.3 歸納與演繹結(jié)合的數(shù)據(jù)流推理
4.3.1 動(dòng)機(jī)
4.3.2 數(shù)據(jù)流推理的結(jié)構(gòu)框架
4.4 本章小結(jié)
參考文獻(xiàn)
第5章 推理與決策
5.1 LarKC推理與決策插件
5.2 常規(guī)語義推理
5.2.1 OWLAPI推理機(jī)
5.2.2 SPARQLDL推理機(jī)
5.3 并行與分布式推理
5.3.1 采用MapReduce技術(shù)的海量分布性推理
5.3.2 采用WebPIE進(jìn)行OWL分布性推理
5.4 基于規(guī)則的推理
5.5 本章小結(jié)
參考文獻(xiàn)
第6章 非常規(guī)語義推理
6.1 不一致本體的推理
6.1.1 語義網(wǎng)與不一致性
6.1.2 基本方法
6.1.3 LarKC平臺(tái)下的PION系統(tǒng)
6.2 轉(zhuǎn)折推理
6.2.1 基本定義
6.2.2 計(jì)算方法和實(shí)現(xiàn)
6.2.3 轉(zhuǎn)折推理插件
6.3 嘈雜語義數(shù)據(jù)的推理
6.3.1 基本定義
6.3.2 韓國(guó)首爾RSM系統(tǒng)示例
6.4 本章小結(jié)
參考文獻(xiàn)
第7章 LarKC系統(tǒng)與應(yīng)用開發(fā)
7.1 LarKC工作流開發(fā)
7.1.1 工作流圖
7.1.2 工作流描述
7.1.3 更復(fù)雜的一個(gè)示例
7.2 LarKC插件開發(fā)
7.2.1 LarKCMaven原型的使用
7.2.2 插件代碼編寫
7.2.3 整合插件到LarKC平臺(tái)
7.3 相關(guān)的開發(fā)工具
7.3.1 集成開發(fā)環(huán)境Eclipse
7.3.2 項(xiàng)目管理Maven
7.3.3 單元測(cè)試JUnit
7.3.4 版本控制SVN
7.4 本章小結(jié)
附錄 復(fù)雜的工作流描述示例
參考文獻(xiàn)
第二部分 應(yīng)用篇
第8章 關(guān)聯(lián)生命數(shù)據(jù)集
8.1 概況
8.2 關(guān)聯(lián)生命數(shù)據(jù)組成
8.3 語義關(guān)聯(lián)構(gòu)造
8.4 關(guān)聯(lián)生命數(shù)據(jù)集的使用
8.4.1 關(guān)聯(lián)生命數(shù)據(jù)集關(guān)鍵詞查詢
8.4.2 關(guān)聯(lián)生命數(shù)據(jù)集SPARQL語義查詢
8.5 本章小結(jié)
參考文獻(xiàn)
第9章 生物醫(yī)學(xué)文獻(xiàn)語義檢索
9.1 需求分析
9.2 通過LLD進(jìn)行醫(yī)學(xué)文獻(xiàn)檢索
9.3 醫(yī)學(xué)文獻(xiàn)語義標(biāo)注
9.4 LarKC醫(yī)學(xué)文獻(xiàn)語義檢索插件
9.5 本章小結(jié)
參考文獻(xiàn)
第10章 海量語義數(shù)據(jù)處理與基因研究
10.1 概述
10.2 基因研究與語義數(shù)據(jù)
10.3 LarKC海量語義數(shù)據(jù)處理平臺(tái)用于GWAS研究
10.3.1 LarKC的GWAS插件
10.3.2 關(guān)鍵詞擴(kuò)展推理器
10.3.3 GWAS識(shí)別器
10.3.4 GWAS工作流
10.4 本章小結(jié)
參考文獻(xiàn)
第11章 城市計(jì)算Ⅰ:交通與社交媒體
11.1 交通路線規(guī)劃
11.1.1 框架結(jié)構(gòu)
11.1.2 交通預(yù)測(cè)
11.1.3 語義交通路線規(guī)劃
11.1.4 評(píng)價(jià)
11.1.5 小結(jié)
11.2 社交媒體分析
11.2.1 概況
11.2.2 框架結(jié)構(gòu)
11.2.3 BOTTARI的LarKC工作流
11.3 本章小結(jié)
參考文獻(xiàn)
第12章 城市計(jì)算Ⅱ:路標(biāo)管理
12.1 基本思想
12.2 RSM數(shù)據(jù)集與數(shù)據(jù)整合
12.2.1 RSM數(shù)據(jù)集
12.2.2 數(shù)據(jù)整合
12.2.3 路標(biāo)的有效性審核
12.3 RSM語義數(shù)據(jù)處理
12.3.1 系統(tǒng)結(jié)構(gòu)
12.3.2.RSM工作流
12.3.3 :RSM查詢與推理
12.4 RSM系統(tǒng)用戶界面
12.5 本章小結(jié)
參考文獻(xiàn)
第13章 海量語義數(shù)據(jù)處理技術(shù)展望
13.1 市場(chǎng)分析
13.1.1 語義技術(shù)的市場(chǎng)觀察和潛力
13.1.2 市場(chǎng)分析的結(jié)論
13.2 LarKC海量語義數(shù)據(jù)平臺(tái)應(yīng)用展望
13.2.1 藥物研發(fā)海量語義數(shù)據(jù)處理
13.2.2 語義技術(shù)用于政治文化分析
13.2.3 智能交通系統(tǒng)
13.2.4 基于語義技術(shù)的電子病歷
13.3 海量語義數(shù)據(jù)處理研究展望
13.4 結(jié)束語
參考文獻(xiàn)

章節(jié)摘錄

版權(quán)頁:   插圖:   LLD服務(wù)集成了主要的公共數(shù)據(jù)資源,涵蓋了分子序列數(shù)據(jù)(蛋白質(zhì)組學(xué)和基因組學(xué)數(shù)據(jù))、系統(tǒng)生物學(xué)的資源(分子間的相互作用和路徑)、化學(xué)化合物和藥物的相關(guān)信息、臨床和醫(yī)學(xué)相關(guān)的資源及科學(xué)出版物等。LLD的數(shù)據(jù)集成模型可以用來提供詳盡的疾病模型服務(wù)(即LLD作為DaaS)。這將為個(gè)性化治療提供成功的技術(shù)基礎(chǔ)。LLD平臺(tái)將提供細(xì)化到非常具體的科學(xué)/醫(yī)療問題的專業(yè)知識(shí)的支持,以關(guān)注到一個(gè)特定的數(shù)據(jù)子集來使其信息服務(wù)功能。LLD的信息服務(wù)和數(shù)據(jù)服務(wù)(IaaS/DaaS)可以幫助有關(guān)研究人員,從而更好地在他們的研究項(xiàng)目中進(jìn)行決策。 2.LarKC平臺(tái)的開放性開發(fā)社區(qū) LarKC平臺(tái)將成為一個(gè)開放式平臺(tái)以被持續(xù)開發(fā), 這將是通過延續(xù)當(dāng)前的開源開發(fā)的思想來實(shí)現(xiàn)的。這個(gè)開源開發(fā)的思想在LarKC項(xiàng)目的開發(fā)初期都已經(jīng)確立下來了,有效地延長(zhǎng)其組織結(jié)構(gòu)框架并不完全依賴于現(xiàn)有的LarKC成員。雖然LarKC項(xiàng)目已經(jīng)結(jié)束,LarKC團(tuán)隊(duì)成員已經(jīng)致力于后LarKC的技術(shù)開發(fā),這個(gè)努力被稱為“讓LarKC活著”。 13.1.2 市場(chǎng)分析的結(jié)論 在上述對(duì)LarKC的市場(chǎng)分析中,我們已經(jīng)看到了主流IT企業(yè)介入海量語義數(shù)據(jù)處理領(lǐng)域的腳步。這以這些大公司收購(gòu)語義技術(shù)和相關(guān)的海量語義數(shù)據(jù)處理的業(yè)務(wù)為主要特征。谷歌(Google)和Facebook都采用了語義技術(shù)和語義網(wǎng)服務(wù),這將推動(dòng)語義技術(shù)標(biāo)準(zhǔn)的發(fā)展,并降低采用語義技術(shù)的壁壘。語義技術(shù)可以作為一個(gè)子系統(tǒng)嵌入到他們現(xiàn)有的解決方案的基礎(chǔ)設(shè)施之中。IT大公司和風(fēng)險(xiǎn)投資對(duì)于海量語義數(shù)據(jù)技術(shù)的介入,表明了這個(gè)技術(shù)在未來的市場(chǎng)的重大意義。 LarKC能為市場(chǎng)和未來的萬維網(wǎng)貢獻(xiàn)什么呢?我們的回答是:LarKC可以提供如下的兩個(gè)最重要的功能: (1)LarKC平臺(tái)是開放和免費(fèi)的,但可提供進(jìn)一步的收費(fèi)服務(wù)。LarKC可以被看成是集成了許多小的插件的平臺(tái)。每個(gè)人都可以通過它建立一個(gè)面向特定客戶群而不是面向所有的客戶的服務(wù)。LarKC的后續(xù)服務(wù)可以考慮對(duì)于每個(gè)后續(xù)開發(fā)系統(tǒng)提供一個(gè)簡(jiǎn)短的描述使之能夠在較短的時(shí)間內(nèi)就可以選擇和組合。另一種方法是集成預(yù)先選定的一些工作流或者是插件提供組合應(yīng)用系統(tǒng)。這一點(diǎn)類似于亞馬遜(Amazon)公司的做法,它提供了兩種方法:預(yù)先選定的“推薦”和無限制的自由文本搜索。

編輯推薦

《海量語義數(shù)據(jù)處理:平臺(tái)、技術(shù)與應(yīng)用》不僅是一本介紹海量語義數(shù)據(jù)處理LarKC平臺(tái)及其技術(shù)與應(yīng)用的參考書,同時(shí)對(duì)語義數(shù)據(jù)處理技術(shù)問題的研究人員、語義數(shù)據(jù)處理平臺(tái)實(shí)現(xiàn)的技術(shù)人員以及語義技術(shù)的應(yīng)用開發(fā)人員均具有一定的參考價(jià)值。

圖書封面

圖書標(biāo)簽Tags

評(píng)論、評(píng)分、閱讀與下載


    海量語義數(shù)據(jù)處理 PDF格式下載


用戶評(píng)論 (總計(jì)3條)

 
 

  •   講的挺詳細(xì)的,把語義網(wǎng)的發(fā)展,技術(shù),LARKC平臺(tái)的應(yīng)用都涉及了
  •   這本書是給老師買的,老師對(duì)我們現(xiàn)在做的信息檢索是有用的
  •   黃智生教授被譽(yù)為普及語義互聯(lián)網(wǎng)的重量級(jí)人物,業(yè)界尊稱其暑期免費(fèi)培訓(xùn)課程為“黃普軍?!薄:芟矚g這本書,還在仔細(xì)研讀!
 

250萬本中文圖書簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7