出版時(shí)間:2011-5 出版社:西安電子科技大學(xué)出版社 作者:溫有奎,焦玉英 著 頁數(shù):191
內(nèi)容概要
本書從代表未來知識(shí)發(fā)現(xiàn)模式一一知識(shí)元語義鏈接的角度論述文獻(xiàn)知識(shí)元間隱含關(guān)聯(lián)的潛在知識(shí)發(fā)現(xiàn)的基本概念、方法和技術(shù)。全書共9章。第1章論述了潛在新知識(shí)發(fā)現(xiàn)問題的提出;第2章給出了語義文本知識(shí)挖掘的進(jìn)展;第3章介紹了文本知識(shí)元模型的演變:第4章討論了知識(shí)元模型的數(shù)學(xué)理論基礎(chǔ),建立了知識(shí)科學(xué)方程組,引入范疇論表示知識(shí)元的語義三角形模型;第5章討論了文獻(xiàn)知識(shí)元的分布與提取模型;第6章研究了數(shù)字化文本知識(shí)元的映射模型:第7章建立了文本主題成因的知識(shí)元本體轉(zhuǎn)換模型;第8章以電子病歷為例介紹了文本知識(shí)元的挖掘應(yīng)用案例;第9章為結(jié)論與展望。
本書既是一本專著,也可以作為高等學(xué)校信息管理、知識(shí)管理、教育學(xué)、機(jī)械設(shè)計(jì)、網(wǎng)頁挖掘、計(jì)算機(jī)應(yīng)用、圖書情報(bào)與檔案及其相關(guān)專業(yè)的研究生和本科高年級(jí)教材,還可供從事知識(shí)系統(tǒng)教學(xué)、研究、開發(fā)和應(yīng)用的科技工作者參考。
作者簡介
溫有奎,男,1951年12月出生,博士,西安電子科技大學(xué)經(jīng)濟(jì)管理學(xué)院教授。研究方向:語義文本挖掘和知識(shí)管理。校學(xué)術(shù)帶頭人,中國科技情報(bào)學(xué)會(huì)理事。主持國家自然科學(xué)基金項(xiàng)目、國家社會(huì)科學(xué)基金項(xiàng)目、教育部人文社會(huì)科學(xué)基金項(xiàng)目、陜西省科學(xué)技術(shù)研究發(fā)展計(jì)劃項(xiàng)目等9項(xiàng)。出版著作7本,發(fā)表期刊論文70余篇(EI檢索2篇)。獲“陜西省哲學(xué)社會(huì)科學(xué)優(yōu)秀成果獎(jiǎng)”三等獎(jiǎng)2項(xiàng)(第一完成人)。獲中華人民共和國實(shí)用新型專利1項(xiàng)(專利號(hào):ZL93212829.7)。焦玉英,女,1942年出生。武漢大學(xué)信息管理學(xué)院教授,博士生導(dǎo)師。主要從事信息檢索理論與實(shí)踐及信息服務(wù)系統(tǒng)建設(shè)、企業(yè)管理咨詢理論與實(shí)踐、企業(yè)競(jìng)爭情報(bào)與服務(wù)等方向的教學(xué)與科學(xué)研究。主持過國家教委、國家社會(huì)科學(xué)基金、國家自然科學(xué)基金等級(jí)別科研項(xiàng)目9項(xiàng);發(fā)表國內(nèi)外學(xué)術(shù)研究論文100余篇:出版教材、專著11部;參編專著、教材20余部。
書籍目錄
第1章 緒論
1.1 知識(shí)元問題的提出
1.1.1 網(wǎng)格資源構(gòu)建需要關(guān)注知識(shí)元
1.1.2 文獻(xiàn)單元向知識(shí)單元深化需要探討知識(shí)元
1.1.3 知識(shí)計(jì)量的開拓離不開知識(shí)元的探討
1.1.4 語義Web知識(shí)發(fā)現(xiàn)需要研究知識(shí)元
1.2 知識(shí)元研究的意義
1.3 國內(nèi)外文本知識(shí)元研究現(xiàn)狀分析
1.3.1 國內(nèi)外文本知識(shí)元研究成果統(tǒng)計(jì)
1.3.2 國內(nèi)外文本知識(shí)元研究領(lǐng)域劃分
1.4 國內(nèi)外語義文本挖掘研究工作綜述
1.4.1 國內(nèi)外語義文本挖掘工作成果統(tǒng)計(jì)
1.4.2 國內(nèi)外語義文本挖掘研究領(lǐng)域劃分
1.5 國內(nèi)外知識(shí)元研究中存在的問題與不足
1.6 本書的主要內(nèi)容與創(chuàng)新之處
1.6.1 本書的主要內(nèi)容
1.6.2 本書的創(chuàng)新之處
第2章 語義文本知識(shí)挖掘概述
2.1 文本知識(shí)挖掘的進(jìn)展
2.1.1 文本挖掘的目標(biāo)
2.1.2 文本挖掘的關(guān)鍵技術(shù)與過程
2.1.3 文本挖掘與相關(guān)概念的比較
2.2 傳統(tǒng)文本挖掘模型
2.2.1 文本向量空間挖掘模型
2.2.2 潛在語義文本挖掘模型
2.3 語義本體文本挖掘模型
2.3.1 語義文本挖掘
2.3.2 文本數(shù)據(jù)挖掘與文本知識(shí)挖掘的區(qū)別
2.3.3 基于領(lǐng)域本體的文本挖掘
第3章 文本知識(shí)元模型的演變
3.1 知識(shí)元的認(rèn)知模型
3.1.1 知識(shí)元的“數(shù)據(jù)元”模型
……
第4章 知識(shí)元模型的數(shù)學(xué)理論基礎(chǔ)
第5章 文獻(xiàn)知識(shí)元的特征分布與提取模型
第6章 文本知識(shí)元的語義映射模型
第7章 主題成因的知識(shí)元本體轉(zhuǎn)換模型設(shè)計(jì)
第8章 期末知識(shí)元的文本模型與挖掘?qū)嵗?br />第9章 總結(jié)與展望
參考文獻(xiàn)
后記
章節(jié)摘錄
版權(quán)頁:插圖:4.文本挖掘的層次從非結(jié)構(gòu)化的數(shù)據(jù)中提取可以表達(dá)成結(jié)構(gòu)化數(shù)據(jù)的知識(shí),其難度是相當(dāng)高的。但從另一方面看,需要提取的知識(shí)本身又是分層次的。因此,大體上可以把文本挖掘分為元數(shù)據(jù)、特征和模板三個(gè)層次。元數(shù)據(jù):顧名思義,是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”。在面向知識(shí)網(wǎng)格中描述知識(shí)的一種方法是采用元數(shù)據(jù)。從簡化的角度看,元數(shù)據(jù)包括了用于注釋內(nèi)容的描述性聲明。元數(shù)據(jù)的目標(biāo)是機(jī)器對(duì)數(shù)據(jù)的處理和聲明。在數(shù)據(jù)呈現(xiàn)非結(jié)構(gòu)化形態(tài)的情況下,元數(shù)據(jù)是幫助人們從最基本的角度把握非結(jié)構(gòu)化數(shù)據(jù)內(nèi)容的最直接的線索。常見的元數(shù)據(jù)有標(biāo)題、作者、發(fā)表時(shí)間、體裁、分類、關(guān)鍵詞、摘要等公共“字段”,通過這些字段,把有關(guān)的線索組織成結(jié)構(gòu)化的數(shù)據(jù)。元數(shù)據(jù)提取可看成是文本組織的結(jié)構(gòu)化過程,元數(shù)據(jù)層是文本挖掘的最低層次。特征:文本和多媒體數(shù)據(jù)的特征,是反映內(nèi)容屬性的量化指標(biāo),一般用向量的形式表示,當(dāng)然向量也是結(jié)構(gòu)化數(shù)據(jù)的一種特殊形式。因此,特征提取可看成是文本內(nèi)容的結(jié)構(gòu)化過程,特征層是文本挖掘的中間層次。知識(shí)模板:它是在語義層面表示數(shù)據(jù)內(nèi)容的核心部分的一種結(jié)構(gòu)化表示。一般的知識(shí)模板采用類似于“框架”的表述方式??蚣鼙旧硎墙Y(jié)構(gòu)化的,但要通過深層次的理解來獲得并填充模板中相應(yīng)的“槽”。因此,知識(shí)模板生成可看成是文本內(nèi)容知識(shí)的結(jié)構(gòu)化過程,知識(shí)模板是文本挖掘的更高層次。5.文本挖掘的特點(diǎn)諶志群等對(duì)文本挖掘模型做了歸納,其特點(diǎn)表現(xiàn)如下:①文本挖掘處理的是大規(guī)模的文本集合,而不是一個(gè)或少量的文本文檔。②文本挖掘發(fā)現(xiàn)的知識(shí)是隱藏在大量文本文檔中的,是新的、以前未知的模式或關(guān)系。③文本挖掘抽取的知識(shí)是以真實(shí)世界為基礎(chǔ)的,具有潛在價(jià)值,是直接可用的,它或者是某個(gè)特定用戶感興趣的,或者是對(duì)于解答某個(gè)特定問題有用的。
圖書封面
評(píng)論、評(píng)分、閱讀與下載
基于知識(shí)元的知識(shí)發(fā)現(xiàn) PDF格式下載