文本挖掘原理

出版時(shí)間：2010-11 出版社：科學(xué)出版社作者：程顯毅,朱倩頁數(shù)：228
Tag標(biāo)簽：無

內(nèi)容概要

在信息時(shí)代，存儲(chǔ)大量數(shù)據(jù)比較容易。通過Web、企業(yè)內(nèi)部網(wǎng)、電傳新。聞獲得的文本數(shù)量在急劇增加，這導(dǎo)致信息過載。然而，數(shù)據(jù)量雖然增加了，但可用的信息卻在減少。文本挖掘是一個(gè)新的令人振奮的研究領(lǐng)域，其試圖通過綜合數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、自然語言處理、信息檢索和知識(shí)管理等技術(shù)來解決信息過載問題。    文本挖掘包括文本集合的預(yù)處理(文本分類、信息抽取)、中間結(jié)果存儲(chǔ)、中間結(jié)果分析技術(shù)(分布分析、聚類、趨勢分析、關(guān)聯(lián)規(guī)則抽取)和最終結(jié)果的可視化。它與關(guān)聯(lián)分析類似，為人們提供了分析海量文本數(shù)據(jù)的新工具，并且通過學(xué)習(xí)模式來指導(dǎo)抽取實(shí)體關(guān)系。    本書首先討論了文本挖掘的總體結(jié)構(gòu)以及文本挖掘預(yù)處理算法，然后深入地研究了文本挖掘核心操作，最后探討真實(shí)世界中文本挖掘的主要應(yīng)用和DIAL，彌補(bǔ)了理論和實(shí)踐的脫節(jié)。    本書主要可供對(duì)文本挖掘感興趣的本科高年級(jí)學(xué)生、研究生、研究人員和專業(yè)開發(fā)人員參考，對(duì)從事文本挖掘開發(fā)和使用文本挖掘系統(tǒng)的人也會(huì)有很大幫助。

書籍目錄

前言第1章  文本挖掘概述  1.1  文本挖掘的產(chǎn)生背景  1.2  文本    1.2.1  文本格式    1.2.2  動(dòng)態(tài)文本集  1.3  文本挖掘的概念  1.4  文本挖掘的任務(wù)    1.4.1  文本挖掘預(yù)處理    1.4.2  文本模式挖掘    1.4.3  挖掘結(jié)果可視化  1.5  文本挖掘系統(tǒng)的通用體系結(jié)構(gòu)第2章  文本表示第3章  文本挖掘預(yù)處理——文本分類第4章  文本挖掘預(yù)處理——文本聚類第5章  文本挖掘核心操作——信息抽取第6章  文本挖掘核心操作——關(guān)系抽取第7章  文本挖掘核心操作——關(guān)聯(lián)分析第8章  文本挖掘結(jié)果的可視化第9章  文本挖掘的應(yīng)用第10章  專門用于文本挖掘的信息抽取語言——DIAL參考文獻(xiàn)

編輯推薦

大量文檔集內(nèi)容的預(yù)處理包括特征抽取、文本分類、文本聚類等。文本分類和文本聚類研究的成果比較多，《文本挖掘原理》只作簡單介紹；而對(duì)特征生成、特征選擇和特征抽取，《文本挖掘原理》進(jìn)行深入地討論。 信息抽取是文本挖掘的核心操作，目前的主要研究方向是命名實(shí)體識(shí)別、實(shí)體關(guān)系抽取和事件抽取。實(shí)體關(guān)系抽取是文本挖掘的關(guān)鍵任務(wù)，所以《文本挖掘原理》用大量篇幅討論了實(shí)體關(guān)系發(fā)現(xiàn)技術(shù)。 由于文本挖掘強(qiáng)調(diào)用戶交互到知識(shí)發(fā)現(xiàn)過程的集成性，因此，《文本挖掘原理》最后討論了文本挖掘結(jié)果可視化方法，并介紹了一種文本挖掘語言——DIAL。

圖書封面

圖書標(biāo)簽Tags

無

評(píng)論、評(píng)分、閱讀與下載

還沒讀過(76)
勉強(qiáng)可看(557)
一般般(950)
內(nèi)容豐富(3939)
強(qiáng)力推薦(323)

文本挖掘原理 PDF格式下載

用戶評(píng)論 (總計(jì)18條)

挖掘可是很重要的技術(shù)了。
總體感覺很棒！
書還沒看，在有需要的時(shí)候可以給我?guī)椭?/li>
使用了其中的思想
內(nèi)容還行，特別是實(shí)體識(shí)別那塊。
書名取得大了一點(diǎn)，原理說得不是太透
該圖書的內(nèi)容涵蓋面較廣，適用于入門者。
好像這方面的教材相當(dāng)少！可以讀一下！
還沒來得及看，不過應(yīng)該不錯(cuò)吧
送貨速度真快。該書已瀏覽，慢慢看吧，等有收獲再來說。
不錯(cuò)的書，很權(quán)威不錯(cuò)的書，很權(quán)威
可以看一下，開拓一下思路，要是書寫厚一點(diǎn)就更好了
就是個(gè)技術(shù)大綱，一點(diǎn)也沒有深入。
書的封皮在遞送過程中有破損，雖不影響閱讀，但外觀畢竟有瑕疵。
內(nèi)容太差，空洞。作者估計(jì)也沒什么實(shí)際經(jīng)驗(yàn)。就是一個(gè)攢子的人
教材而已，理論性大于實(shí)際動(dòng)手可能性
不僅有數(shù)據(jù)挖掘，同樣我們要好好學(xué)習(xí)一下如何文本。這只是告訴我們?nèi)绾巫鑫谋荆碚摯笥诎咐?/li>
這是比較全面的介紹該領(lǐng)域的一本書，可以當(dāng)作入門讀物。

文本挖掘原理

用戶評(píng)論 (總計(jì)18條)

推薦圖書

相關(guān)圖書