基于遺傳算法的文本分類及聚類研究

出版時間:2008-8  出版社:科學(xué)出版社  作者:戴文華  頁數(shù):222  字?jǐn)?shù):220000  
Tag標(biāo)簽:無  

前言

  戴文華同志無論學(xué)習(xí)、研究還是工作,都非常勤奮、踏實、執(zhí)著,研究能力和鉆研精神都非常強(qiáng)。四年前,他進(jìn)入華中師范大學(xué)計算機(jī)科學(xué)系攻讀碩士研究生時,已經(jīng)作為高校教師工作了多年,并已取得了較多的成果;然而他在自然語言處理這個研究方向上,還是一個新兵。但是,經(jīng)過短短的4年,他已經(jīng)在該方向做出了突出的研究成果,在文本分類和聚類的理論和方法上,做了系統(tǒng)深入的研究,發(fā)表了論文10多篇?,F(xiàn)在他碩士期間的主要研究成果即將出版專著,實在是可喜可賀。文本自動分類和聚類是自然語言處理領(lǐng)域里重要的研究課題,有廣泛的應(yīng)用前景。

內(nèi)容概要

文本分類和聚類技術(shù)是應(yīng)信息檢索和查詢需要而出現(xiàn)的自然語言處理領(lǐng)域的重要研究課題。文本分類和聚類問題中的特征選擇和抽取技術(shù)、文本特征表示、聚類方法的選擇和實現(xiàn)以及分類方法的選擇和實現(xiàn),都將對文本分類和聚類結(jié)果產(chǎn)生極大影響。針對文本分類和聚類中的文本數(shù)據(jù)的高維性和稀疏性、同義詞和近義詞問題、效率與精確度之間的搭配問題以及參數(shù)優(yōu)化問題,本書提出了使用遺傳算法與傳統(tǒng)分類和聚類方法相結(jié)合的思路來進(jìn)行處理,充分利用了遺傳算法的全局優(yōu)化能力和傳統(tǒng)分類及聚類算法的專業(yè)知識,有效地提高了文本分類和聚類的效率與精度。    本書可作為自然語言處理專業(yè)和相關(guān)專業(yè)人員自學(xué)參考書。

書籍目錄

序前言第1章  緒論  1.1  研究的目的和意義  1.2  國內(nèi)外研究現(xiàn)狀  1.3  文本分類和聚類存在的問題  1.4  本書研究內(nèi)容和目標(biāo)  參考文獻(xiàn)第2章  文本分類和聚類的基本理論及方法  2.1  文本分類和聚類的概念  2.2  文本的表示  2.3  文本預(yù)處理  2.4  文本特征選擇和抽取  2.5  文本分類方法  2.6  文本聚類方法  2.7  本章小結(jié)  參考文獻(xiàn)第3章  遺傳算法基礎(chǔ)知識  3.1  遺傳算法概述  3.2  標(biāo)準(zhǔn)遺傳算法  3.3  遺傳算法染色體編碼  3.4  適應(yīng)度函數(shù)  3.5  遺傳算子  3.6  遺傳算法的改進(jìn)  3.7  本章小結(jié)  參考文獻(xiàn)第4章  混合并行遺傳算法及其在文本聚類中的應(yīng)用  4.1  k-means算法初始聚類中心的選擇  4.2  混合并行遺傳算法  4.3  基于并行遺傳算法的文本特征詞提取  4.4  基于混合并行遺傳算法的文本聚類  4.5  實驗設(shè)置及結(jié)果分析  4.6  本章小結(jié)  參考文獻(xiàn)第5章  混合并行遺傳算法在文本分類中的應(yīng)用  5.1  基于混合并行遺傳算法的潛在語義挖掘  5.2  基于混合并行遺傳聚類的KNN改進(jìn)算法(HPGA-KNN)  5.3  SMO-SVM算法  5.4  SMO-SVM算法核函數(shù)參數(shù)優(yōu)化  5.5  改進(jìn)的KNN SVM文本分類方法  5.6  實驗設(shè)置及分析  5.7  本搴小結(jié)  參考文獻(xiàn)第6章  總結(jié)和研究展望  6.1  總結(jié)  6.2  后續(xù)研究工作展望附錄A  k-means聚類算法關(guān)鍵代碼附錄B  遺傳算法聚類關(guān)鍵代碼附錄C  混合遺傳聚類關(guān)鍵代碼

章節(jié)摘錄

  第1章 緒論  讓Internet更好地為人類服務(wù),一直是人們努力的方向。通過不懈努力,人們逐漸掌握了多種技術(shù)對不斷膨脹的信息進(jìn)行收集和整理。各種海量信息的復(fù)雜性和非結(jié)構(gòu)性,對信息的處理帶來了極大的挑戰(zhàn)。本書為了解決信息處理中的一些相關(guān)問題而進(jìn)行了深入研究,提出了一些切實有效的措施,為海量信息的處理提供了極大幫助?!  ?/pre>

編輯推薦

  《基于遺傳算法的文本分類及聚類研究》作者圍繞文本分類和聚類研究,針對一些具體問題,提出了一系列科學(xué)可行的解決方案。如基于并行遺傳算法的特征詞動態(tài)提取方法,能夠降低文本對象的特征維數(shù);采用并行遺傳算法對文本分類和聚類問題中的參數(shù)進(jìn)行優(yōu)化,從而提高文本分類和聚類結(jié)果的精確度。 《基于遺傳算法的文本分類及聚類研究》除了闡述作者自己的研究成果外,作者還結(jié)合自己的實際經(jīng)驗,對文本自動分類技術(shù)、文本自動聚類技術(shù)、遺傳算法的相關(guān)技術(shù)都作了較詳細(xì)的描述,對于準(zhǔn)備從事相關(guān)研究的人士有很大的參考價值。

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    基于遺傳算法的文本分類及聚類研究 PDF格式下載


用戶評論 (總計3條)

 
 

  •   不建議買,內(nèi)容很差
  •   內(nèi)容比較簡單,很多深入的問題沒有討論,需要自己查閱大量資料進(jìn)行補(bǔ)充。
  •   大體上還可以,能在細(xì)一些就好了
 

250萬本中文圖書簡介、評論、評分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號-7