出版時間:2008-8 出版社:科學出版社 作者:戴文華 頁數(shù):222 字數(shù):220000
Tag標簽:無
前言
戴文華同志無論學習、研究還是工作,都非常勤奮、踏實、執(zhí)著,研究能力和鉆研精神都非常強。四年前,他進入華中師范大學計算機科學系攻讀碩士研究生時,已經(jīng)作為高校教師工作了多年,并已取得了較多的成果;然而他在自然語言處理這個研究方向上,還是一個新兵。但是,經(jīng)過短短的4年,他已經(jīng)在該方向做出了突出的研究成果,在文本分類和聚類的理論和方法上,做了系統(tǒng)深入的研究,發(fā)表了論文10多篇?,F(xiàn)在他碩士期間的主要研究成果即將出版專著,實在是可喜可賀。文本自動分類和聚類是自然語言處理領域里重要的研究課題,有廣泛的應用前景。
內(nèi)容概要
文本分類和聚類技術是應信息檢索和查詢需要而出現(xiàn)的自然語言處理領域的重要研究課題。文本分類和聚類問題中的特征選擇和抽取技術、文本特征表示、聚類方法的選擇和實現(xiàn)以及分類方法的選擇和實現(xiàn),都將對文本分類和聚類結(jié)果產(chǎn)生極大影響。針對文本分類和聚類中的文本數(shù)據(jù)的高維性和稀疏性、同義詞和近義詞問題、效率與精確度之間的搭配問題以及參數(shù)優(yōu)化問題,本書提出了使用遺傳算法與傳統(tǒng)分類和聚類方法相結(jié)合的思路來進行處理,充分利用了遺傳算法的全局優(yōu)化能力和傳統(tǒng)分類及聚類算法的專業(yè)知識,有效地提高了文本分類和聚類的效率與精度。 本書可作為自然語言處理專業(yè)和相關專業(yè)人員自學參考書。
書籍目錄
序前言第1章 緒論 1.1 研究的目的和意義 1.2 國內(nèi)外研究現(xiàn)狀 1.3 文本分類和聚類存在的問題 1.4 本書研究內(nèi)容和目標 參考文獻第2章 文本分類和聚類的基本理論及方法 2.1 文本分類和聚類的概念 2.2 文本的表示 2.3 文本預處理 2.4 文本特征選擇和抽取 2.5 文本分類方法 2.6 文本聚類方法 2.7 本章小結(jié) 參考文獻第3章 遺傳算法基礎知識 3.1 遺傳算法概述 3.2 標準遺傳算法 3.3 遺傳算法染色體編碼 3.4 適應度函數(shù) 3.5 遺傳算子 3.6 遺傳算法的改進 3.7 本章小結(jié) 參考文獻第4章 混合并行遺傳算法及其在文本聚類中的應用 4.1 k-means算法初始聚類中心的選擇 4.2 混合并行遺傳算法 4.3 基于并行遺傳算法的文本特征詞提取 4.4 基于混合并行遺傳算法的文本聚類 4.5 實驗設置及結(jié)果分析 4.6 本章小結(jié) 參考文獻第5章 混合并行遺傳算法在文本分類中的應用 5.1 基于混合并行遺傳算法的潛在語義挖掘 5.2 基于混合并行遺傳聚類的KNN改進算法(HPGA-KNN) 5.3 SMO-SVM算法 5.4 SMO-SVM算法核函數(shù)參數(shù)優(yōu)化 5.5 改進的KNN SVM文本分類方法 5.6 實驗設置及分析 5.7 本搴小結(jié) 參考文獻第6章 總結(jié)和研究展望 6.1 總結(jié) 6.2 后續(xù)研究工作展望附錄A k-means聚類算法關鍵代碼附錄B 遺傳算法聚類關鍵代碼附錄C 混合遺傳聚類關鍵代碼
章節(jié)摘錄
第1章 緒論 讓Internet更好地為人類服務,一直是人們努力的方向。通過不懈努力,人們逐漸掌握了多種技術對不斷膨脹的信息進行收集和整理。各種海量信息的復雜性和非結(jié)構(gòu)性,對信息的處理帶來了極大的挑戰(zhàn)。本書為了解決信息處理中的一些相關問題而進行了深入研究,提出了一些切實有效的措施,為海量信息的處理提供了極大幫助?! ?/pre>編輯推薦
《基于遺傳算法的文本分類及聚類研究》作者圍繞文本分類和聚類研究,針對一些具體問題,提出了一系列科學可行的解決方案。如基于并行遺傳算法的特征詞動態(tài)提取方法,能夠降低文本對象的特征維數(shù);采用并行遺傳算法對文本分類和聚類問題中的參數(shù)進行優(yōu)化,從而提高文本分類和聚類結(jié)果的精確度。 《基于遺傳算法的文本分類及聚類研究》除了闡述作者自己的研究成果外,作者還結(jié)合自己的實際經(jīng)驗,對文本自動分類技術、文本自動聚類技術、遺傳算法的相關技術都作了較詳細的描述,對于準備從事相關研究的人士有很大的參考價值。圖書封面
圖書標簽Tags
無評論、評分、閱讀與下載