出版時(shí)間:2008-8 出版社:科學(xué)出版社 作者:戴文華 頁(yè)數(shù):222 字?jǐn)?shù):220000
Tag標(biāo)簽:無(wú)
前言
戴文華同志無(wú)論學(xué)習(xí)、研究還是工作,都非常勤奮、踏實(shí)、執(zhí)著,研究能力和鉆研精神都非常強(qiáng)。四年前,他進(jìn)入華中師范大學(xué)計(jì)算機(jī)科學(xué)系攻讀碩士研究生時(shí),已經(jīng)作為高校教師工作了多年,并已取得了較多的成果;然而他在自然語(yǔ)言處理這個(gè)研究方向上,還是一個(gè)新兵。但是,經(jīng)過(guò)短短的4年,他已經(jīng)在該方向做出了突出的研究成果,在文本分類和聚類的理論和方法上,做了系統(tǒng)深入的研究,發(fā)表了論文10多篇?,F(xiàn)在他碩士期間的主要研究成果即將出版專著,實(shí)在是可喜可賀。文本自動(dòng)分類和聚類是自然語(yǔ)言處理領(lǐng)域里重要的研究課題,有廣泛的應(yīng)用前景。
內(nèi)容概要
文本分類和聚類技術(shù)是應(yīng)信息檢索和查詢需要而出現(xiàn)的自然語(yǔ)言處理領(lǐng)域的重要研究課題。文本分類和聚類問(wèn)題中的特征選擇和抽取技術(shù)、文本特征表示、聚類方法的選擇和實(shí)現(xiàn)以及分類方法的選擇和實(shí)現(xiàn),都將對(duì)文本分類和聚類結(jié)果產(chǎn)生極大影響。針對(duì)文本分類和聚類中的文本數(shù)據(jù)的高維性和稀疏性、同義詞和近義詞問(wèn)題、效率與精確度之間的搭配問(wèn)題以及參數(shù)優(yōu)化問(wèn)題,本書(shū)提出了使用遺傳算法與傳統(tǒng)分類和聚類方法相結(jié)合的思路來(lái)進(jìn)行處理,充分利用了遺傳算法的全局優(yōu)化能力和傳統(tǒng)分類及聚類算法的專業(yè)知識(shí),有效地提高了文本分類和聚類的效率與精度。 本書(shū)可作為自然語(yǔ)言處理專業(yè)和相關(guān)專業(yè)人員自學(xué)參考書(shū)。
書(shū)籍目錄
序前言第1章 緒論 1.1 研究的目的和意義 1.2 國(guó)內(nèi)外研究現(xiàn)狀 1.3 文本分類和聚類存在的問(wèn)題 1.4 本書(shū)研究?jī)?nèi)容和目標(biāo) 參考文獻(xiàn)第2章 文本分類和聚類的基本理論及方法 2.1 文本分類和聚類的概念 2.2 文本的表示 2.3 文本預(yù)處理 2.4 文本特征選擇和抽取 2.5 文本分類方法 2.6 文本聚類方法 2.7 本章小結(jié) 參考文獻(xiàn)第3章 遺傳算法基礎(chǔ)知識(shí) 3.1 遺傳算法概述 3.2 標(biāo)準(zhǔn)遺傳算法 3.3 遺傳算法染色體編碼 3.4 適應(yīng)度函數(shù) 3.5 遺傳算子 3.6 遺傳算法的改進(jìn) 3.7 本章小結(jié) 參考文獻(xiàn)第4章 混合并行遺傳算法及其在文本聚類中的應(yīng)用 4.1 k-means算法初始聚類中心的選擇 4.2 混合并行遺傳算法 4.3 基于并行遺傳算法的文本特征詞提取 4.4 基于混合并行遺傳算法的文本聚類 4.5 實(shí)驗(yàn)設(shè)置及結(jié)果分析 4.6 本章小結(jié) 參考文獻(xiàn)第5章 混合并行遺傳算法在文本分類中的應(yīng)用 5.1 基于混合并行遺傳算法的潛在語(yǔ)義挖掘 5.2 基于混合并行遺傳聚類的KNN改進(jìn)算法(HPGA-KNN) 5.3 SMO-SVM算法 5.4 SMO-SVM算法核函數(shù)參數(shù)優(yōu)化 5.5 改進(jìn)的KNN SVM文本分類方法 5.6 實(shí)驗(yàn)設(shè)置及分析 5.7 本搴小結(jié) 參考文獻(xiàn)第6章 總結(jié)和研究展望 6.1 總結(jié) 6.2 后續(xù)研究工作展望附錄A k-means聚類算法關(guān)鍵代碼附錄B 遺傳算法聚類關(guān)鍵代碼附錄C 混合遺傳聚類關(guān)鍵代碼
章節(jié)摘錄
第1章 緒論 讓Internet更好地為人類服務(wù),一直是人們努力的方向。通過(guò)不懈努力,人們逐漸掌握了多種技術(shù)對(duì)不斷膨脹的信息進(jìn)行收集和整理。各種海量信息的復(fù)雜性和非結(jié)構(gòu)性,對(duì)信息的處理帶來(lái)了極大的挑戰(zhàn)。本書(shū)為了解決信息處理中的一些相關(guān)問(wèn)題而進(jìn)行了深入研究,提出了一些切實(shí)有效的措施,為海量信息的處理提供了極大幫助。 ……
編輯推薦
《基于遺傳算法的文本分類及聚類研究》作者圍繞文本分類和聚類研究,針對(duì)一些具體問(wèn)題,提出了一系列科學(xué)可行的解決方案。如基于并行遺傳算法的特征詞動(dòng)態(tài)提取方法,能夠降低文本對(duì)象的特征維數(shù);采用并行遺傳算法對(duì)文本分類和聚類問(wèn)題中的參數(shù)進(jìn)行優(yōu)化,從而提高文本分類和聚類結(jié)果的精確度。 《基于遺傳算法的文本分類及聚類研究》除了闡述作者自己的研究成果外,作者還結(jié)合自己的實(shí)際經(jīng)驗(yàn),對(duì)文本自動(dòng)分類技術(shù)、文本自動(dòng)聚類技術(shù)、遺傳算法的相關(guān)技術(shù)都作了較詳細(xì)的描述,對(duì)于準(zhǔn)備從事相關(guān)研究的人士有很大的參考價(jià)值。
圖書(shū)封面
圖書(shū)標(biāo)簽Tags
無(wú)
評(píng)論、評(píng)分、閱讀與下載
250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版