計算機自然語言處理

出版時間:2005-4  出版社:清華大學出版社  作者:王曉龍  頁數(shù):170  字數(shù):260000  
Tag標簽:無  

內(nèi)容概要

計算機自然語言處理技術(shù)在我國現(xiàn)代化及信息化建設中起著越來越重要的作用,我國政府已經(jīng)將它列入“國家中長期科學技術(shù)發(fā)展綱領”。近年來,語言處理技術(shù),特別是基于國際互聯(lián)網(wǎng)的中文語言處理技術(shù)正在引起我國廣大科技工作者的高度重視。    本書既全面闡述了中文語言處理技術(shù)的特殊規(guī)律,又借鑒了國內(nèi)外學者在計算語言學領域里的最新成就,還包括了作者的實踐經(jīng)驗和體會。    本書可以作為計算機相關(guān)專業(yè)研究生的專業(yè)課教材,也可供相關(guān)專業(yè)高年級大學生和從事自然語言處理技術(shù)研究和應用的科技人員參考。

書籍目錄

第1章 引言第2章 數(shù)學基礎 2.1 初等概率理論  2.1.1 基本概念  2.1.2 條件概率與獨立  2.1.3 全概率公式與貝葉斯公式  2.1.4 隨機變量  2.1.5 多維隨機變量  2.1.6 數(shù)學期望與方差  2.1.7 常用分布 2.2 信息論基礎  2.2.1 信息熵  2.2.2 聯(lián)合熵和條件熵  2.2.3 互信息  2.2.4 相關(guān)熵  2.2.5 語言與熵  2.2.6 噪聲信道模型 2.3 粗糙集  2.3.1 信息系統(tǒng)  2.3.2 不可分辨關(guān)系  2.3.3 集合近似  2.3.4 約簡  2.3.5 屬性依從  2.3.6 決策規(guī)則合成 2.4 小結(jié)第3章 漢語自動分詞技術(shù) 3.1 引言 3.2 分詞規(guī)范 3.3 常用的分詞方法  3.3.1 正向最大匹配分詞  3.3.2 反向最大匹配分詞  3.3.3 基于統(tǒng)計的詞網(wǎng)格分詞 3.4 歧義的分類和識別  3.4.1 歧義的分類  3.4.2 歧義的抽取和消歧 3.5 新詞的識別  3.5.1 統(tǒng)計構(gòu)詞能力  3.5.2 漢字構(gòu)詞模式  3.5.3 未登錄詞識別算法 3.6 關(guān)于分詞的若干統(tǒng)計結(jié)果 3.7 語言單位的統(tǒng)計分布規(guī)律(Zipf定律) 3.8 小結(jié)第4章 基于數(shù)學統(tǒng)計的語言模型  4.1 統(tǒng)計語言模型概述 4.2 現(xiàn)有的主要統(tǒng)計語言模型  4.2.1 上下文無關(guān)模型  4.2.2 N元文法模型  4.2.3 N\|POS模型  4.2.4 基于決策樹的語言模型  4.2.5 動態(tài)、自適應、基于緩存的語言模型 4.3 數(shù)據(jù)平滑技術(shù)  4.3.1 數(shù)據(jù)平滑算法的評價標準  4.3.2 常見平滑方法 4.4 隱馬爾科夫模型  4.4.1 隨機過程  4.4.2 馬爾科夫鏈和馬爾科夫性  4.4.3 馬爾科夫模型  4.4.4 隱馬爾科夫模型 4.5 最大熵模型  4.5.1 模型介紹  4.5.2 模型評價  4.5.3 最大熵語言建?!?.6 小結(jié)第5章 基于語言理解的處理方法第6章 音字轉(zhuǎn)換技術(shù)第7章 自動文摘技術(shù)第8章 信息檢索技術(shù)第9章 文字識別技術(shù)

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    計算機自然語言處理 PDF格式下載


用戶評論 (總計3條)

 
 

  •   總的來說,非常好。基本代表了哈爾濱工業(yè)大學在計算機自然語言處理方面的水平。書中內(nèi)容比較淺顯。屬于入門類的。
  •   本書有些章節(jié)比較具體,但有些章節(jié)比較抽象,不夠具體,所以購買時應注意自己的需要,不要盲目購買。
  •   適合泛泛的了解一下。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7