中文文本信息處理的原理與應用

出版時間:2007-9  出版社:清華大學出版社  作者:苗奪謙,衛(wèi)志華 編著  頁數(shù):321  
Tag標簽:無  

內(nèi)容概要

本書是一本全面系統(tǒng)地介紹中文文本信息處理的教材,內(nèi)容豐富,由淺入深地講述了中文文本信息處理的原理與應用。本書不僅介紹了基于規(guī)則的自然語言分析方法,也介紹了基于統(tǒng)計學的方法。全書共分為四大部分,分別是詞法分析、語法處理、語義分析和應用與技術。其中前三部分是自然語言處理的基本理論,第一部分針對中文處理中特有的分詞問題,介紹了自動分詞算法、分詞中歧義的消除和未登錄詞的識別算法,另外還介紹了語料庫的相關知識。第二部分和第三部分都是從語法(語義)的表示入手,將自然語言形式化,再給出語法(語義)分析的算法,并針對該過程中的歧義問題給出了一些成熟的解決方案。最后一部分講述自然語言理解在信息檢索、信息抽取、自動文摘和文本分類等領域的應用。本書思路清晰,在每部分及每章的開始都介紹了該部分知識與其他部分之間的關系,以及該部分的知識點之間的關系,以幫助讀者從整體上把握中文文本信息處理的思路,并能根據(jù)不同的需求或不同的問題選擇適當?shù)乃惴ā! ”緯婕皟?nèi)容廣泛,能滿足不同水平讀者群的需求,可以作為計算機、信息類高年級本科生的教材,也可作為自然語言處理方向研究生的教材,也非常適合作為自然語言處理應用領域的研究人員和技術人員的參考資料。

書籍目錄

第1章 概論 1.1 自然語言處理與中文信息處理 1.2 自然語言處理的新趨勢 1.3 本書內(nèi)容組織第一部分 詞法分析 第2章 自動分詞  2.1 關于自動分詞  2.2 分詞詞典  2.3 機械分詞方法 第3章 分詞歧義消解  3.1 關于分詞歧義  3.2 基于規(guī)則的分詞消歧  3.3 基于統(tǒng)計方法的分詞消歧 第4章 未登錄詞獲取  4.1 關于未登錄詞  4.2 基于統(tǒng)計學的未登錄詞獲取方法  4.3 中文姓名的自動辨識  4.4 中文統(tǒng)計詞匯獲取  4.5 無詞典分詞方法 第5章 語料庫的構建  5.1 關于語料庫  5.2 漢語語料庫的基本加工規(guī)范  5.3 建設語料庫的其他問題 第一部分習題第二部分 語法處理 第6章 自動標注  6.1 關于自動標注  6.2 馬爾可夫模型和隱馬爾可夫模型  6.3 馬爾可夫模型標注器    6.4 隱馬爾可夫模型標注器 第7章 語法表示  7.1 關于語法表示  7.2 形式語法描述  7.3 短語結(jié)構語法  7.4 轉(zhuǎn)移網(wǎng)絡  7.5 短語結(jié)構與句法樹 第8章 語法分析  8.1 關于語法分析  8.2 基于符號串的句法分析  8.3 自底向上的圖句法分析  8.4 自頂向下的圖句法分析  8.5 基于轉(zhuǎn)移網(wǎng)絡的句法分析  8.6 移進歸約句法分析器  8.7 概率上下文無關文法分析 第二部分習題第三部分 語義分析 第9章 語義表示  9.1 關于語義表示  9.2 語義的邏輯表示方法  9.3 論旨角色  9.4 語義網(wǎng)絡表示法  9.5 框架表示法  9.6 量詞的處理 第10章 語義分析  10.1 關于語義分析  10.2 組合理論與語義解釋  10.3 基于語義特征的解釋方法  10.4 基于語法關系的語義分析  10.5 語義語法  10.6 模板匹配  10.7 語義驅(qū)動的分析技術 第11章 語義消歧  11.1 關于語義歧義   11.2 選擇限制法消歧  11.3 語義網(wǎng)絡  11.4 統(tǒng)計詞義消歧  11.5 統(tǒng)計語義優(yōu)選 第三部分習題第四部分 應用與技術 第12章 文本分類  12.1 關于文本分類  12.2 文本分類方法  12.3 文本分類的評測 第13章 信息檢索  13.1 關于信息檢索  13.2 基于統(tǒng)計學的信息檢索模型  13.3 基于語義的信息檢索  13.4 典型信息檢索系統(tǒng)  13.5 信息檢索技術前沿 第14章 信息抽取  14.1 關于信息抽取  14.2 半結(jié)構化文本的信息抽取技術  14.3 典型信息抽取系統(tǒng)  14.4 Web信息抽取 第15章 自動文摘  15.1 關于自動文摘  15.2 自動文摘的方法  15.3 自動文摘系統(tǒng)的評測  15.4 自動文摘系統(tǒng) 第四部分習題參考文獻

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    中文文本信息處理的原理與應用 PDF格式下載


用戶評論 (總計13條)

 
 

  •   這本書寫的不錯,我已看過多次了,適合自然語言初學者的確是本好書。
  •   這本書很適合信息管理、情報學專業(yè)同學好好學習的。
  •   本書難度不小,適合有時間鉆研的朋友。
  •   不錯 是很新 是正版吧 反正和我們老師用的一模一樣
  •   抄也就算了,抄了也不好好組織一下!
  •   由于市場上這類書比較少,所以可以說開卷有益吧!書還是有點偏理論,對于像我這樣沒有基礎的學習者挺合適的。
  •   很水的一本書,還不如買本《統(tǒng)計自然語言處理基礎》來看看
  •   還沒來得及細看,粗粗翻了一下,還不錯
  •   這本書的作者我認識,同濟計算機系的一位知名教授.可是書中大段大段抄襲別人的內(nèi)容,讓讀者很不爽.如果沒有中文文本處理/自然語言處理基礎的讀者可以買一本看看.
  •   介紹了各種方法,沒有深入研究
  •   信息處理方面很不錯的教材
  •   這本書還可以,講解較為全面,作為入門教材比較可以。
  •   介紹的太范,太淺
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7