出版時間:2007-9 出版社:清華大學出版社 作者:苗奪謙,衛(wèi)志華 編著 頁數(shù):321
Tag標簽:無
內(nèi)容概要
本書是一本全面系統(tǒng)地介紹中文文本信息處理的教材,內(nèi)容豐富,由淺入深地講述了中文文本信息處理的原理與應用。本書不僅介紹了基于規(guī)則的自然語言分析方法,也介紹了基于統(tǒng)計學的方法。全書共分為四大部分,分別是詞法分析、語法處理、語義分析和應用與技術。其中前三部分是自然語言處理的基本理論,第一部分針對中文處理中特有的分詞問題,介紹了自動分詞算法、分詞中歧義的消除和未登錄詞的識別算法,另外還介紹了語料庫的相關知識。第二部分和第三部分都是從語法(語義)的表示入手,將自然語言形式化,再給出語法(語義)分析的算法,并針對該過程中的歧義問題給出了一些成熟的解決方案。最后一部分講述自然語言理解在信息檢索、信息抽取、自動文摘和文本分類等領域的應用。本書思路清晰,在每部分及每章的開始都介紹了該部分知識與其他部分之間的關系,以及該部分的知識點之間的關系,以幫助讀者從整體上把握中文文本信息處理的思路,并能根據(jù)不同的需求或不同的問題選擇適當?shù)乃惴ā! ”緯婕皟?nèi)容廣泛,能滿足不同水平讀者群的需求,可以作為計算機、信息類高年級本科生的教材,也可作為自然語言處理方向研究生的教材,也非常適合作為自然語言處理應用領域的研究人員和技術人員的參考資料。
書籍目錄
第1章 概論 1.1 自然語言處理與中文信息處理 1.2 自然語言處理的新趨勢 1.3 本書內(nèi)容組織第一部分 詞法分析 第2章 自動分詞 2.1 關于自動分詞 2.2 分詞詞典 2.3 機械分詞方法 第3章 分詞歧義消解 3.1 關于分詞歧義 3.2 基于規(guī)則的分詞消歧 3.3 基于統(tǒng)計方法的分詞消歧 第4章 未登錄詞獲取 4.1 關于未登錄詞 4.2 基于統(tǒng)計學的未登錄詞獲取方法 4.3 中文姓名的自動辨識 4.4 中文統(tǒng)計詞匯獲取 4.5 無詞典分詞方法 第5章 語料庫的構建 5.1 關于語料庫 5.2 漢語語料庫的基本加工規(guī)范 5.3 建設語料庫的其他問題 第一部分習題第二部分 語法處理 第6章 自動標注 6.1 關于自動標注 6.2 馬爾可夫模型和隱馬爾可夫模型 6.3 馬爾可夫模型標注器 6.4 隱馬爾可夫模型標注器 第7章 語法表示 7.1 關于語法表示 7.2 形式語法描述 7.3 短語結(jié)構語法 7.4 轉(zhuǎn)移網(wǎng)絡 7.5 短語結(jié)構與句法樹 第8章 語法分析 8.1 關于語法分析 8.2 基于符號串的句法分析 8.3 自底向上的圖句法分析 8.4 自頂向下的圖句法分析 8.5 基于轉(zhuǎn)移網(wǎng)絡的句法分析 8.6 移進歸約句法分析器 8.7 概率上下文無關文法分析 第二部分習題第三部分 語義分析 第9章 語義表示 9.1 關于語義表示 9.2 語義的邏輯表示方法 9.3 論旨角色 9.4 語義網(wǎng)絡表示法 9.5 框架表示法 9.6 量詞的處理 第10章 語義分析 10.1 關于語義分析 10.2 組合理論與語義解釋 10.3 基于語義特征的解釋方法 10.4 基于語法關系的語義分析 10.5 語義語法 10.6 模板匹配 10.7 語義驅(qū)動的分析技術 第11章 語義消歧 11.1 關于語義歧義 11.2 選擇限制法消歧 11.3 語義網(wǎng)絡 11.4 統(tǒng)計詞義消歧 11.5 統(tǒng)計語義優(yōu)選 第三部分習題第四部分 應用與技術 第12章 文本分類 12.1 關于文本分類 12.2 文本分類方法 12.3 文本分類的評測 第13章 信息檢索 13.1 關于信息檢索 13.2 基于統(tǒng)計學的信息檢索模型 13.3 基于語義的信息檢索 13.4 典型信息檢索系統(tǒng) 13.5 信息檢索技術前沿 第14章 信息抽取 14.1 關于信息抽取 14.2 半結(jié)構化文本的信息抽取技術 14.3 典型信息抽取系統(tǒng) 14.4 Web信息抽取 第15章 自動文摘 15.1 關于自動文摘 15.2 自動文摘的方法 15.3 自動文摘系統(tǒng)的評測 15.4 自動文摘系統(tǒng) 第四部分習題參考文獻
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載