中文信息處理教程

出版時間:2011-6  出版社:高等教育出版社  作者:宋繼華,楊爾弘,王強軍 編  頁數(shù):283  
Tag標簽:無  

內(nèi)容概要

  《普通高等教育“十一五”國家級規(guī)劃教材:中文信息處理教程》是編者依據(jù)自身的教學實踐,在學習、吸收、借鑒前輩經(jīng)驗的基礎上歸納、提煉而成的中文信息處理教材。書中比較系統(tǒng)地介紹了本學科領域的基本原理、方法和應用技術?!  镀胀ǜ叩冉逃笆晃濉眹壹壱?guī)劃教材:中文信息處理教程》共8章,按中文信息處理的語言單位層級——漢字、詞語、句子、篇章依次展開。內(nèi)容包括:導論、漢字的信息處理、詞的信息處理、句子的信息處理、句子語義表達與分析。中文信息處理的基礎資源、文本分析與處理、中文信息處理評測。  《普通高等教育“十一五”國家級規(guī)劃教材:中文信息處理教程》的特色是簡明、實用,邏輯性強,可讀性好,注重引導學生動手解決實際問題。每章都附有習題,并給出了大部分習題的參考答案?!  镀胀ǜ叩冉逃笆晃濉眹壹壱?guī)劃教材:中文信息處理教程》可作為高等學校計算機、信息管理等專業(yè)本科生和研究生的教材,也可供從事中文信息處理研究和應用的科技工作者參考。

書籍目錄

第1章 導論本章概覽知識結構圖1.1 基本概念1.1.1 學科由來1.1.2 學科定位1.2 研究內(nèi)容1.3 難點分析1.3.1 歧義1.3.2 語法1.4 研究路線1.5 習題第2章 漢字的信息處理本章概覽知識結構圖2.1 基礎知識2.1.1 漢字的形、音、義2.1.2 漢字的字頻和字量2.1.3 漢字的編碼2.2 交換碼和內(nèi)碼2.2.1 ASCⅡ2.2.2 編碼框架:ISO/IEC20222.2.3 GB23122.2.4 BIG52.2.5 ISO/IECl0646和Unicode2.2.6 GBK2.2.7 GBL80302.2.8 編程務實2.3 漢字的輸入2.3.1 鍵盤輸入2.3.2 字形識別2.3.3 語音識別2.4 漢字的輸出2.5 中文編碼的前沿課題2.5.1 古籍數(shù)字化2.5.2 《通用規(guī)范漢字表》2.5.3 少數(shù)民族文字2.6 習題第3章 詞的信息處理本章概覽知識結構圖3.1 基礎知識3.1.1 概率論基礎3.1.2 信息論基礎3.1.3 n元語法模型3.1.4 語法模型的性能評價3.2 自動分詞3.2.1 漢語詞的界定3.2.2 自動分詞方法3.2.3 未登錄詞的識別3.3 詞性標注3.3.1 詞性標注概述3.3.2 基于統(tǒng)計的詞性標注方法3.3.3 基于規(guī)則的詞性標注方法3.4 命名實體識別3.4.1 命名實體識別介紹3.4.2 中文命名實體的定義和標準3.4.3 中文命名實體識別方法3.5 習題第4章 句子的信息處理本章概覽知識結構圖4.1 形式語言基礎4.1.1 形式語言理論4.1.2 自動機理論4.2 短語結構語法4.2.1 漢語短語結構語法4.2.2 分析算法4.2.3 實用策略4.3 依存語法4.3.1 依存句法理論4.3.2 分析算法4.4 句法理論探索4.4.1 Chomsky語法理論4.4.2 廣義短語結構語法4.4.3 鏈語法4.4.4 范疇語法4.5 習題第5章 句子語義表達與分析本章概覽知識結構圖5.1 格語法5.1.1 基本思想5.1.2 格的分類5.1.3 格的判斷5.1.4 用格語法生成句子5.1.5 漢語格語法5.2 概念依存理論5.2.1 基本模型5.2.2 語義推理5.2.3 腳本法5.3 概念層次網(wǎng)絡(HNC)5.4 語義本體5.5 習題第6章 中文信息處理的基礎資源本章概覽知識結構圖6.1 語料庫概述6.1.1 語料庫發(fā)展歷史6.1.2 語料庫屬性6.2 典型中文語科庫介紹6.2.1 北京大學計算語言學研究所《人民日報》標注語料庫6.2.2 清華大學漢語樹庫6.2.3 哈爾濱工業(yè)大學漢語依存樹庫6.2.4 中國臺灣"中央研究院"語料庫6.2.5 國家語言文字工作委員會語料庫6.2.6 山西大學語料庫6.3 典型中文語言知識庫資源介紹6.3.1 北京大學計算語言學研究所綜合型語言知識庫6.3.2 知網(wǎng)6.3.3 中國臺灣"中央研究院"中文詞匯網(wǎng)絡6.3.4 概念層次網(wǎng)絡6.3.5 漢語框架網(wǎng)知識庫6.4 中文語言資源聯(lián)盟6.5 習題第7章 文本分析與處理本章概覽知識結構圖7.1 文本分類7.1.1 文本表示7.1.2 文本分類算法7.2 信息檢索7.2.1 常用的檢索模型7.2.2 搜索引擎7.3 問答系統(tǒng)7.3.1 問答系統(tǒng)概述7.3.2 系統(tǒng)構成7.3.3 典型問答系統(tǒng)介紹7.4 信息抽取7.4.1 信息抽取概述7.4.2 系統(tǒng)的基本構成及關鍵技術7.5 自動文摘7.5.1 自動文摘概述7.5.2 基于統(tǒng)計的機械文摘7.5.3 基于意義的理解文摘7.6 習題第8章 中文信息處理評測本章概覽知識結構圖8.1 評測概述8.1.1 評測的意義8.1.2 評測的過程8.2 系列評測介紹8.2.1 NIST系列評測8.2.2 ACL-SIGHAN系列評測8.2.3 863技術測評8.2.4 中文信息學會評測8.3 各領域技術評測介紹8.3.1 中文分詞和詞性標注評測8.3.2 詞義消歧評測8.3.3 句法分析評測8.3.4 文本分類器性能評估8.3.5 信息檢索系統(tǒng)的評測8.3.6 問答系統(tǒng)評測8.3.7 信息抽取評測8.3.8 自動文摘評測8.4 習題部分習題參考答案參考文獻

編輯推薦

  《普通高等教育“十一五”國家級規(guī)劃教材:中文信息處理教程》共8章,按中文信息處理的語言單位層級——漢字、詞語、句子、篇章依次展開。內(nèi)容包括:導論、漢字的信息處理、詞的信息處理、句子的信息處理、句子語義表達與分析。中文信息處理的基礎資源、文本分析與處理、中文信息處理評測。本書的特色是簡明、實用,邏輯性強,可讀性好,注重引導學生動手解決實際問題。每章都附有習題,并給出了大部分習題的參考答案。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    中文信息處理教程 PDF格式下載


用戶評論 (總計0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7