中文信息處理技術(shù)教程

出版時(shí)間:2005-9  出版社:第1版 (2005年9月1日)  作者:朱巧明  頁(yè)數(shù):291  字?jǐn)?shù):436000  
Tag標(biāo)簽:無(wú)  

內(nèi)容概要

計(jì)算機(jī)中文信息處理技術(shù)是一門綜合性的交叉學(xué)科,它包含了計(jì)算機(jī)科學(xué)、數(shù)學(xué)、認(rèn)知心理學(xué)和語(yǔ)言學(xué)等多門學(xué)科。全書(shū)分三個(gè)部分,比較系統(tǒng)地介紹了計(jì)算機(jī)中文信息處理技術(shù)的研究對(duì)象、研究方法和技術(shù)。第1章~第4章主要介紹中文信息處理技術(shù)中的一些基礎(chǔ)理論和基礎(chǔ)知識(shí);第5章~第8章主要介紹中文信息處理技術(shù)中的基本I/O技術(shù)以及相關(guān)的字形技術(shù);第9章~第12章主要介紹了中文信息處理技術(shù)中的自然語(yǔ)言處理技術(shù)。    本書(shū)可以作為高等學(xué)校計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)本科教材或參考書(shū),也可以作為計(jì)算機(jī)中文信息處理技術(shù)研究領(lǐng)域的研究生的教學(xué)參考書(shū)和計(jì)算機(jī)技術(shù)研發(fā)人員的參考書(shū)。

書(shū)籍目錄

第1章  概論	  1.1  信息處理	  1.2  中文信息處理	  1.3  計(jì)算機(jī)中文信息處理主要研究對(duì)象  1.4  現(xiàn)代漢語(yǔ)的特點(diǎn)	  1.5  中文信息處理的國(guó)際化和本地化	  思考題	第2章  漢字信息在計(jì)算機(jī)內(nèi)部的表示	  2.1  英文字符在計(jì)算機(jī)內(nèi)部的表示	  2.2  中文信息在計(jì)算機(jī)中的表示	  2.3  漢字代碼體系	  2.4  漢字的排序	  2.5  漢字編碼字符集	  思考題	第3章  漢字字符編碼集的應(yīng)用	  3.1  漢字的簡(jiǎn)繁轉(zhuǎn)換	    3.1.1  漢字簡(jiǎn)化字標(biāo)準(zhǔn)介紹	    3.1.2  簡(jiǎn)繁—繁簡(jiǎn)轉(zhuǎn)換中遇到的問(wèn)題    3.1.3  漢字簡(jiǎn)繁—繁簡(jiǎn)轉(zhuǎn)換的實(shí)現(xiàn)	  3.2  Internet上常用的字符編碼集	    3.2.1  UUENCODE 編碼	    3.2.2  QUOTED-PRINTABLE編碼	    3.2.3  BASE64編碼	    3.2.4  HZ編碼	    3.2.5  UTF編碼	    思考題	    附錄 第4章  漢字編碼技術(shù)	  4.1  漢字編碼的發(fā)展	  4.2  漢字編碼中的幾個(gè)概念	    4.2.1  字符集/字匯和詞匯	    4.2.2  碼元	    4.2.3  碼長(zhǎng)	    4.2.4  單碼和重碼	    4.2.5  編碼空間和編碼效率	  4.3  漢字編碼理論	    4.3.1  漢字的熵	    4.3.2  漢字鍵盤編碼的依據(jù)	    4.3.3  漢字編碼分類	    4.3.4  鍵盤編碼和鍵盤	  4.4  數(shù)碼鍵盤方案	    4.4.1  縱橫碼	    4.4.2  五筆數(shù)碼	    4.4.3  統(tǒng)一碼	  4.5  漢字編碼的標(biāo)準(zhǔn)和規(guī)范	    4.5.1  漢字編碼國(guó)家標(biāo)準(zhǔn)和規(guī)范	    4.5.2  與漢字編碼有關(guān)的標(biāo)準(zhǔn)與規(guī)范說(shuō)明	    4.5.3  漢字鍵盤編碼和輸入系統(tǒng)的性能指標(biāo)	  思考題	第5章  中文平臺(tái)與中文操作系統(tǒng)	  5.1  中文平臺(tái)與中文操作系統(tǒng)歷史	  5.2  中文操作系統(tǒng)設(shè)計(jì)方法	  5.3  漢字處理模塊與漢字代碼體系	  5.4  常用中文操作系統(tǒng)簡(jiǎn)介    5.4.1  CC-DOS	    5.4.2  中文Windows	    5.4.3  中文Linux操作系統(tǒng)    5.4.4  中文嵌入式操作系統(tǒng)  思考題	第6章  漢字輸入技術(shù)	  6.1  漢字輸入技術(shù)概述    6.1.1  漢字輸入發(fā)展史    6.1.2  漢字輸入分類    6.1.3  漢字輸入技術(shù)的發(fā)展和應(yīng)用  6.2  漢字鍵盤輸入技術(shù)    6.2.1  鍵盤    6.2.2  漢字鍵盤輸入原理    6.2.3  鍵盤漢字輸入的總體流程    6.2.4  輸入碼對(duì)照表的設(shè)計(jì)  6.3  漢字鍵盤輸入系統(tǒng)	    6.3.1  漢字輸入系統(tǒng)的分類	    6.3.2  漢字輸入系統(tǒng)的功能	    6.3.3  漢字鍵盤輸入系統(tǒng)的工作流程  6.4  Windows漢字輸入技術(shù)	    6.4.1  概述	    6.4.2  Windows中的漢字輸入原理	    6.4.3  輸入法生成器	    6.4.4  在SDK和DDK環(huán)境下開(kāi)發(fā)輸入系統(tǒng)	  6.5  Linux下的漢字輸入系統(tǒng)	    6.5.1  概述	    6.5.2  XIM協(xié)議	    6.5.3  輸入法服務(wù)器和輸入法	    6.5.4  輸入法設(shè)計(jì)	  思考題	第7章  漢字字形和字形庫(kù)管理技術(shù)	  7.1  漢字字形概述	    7.1.1  漢字字形及其特點(diǎn)	    7.1.2  字形、字型和字形庫(kù)	    7.1.3  字形描述技術(shù)及其種類	  7.2  字形描述技術(shù)	    7.2.1  點(diǎn)陣字形描述技術(shù)	    7.2.2  輪廓矢量字形描述技術(shù)	    7.2.3  曲線輪廓字形描述技術(shù)	    7.2.4  其他字形描述技術(shù)	  7.3  字形的壓縮和還原	    7.3.1  字形點(diǎn)陣的壓縮和還原	    7.3.2  輪廓矢量字形的壓縮方法	    7.3.3  其他字形壓縮技術(shù)	  7.4  字形的放大和縮小	    7.4.1  漢字的字號(hào)	    7.4.2  字形放大和縮小的基本原理	    7.4.3  防止字形放大和縮小失真措施	    7.4.4  字形放大縮小的應(yīng)用	  7.5  TTF字形技術(shù)	    7.5.1  什么是TrueType	    7.5.2  TrueType的基本原理	    7.5.3  TrueType字體文件結(jié)構(gòu)	    7.5.4  TrueType的特點(diǎn)和優(yōu)勢(shì)	    7.5.5  TrueType的應(yīng)用	    7.5.6  OpenType的出現(xiàn)	  7.6  字庫(kù)的設(shè)計(jì)和管理技術(shù)	    7.6.1  漢字字庫(kù)的基本要求	    7.6.2  漢字庫(kù)性能的評(píng)測(cè)	    7.6.3  漢字庫(kù)結(jié)構(gòu)的設(shè)計(jì)	    7.6.4  點(diǎn)陣字庫(kù)的制作  7.7  漢字字庫(kù)的應(yīng)用	    7.7.1  造字程序的使用	    7.7.2  安裝新字體	  思考題	第8章  漢字輸出技術(shù)	  8.1  漢字的輸出技術(shù)綜述	  8.2  漢字顯示輸出原理和基本結(jié)構(gòu)	    8.2.1  顯示設(shè)備	    8.2.2  漢字顯示的原理	    8.2.3  內(nèi)碼緩沖區(qū)和字形緩沖區(qū)	    8.2.4  漢字顯示輸出過(guò)程	    8.2.5  漢字終端	  8.3  漢字顯示技術(shù)實(shí)例	    8.3.1  DOS下的漢字顯示技術(shù)	    8.3.2  Windows的漢字顯示技術(shù)	  8.4  打印輸出原理和基本結(jié)構(gòu)	    8.4.1  打印設(shè)備	    8.4.2  漢字打印概述	    8.4.3  漢字打印原理	    8.4.4  漢字打印過(guò)程	    8.4.5  漢字打印機(jī)	  思考題	第9章  漢語(yǔ)分詞	  9.1  漢語(yǔ)分詞的概念	  9.2  分詞詞典	    9.2.1  分詞詞典簡(jiǎn)介	    9.2.2  基于詞屬性的分詞詞典	    9.2.3  基于二次索引的分詞詞典	  9.3  常用的漢語(yǔ)分詞算法	    9.3.1  正向最大匹配算法	    9.3.2  逆向最大匹配算法	    9.3.3  鄰近匹配算法	    9.3.4  最短路徑匹配算法	    9.3.5  基于統(tǒng)計(jì)的最短路徑分詞算法  9.4  無(wú)詞典分詞方法	    9.4.1  分詞模型	    9.4.2  無(wú)詞典分詞算法	  9.5  交集型歧義的切分	    9.5.1  基本概念	    9.5.2  利用互信息和t-測(cè)試差處理交集型歧義切分	  思考題	第10章  中文信息檢索	  10.1  信息檢索概述	    10.1.1  信息檢索的定義	    10.1.2  結(jié)構(gòu)、半結(jié)構(gòu)和非結(jié)構(gòu)化文檔    10.1.3  信息檢索的任務(wù)	    10.1.4  信息檢索的評(píng)測(cè)	    10.1.5  中文信息檢索的特點(diǎn)	    10.1.6  信息檢索的模型	    10.1.7  信息檢索系統(tǒng)的結(jié)構(gòu)	  10.2  基于統(tǒng)計(jì)的信息檢索模型	    10.2.1  傳統(tǒng)的布爾模型	    10.2.2  擴(kuò)展的布爾模型	    10.2.3  向量空間模型	    10.2.4  概率模型	  10.3  基于語(yǔ)義的信息檢索	    10.3.1  自然語(yǔ)言處理	    10.3.2  潛在語(yǔ)義索引	    10.3.3  神經(jīng)網(wǎng)絡(luò)	  10.4  信息檢索系統(tǒng)介紹	  10.5  Web信息檢索	    10.5.1  Web信息檢索系統(tǒng)	    10.5.2  Web信息檢索的特點(diǎn)	    10.5.3  搜索引擎	    10.5.4  搜索引擎的網(wǎng)頁(yè)分級(jí)算法	    10.5.5  常用Web搜索引擎	    10.5.6  搜索引擎技術(shù)的發(fā)展趨勢(shì)	  思考題	第11章  中文信息抽取  11.1  信息抽取概述	    11.1.1  信息抽取的含義	    11.1.2  信息抽取實(shí)例	    11.1.3  信息抽取和信息檢索	    11.1.4  中文信息抽取的特殊性	    11.1.5  信息抽取的歷史和現(xiàn)狀	    11.1.6  信息抽取系統(tǒng)的評(píng)測(cè)	    11.1.7  信息抽取任務(wù)	  11.2  信息抽取系統(tǒng)的結(jié)構(gòu)	    11.2.1  信息抽取系統(tǒng)的構(gòu)建方法	    11.2.2  通用信息抽取結(jié)構(gòu)	    11.2.3  Bare Bones結(jié)構(gòu)	  11.3  信息抽取中的自然語(yǔ)言處理技術(shù)	    11.3.1  命名實(shí)體識(shí)別	    11.3.2  句法分析	    11.3.3  文章分析和推理    11.3.4  知識(shí)理解	  11.4  信息抽取技術(shù)	    11.4.1  基于規(guī)則的信息抽取技術(shù)	    11.4.2  隱馬爾可夫模型  11.5  Web信息抽取	    11.5.1  基于自然語(yǔ)言處理方式的信息抽取	    11.5.2  包裝器方式的信息抽取	    11.5.3  基于本體方式的信息抽取	    11.5.4  基于HTML結(jié)構(gòu)的信息抽取    11.5.5  基于Web查詢的信息抽取	  思考題	第12章  中文文本分類技術(shù)	  12.1  文本分類的概念	    12.1.1  什么是文本分類	    12.1.2  文本分類的兩種類型	    12.1.3  文本分類的兩種方式	    12.1.4  中文文本分類	    12.1.5  文本分類的國(guó)內(nèi)外研究情況  12.2  文本特征的選擇	    12.2.1  預(yù)處理	    12.2.2  文本特征的選擇	  12.3  文本分類方法	    12.3.1  Rocchio方法——相似度計(jì)算方法    12.3.2  Na?ve Bayes——貝葉斯方法	    12.3.3  KNN方法——K近鄰方法    12.3.4  SVM——支持向量機(jī)	    12.3.5  Decision Tree——決策樹(shù)方法  12.4  選擇閾值的策略	  12.5  評(píng)估方法	  思考題	參考文獻(xiàn)

圖書(shū)封面

圖書(shū)標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    中文信息處理技術(shù)教程 PDF格式下載


用戶評(píng)論 (總計(jì)1條)

 
 

  •   我是喜歡,但這種書(shū)的需求估計(jì)不會(huì)太多,太轉(zhuǎn)業(yè)了。
 

250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7