出版時(shí)間:2008-5 出版社:清華大學(xué)出版社 作者:宗成慶 頁(yè)數(shù):475
Tag標(biāo)簽:無(wú)
內(nèi)容概要
本書(shū)全面介紹了統(tǒng)計(jì)自然語(yǔ)言處理的基本概念、理論方法和最新研究進(jìn)展,內(nèi)容包括形式語(yǔ)言與自動(dòng)機(jī)及其在自然語(yǔ)言處理中的應(yīng)用、語(yǔ)言模型、隱馬爾可夫模型、語(yǔ)料庫(kù)技術(shù)、漢語(yǔ)自動(dòng)分詞與詞性標(biāo)注、句法分析、詞義消歧、統(tǒng)計(jì)機(jī)器翻譯、語(yǔ)音翻譯、文本分類、信息檢索與問(wèn)答系統(tǒng)、自動(dòng)文摘和信息抽取、口語(yǔ)信息處理與人機(jī)對(duì)話系統(tǒng)等,既有對(duì)基礎(chǔ)知識(shí)和理論模型的介紹,也有對(duì)相關(guān)問(wèn)題的研究背景、實(shí)現(xiàn)方法和技術(shù)現(xiàn)狀的詳細(xì)闡述。 本書(shū)可作為高等院校計(jì)算機(jī)、信息技術(shù)等相關(guān)專業(yè)的高年級(jí)本科生或研究生的教材或參考書(shū),也可供從事自然語(yǔ)言處理、數(shù)據(jù)挖掘和人工智能等研究的相關(guān)人員參考。
作者簡(jiǎn)介
宗成慶,1998年3月畢業(yè)于中國(guó)科學(xué)院計(jì)算技術(shù)研究所,獲博士學(xué)位。1998年5月至2000年4月在中國(guó)科學(xué)院自動(dòng)化研究所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室從事博士后研究,博士后出站以后留在模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室工作至今。曾于1999年和2001年兩次在日本國(guó)際電氣通信基礎(chǔ)技術(shù)研究所(ATR)
書(shū)籍目錄
第1章 緒論 1.1 基本概念 1.1.1 語(yǔ)言學(xué)與語(yǔ)音學(xué) 1.1.2 自然語(yǔ)言處理 1.1.3 關(guān)于“理解”的標(biāo)準(zhǔn) 1.2 自然語(yǔ)言處理研究的內(nèi)容和面臨的困難 1.2.1 自然語(yǔ)言處理研究的內(nèi)容 1.2.2 自然語(yǔ)言處理涉及的幾個(gè)層次 1.2.3 自然語(yǔ)言處理面臨的困難 1.3 自然語(yǔ)言處理的基本方法及其發(fā)展 1.3.1 自然語(yǔ)言處理的基本方法 1.3.2 自然語(yǔ)言處理的發(fā)展 1.4 自然語(yǔ)言處理的研究現(xiàn)狀第2章 預(yù)備知識(shí) 2.1 概率論基本概念 2.1.1 概率 2.1.2 最大似然估計(jì) 2.1.3 條件概率 2.1.4 貝葉斯法則 2.1.5 隨機(jī)變量 2.1.6 二項(xiàng)式分布 2.1.7 聯(lián)合概率分布和條件概率分布 2.1.8 貝葉斯決策理論 2.1.9 期望和方差 2.2 信息論基本概念 2.2.1 熵 2.2.2 聯(lián)合熵和條件熵 2.2.3 互信息 2.2.4 相對(duì)熵 2.2.5 交叉熵 2.2.6 困惑度 2.2.7 噪聲信道模型 2.3 支持向量機(jī) 2.3.1 線性分類 2.3.2 線性不可分 2.3.3 構(gòu)造核函數(shù)第3章 形式語(yǔ)言與自動(dòng)機(jī) 3.1 基本概念 3.1.1 圖 3.1.2 樹(shù) 3.1.3 字符串 3.2 形式語(yǔ)言 3.2.1 概述 3.2.2 形式語(yǔ)法的定義 3.2.3 形式語(yǔ)法的類型 3.2.4 CFG識(shí)別句子的派生樹(shù)表示 3.3 自動(dòng)機(jī)理論 3.3.1 有限自動(dòng)機(jī) 3.3.2 正則文法與自動(dòng)機(jī)的關(guān)系 3.3.3 上下文無(wú)關(guān)文法與下推自動(dòng)機(jī) 3.3.4 圖靈機(jī) 3.3.5 線性界限自動(dòng)機(jī) 3.4 自動(dòng)機(jī)在自然語(yǔ)言處理中的應(yīng)用 3.4.1 單詞拼寫(xiě)檢查 3.4.2 單詞形態(tài)分析 3.4.3 詞性消歧第4章 語(yǔ)料庫(kù)與詞匯知識(shí)庫(kù) 4.1 語(yǔ)料庫(kù)技術(shù) 4.1.1 概述 4.1.2 語(yǔ)料庫(kù)語(yǔ)言學(xué)的發(fā)展 4.1.3 語(yǔ)料庫(kù)的類型 4.1.4 典型語(yǔ)料庫(kù)介紹 4.1.5 漢語(yǔ)語(yǔ)料庫(kù)建設(shè)中的問(wèn)題 4.2 詞匯知識(shí)庫(kù) ……第5章 語(yǔ)言模型第6章 隱馬爾可夫模型第7章 漢語(yǔ)自動(dòng)分詞與詞性標(biāo)注第8章 句法分析第9章 語(yǔ)義消歧第10章 統(tǒng)計(jì)機(jī)器翻譯第11章 語(yǔ)音翻譯第12章 文本分類第13章 信息檢索與問(wèn)答系統(tǒng)第14章 自動(dòng)文摘與信息抽取第15章 口語(yǔ)信息處理與人機(jī)對(duì)話系統(tǒng)附錄 項(xiàng)目作業(yè)名詞術(shù)語(yǔ)索引參考文獻(xiàn)
章節(jié)摘錄
第1章 緒論 1.1 基本概念 1.1.1 語(yǔ)言學(xué)與語(yǔ)音學(xué) 我們知道,語(yǔ)言作為人類特有的用來(lái)表達(dá)情感,交流思想的工具,是一種特殊的社會(huì)現(xiàn)象,由語(yǔ)音、詞匯和語(yǔ)法構(gòu)成。語(yǔ)音和文字是構(gòu)成語(yǔ)言的兩個(gè)基本屬性,語(yǔ)音是語(yǔ)言的物質(zhì)外殼,文字則是記錄語(yǔ)言的書(shū)寫(xiě)符號(hào)系統(tǒng)〔黃伯榮等,1991〕。 根據(jù)《現(xiàn)代語(yǔ)言學(xué)詞典》〔克里斯特爾,2002〕的定義,語(yǔ)言學(xué)(linguistics)是指對(duì)語(yǔ)言的科學(xué)研究。作為一門(mén)純理論的學(xué)科,語(yǔ)言學(xué)在近期獲得了快速發(fā)展,尤其從20世紀(jì)60年代起,已經(jīng)成為一門(mén)知曉度很高的廣泛教授的學(xué)科?! 「鶕?jù)語(yǔ)言學(xué)家的注意中心和興趣范圍,語(yǔ)言學(xué)可以區(qū)分為一些不同的分支,例如,歷時(shí)語(yǔ)言(diachronic linguistics)或稱歷史語(yǔ)言學(xué)(historical linguistics)、共時(shí)語(yǔ)言學(xué)(synchronic linguistics)、一般語(yǔ)言學(xué)(descriptive linguistics)、理論語(yǔ)言學(xué)(theoretical linguistics)、描述語(yǔ)言學(xué)(descriptive linguistics)、對(duì)比語(yǔ)言學(xué)(contrastive linguistics)或類型語(yǔ)言學(xué)(typological linguistics)、結(jié)構(gòu)語(yǔ)言學(xué)(structural linguistics)等。 語(yǔ)音學(xué)(phonetics)是研究人類發(fā)音特點(diǎn),特別是語(yǔ)音發(fā)音特點(diǎn),并提出各種語(yǔ)音描述、分類和轉(zhuǎn)寫(xiě)方法的科學(xué)。語(yǔ)音學(xué)一般有三個(gè)分支:①發(fā)音語(yǔ)音學(xué)(articulatory),研究發(fā)音器官是如何產(chǎn)生語(yǔ)音的;②聲學(xué)語(yǔ)音學(xué)(acoustic phonetics),研究口耳之間傳遞語(yǔ)音的物理屬性;③聽(tīng)覺(jué)語(yǔ)音學(xué)(auditory phonetics),研究人通過(guò)耳、聽(tīng)覺(jué)神經(jīng)和大腦對(duì)語(yǔ)音的知覺(jué)反應(yīng)。儀器語(yǔ)音學(xué)(instrumendal phonetics)則是利用各種物理設(shè)備,如測(cè)量氣流或分析聲波的儀器等,來(lái)研究上述三個(gè)問(wèn)題的任一方面〔克里斯特爾,2002〕。
編輯推薦
《中文信息處理叢書(shū)·統(tǒng)計(jì)自然語(yǔ)言處理》可作為高等院校計(jì)算機(jī)、信息技術(shù)等相關(guān)專業(yè)的高年級(jí)本科生或研究生的教材或參考書(shū),也可供從事自然語(yǔ)言處理、數(shù)據(jù)挖掘和人工智能等研究的相關(guān)人員參考。
圖書(shū)封面
圖書(shū)標(biāo)簽Tags
無(wú)
評(píng)論、評(píng)分、閱讀與下載
統(tǒng)計(jì)自然語(yǔ)言處理 PDF格式下載
250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版