統(tǒng)計自然語言處理

出版時間:2008-5  出版社:清華大學(xué)出版社  作者:宗成慶  頁數(shù):475  
Tag標(biāo)簽:無  

內(nèi)容概要

本書全面介紹了統(tǒng)計自然語言處理的基本概念、理論方法和最新研究進(jìn)展,內(nèi)容包括形式語言與自動機及其在自然語言處理中的應(yīng)用、語言模型、隱馬爾可夫模型、語料庫技術(shù)、漢語自動分詞與詞性標(biāo)注、句法分析、詞義消歧、統(tǒng)計機器翻譯、語音翻譯、文本分類、信息檢索與問答系統(tǒng)、自動文摘和信息抽取、口語信息處理與人機對話系統(tǒng)等,既有對基礎(chǔ)知識和理論模型的介紹,也有對相關(guān)問題的研究背景、實現(xiàn)方法和技術(shù)現(xiàn)狀的詳細(xì)闡述。    本書可作為高等院校計算機、信息技術(shù)等相關(guān)專業(yè)的高年級本科生或研究生的教材或參考書,也可供從事自然語言處理、數(shù)據(jù)挖掘和人工智能等研究的相關(guān)人員參考。

作者簡介

宗成慶,1998年3月畢業(yè)于中國科學(xué)院計算技術(shù)研究所,獲博士學(xué)位。1998年5月至2000年4月在中國科學(xué)院自動化研究所模式識別國家重點實驗室從事博士后研究,博士后出站以后留在模式識別國家重點實驗室工作至今。曾于1999年和2001年兩次在日本國際電氣通信基礎(chǔ)技術(shù)研究所(ATR)

書籍目錄

第1章 緒論  1.1 基本概念   1.1.1 語言學(xué)與語音學(xué)  1.1.2 自然語言處理  1.1.3 關(guān)于“理解”的標(biāo)準(zhǔn) 1.2 自然語言處理研究的內(nèi)容和面臨的困難  1.2.1 自然語言處理研究的內(nèi)容  1.2.2 自然語言處理涉及的幾個層次  1.2.3 自然語言處理面臨的困難 1.3 自然語言處理的基本方法及其發(fā)展  1.3.1 自然語言處理的基本方法  1.3.2 自然語言處理的發(fā)展 1.4 自然語言處理的研究現(xiàn)狀第2章 預(yù)備知識 2.1 概率論基本概念  2.1.1 概率  2.1.2 最大似然估計  2.1.3 條件概率  2.1.4 貝葉斯法則  2.1.5 隨機變量  2.1.6 二項式分布  2.1.7 聯(lián)合概率分布和條件概率分布  2.1.8 貝葉斯決策理論  2.1.9 期望和方差 2.2 信息論基本概念  2.2.1 熵  2.2.2 聯(lián)合熵和條件熵  2.2.3 互信息  2.2.4 相對熵  2.2.5 交叉熵  2.2.6 困惑度  2.2.7 噪聲信道模型 2.3 支持向量機  2.3.1 線性分類  2.3.2 線性不可分  2.3.3 構(gòu)造核函數(shù)第3章 形式語言與自動機 3.1 基本概念  3.1.1 圖  3.1.2 樹  3.1.3 字符串 3.2 形式語言  3.2.1 概述  3.2.2 形式語法的定義  3.2.3 形式語法的類型  3.2.4 CFG識別句子的派生樹表示 3.3 自動機理論  3.3.1 有限自動機  3.3.2 正則文法與自動機的關(guān)系  3.3.3 上下文無關(guān)文法與下推自動機  3.3.4 圖靈機  3.3.5 線性界限自動機 3.4 自動機在自然語言處理中的應(yīng)用  3.4.1 單詞拼寫檢查  3.4.2 單詞形態(tài)分析  3.4.3 詞性消歧第4章 語料庫與詞匯知識庫 4.1 語料庫技術(shù)  4.1.1 概述  4.1.2 語料庫語言學(xué)的發(fā)展  4.1.3 語料庫的類型  4.1.4 典型語料庫介紹  4.1.5 漢語語料庫建設(shè)中的問題 4.2 詞匯知識庫  ……第5章 語言模型第6章 隱馬爾可夫模型第7章 漢語自動分詞與詞性標(biāo)注第8章 句法分析第9章 語義消歧第10章 統(tǒng)計機器翻譯第11章 語音翻譯第12章 文本分類第13章 信息檢索與問答系統(tǒng)第14章 自動文摘與信息抽取第15章 口語信息處理與人機對話系統(tǒng)附錄 項目作業(yè)名詞術(shù)語索引參考文獻(xiàn)

章節(jié)摘錄

  第1章 緒論  1.1 基本概念  1.1.1 語言學(xué)與語音學(xué)  我們知道,語言作為人類特有的用來表達(dá)情感,交流思想的工具,是一種特殊的社會現(xiàn)象,由語音、詞匯和語法構(gòu)成。語音和文字是構(gòu)成語言的兩個基本屬性,語音是語言的物質(zhì)外殼,文字則是記錄語言的書寫符號系統(tǒng)〔黃伯榮等,1991〕?! 「鶕?jù)《現(xiàn)代語言學(xué)詞典》〔克里斯特爾,2002〕的定義,語言學(xué)(linguistics)是指對語言的科學(xué)研究。作為一門純理論的學(xué)科,語言學(xué)在近期獲得了快速發(fā)展,尤其從20世紀(jì)60年代起,已經(jīng)成為一門知曉度很高的廣泛教授的學(xué)科?! 「鶕?jù)語言學(xué)家的注意中心和興趣范圍,語言學(xué)可以區(qū)分為一些不同的分支,例如,歷時語言(diachronic linguistics)或稱歷史語言學(xué)(historical linguistics)、共時語言學(xué)(synchronic linguistics)、一般語言學(xué)(descriptive linguistics)、理論語言學(xué)(theoretical linguistics)、描述語言學(xué)(descriptive linguistics)、對比語言學(xué)(contrastive linguistics)或類型語言學(xué)(typological linguistics)、結(jié)構(gòu)語言學(xué)(structural linguistics)等。  語音學(xué)(phonetics)是研究人類發(fā)音特點,特別是語音發(fā)音特點,并提出各種語音描述、分類和轉(zhuǎn)寫方法的科學(xué)。語音學(xué)一般有三個分支:①發(fā)音語音學(xué)(articulatory),研究發(fā)音器官是如何產(chǎn)生語音的;②聲學(xué)語音學(xué)(acoustic phonetics),研究口耳之間傳遞語音的物理屬性;③聽覺語音學(xué)(auditory phonetics),研究人通過耳、聽覺神經(jīng)和大腦對語音的知覺反應(yīng)。儀器語音學(xué)(instrumendal phonetics)則是利用各種物理設(shè)備,如測量氣流或分析聲波的儀器等,來研究上述三個問題的任一方面〔克里斯特爾,2002〕。

編輯推薦

  《中文信息處理叢書·統(tǒng)計自然語言處理》可作為高等院校計算機、信息技術(shù)等相關(guān)專業(yè)的高年級本科生或研究生的教材或參考書,也可供從事自然語言處理、數(shù)據(jù)挖掘和人工智能等研究的相關(guān)人員參考。

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    統(tǒng)計自然語言處理 PDF格式下載


用戶評論 (總計69條)

 
 

  •   雖然統(tǒng)計機器翻譯已經(jīng)成為主流,但是系統(tǒng)地把方方面面的最新內(nèi)容綜合在一起的書還確實沒有.雖然因為時間原因還沒有仔細(xì)閱讀,但是相信對自然語言處理方面的初學(xué)者還是非常有用的.
  •   該書系統(tǒng)介紹了自然語言處理中最新的一些理論和方法,對從事自然語言處理研究的人有很好的理論指導(dǎo)意義。書的封面設(shè)計的很有特色,給人一種厚重的感覺,我認(rèn)為理論著作就應(yīng)該是這種感覺,文字排版美觀大方,紙張質(zhì)量也不錯,讀起來感覺很舒適??傊@是一本非常值得收藏的書。
  •   除了國外翻譯的書以外,全面系統(tǒng)的專門論述統(tǒng)計語言處理方法的中文圖書很少。本書深入淺出的敘述了統(tǒng)計方法在語言處理各個領(lǐng)域的應(yīng)用,是一本很好的學(xué)習(xí)資料和參考書。
  •   我一口氣看完了這本書,書寫的很好!
    內(nèi)容非常豐富!
    確實是統(tǒng)計自然語言處理方面較全的書,很值得一看!

  •   這本書無論從排版還是內(nèi)容都屬精品。比較適合研究自然語言處理的科研人員使用,里面有很多算法,也有較新的方法。需要代碼的就不必買了。
  •   自然語言處理這塊有點偏,這本書已經(jīng)算權(quán)威了。
  •   在自然語言處理領(lǐng)域中值得學(xué)習(xí),可以考慮購買。

































































  •   對于自然語言處理入門的同學(xué),是本好書
  •   理論性較強,最做自然語言處理有很大幫助
  •   中文信息處理的經(jīng)典書籍,應(yīng)該是國內(nèi)相關(guān)領(lǐng)域排名靠前的著作,大家的作品
  •   自然語言的東東講的比較全面系統(tǒng),是不多的教材撒~~~
  •   很不錯的一本書,尤其機器翻譯部分幫助不小。
  •   互聯(lián)網(wǎng)時代的重要技術(shù)。
  •   清華老師的講義,書很厚很全面,要花大力氣研究
  •   介紹得很詳細(xì),完全是數(shù)學(xué),呵呵!
  •   還沒有認(rèn)真讀。書應(yīng)該不錯吧。中文nlp,要認(rèn)真讀。
  •   讀過好幾章了,覺得很難看懂,很抽象,要是有具體的案例分析那該有多好的。
  •   這書還是很好的,比較全面
  •   有些地方寫的有問題。
  •   很喜歡的一本書,雖然圖書館有,還是忍不住入手為私有!
  •   書的品質(zhì)和內(nèi)容都不錯!學(xué)習(xí)NLP的好書。
  •   書不錯內(nèi)容也很好
  •   第一版就是我做搜索引擎入門的書,第二版加入了一些新的內(nèi)容,非常好。尤其是最后一章,性能調(diào)試,真的非常棒,受益匪淺。
  •   此書內(nèi)容豐富,是一本好書
  •   書的內(nèi)容真的很有真諦!
  •   非常好,很優(yōu)惠。就是送貨圖中耽擱了下,沒滿足我新年看新書的愿望~
  •   國人寫的書中相當(dāng)不錯的了。。。
  •   是國內(nèi)領(lǐng)先的系統(tǒng)性、理論性很強的NLP書籍。
  •   速度快 服務(wù)好 質(zhì)量沒的說
  •   送貨快,比書店里買還實惠,非常好!
  •   忙過這幾天就開讀.........
  •   正品,送貨效率也不錯!
  •   沒開發(fā)票啊,失誤了
  •   需要學(xué)一下這書,學(xué)長推薦的。
  •   用心寫的書啊
  •   服務(wù)不錯,基本祥實.
  •   主要介紹了當(dāng)今統(tǒng)計自然語言處理的熱門技術(shù)及發(fā)展現(xiàn)狀。但沒有對一些技術(shù)進(jìn)行深入講解,是一本較好的入門級參考文獻(xiàn)。
  •   內(nèi)容很全面,但是基本算法都是點到而止,這樣一個厚度的書,也就只能寫到這么多了,統(tǒng)計自然語言很多值得研究的地方,不是一本書可以積累的
  •   此書是國內(nèi)自然語言處理領(lǐng)域第一層次的書了,值得一看
  •   該圖書較全面的介紹了漢文信息處理,當(dāng)然不是中文,對中文和漢文的區(qū)別不甚了解,建議您閱讀“通用文字法”...
  •   這本書呢 整體上來講 還不錯,雖然絕大部分章節(jié)都是按照國外的原文翻譯的,但是也有很高的參考價值,只是希望作者能夠在外文原文的基礎(chǔ)上能給出適當(dāng)?shù)睦?,這樣感覺更好些,比如第五章的“語言模型”,雖然,前兩個算法有例題,但是后面的平滑算法就沒有,當(dāng)然原論文也是沒有的,如果作者能夠給予添加適當(dāng)?shù)睦},這樣才是好書,要不就是成翻譯書了。
    總體上推薦購買!
  •   還不錯,不過需要一些數(shù)理統(tǒng)計的知識基礎(chǔ)才能看得很明白。在國人寫的書里面算是上品了。正在搞文本挖掘的項目,這書給了很大的幫助,頂一個
  •   自然語言類的好書,,是正版的,,值得一看
  •   是本好書,要是把書名改《機器翻譯》然后去掉一些根本沒有用心寫的章節(jié)那就經(jīng)典了!
  •   比較全面的介紹 比較理論 深度不夠 具體算法描述的還不夠細(xì)致
  •   感覺這本書還不錯,內(nèi)容很全面,適合我這樣的初學(xué)者
  •   內(nèi)容比較細(xì)致,有點教材的感覺,照顧到了初學(xué)者。
  •   經(jīng)典教材,慢慢理解
  •   這本書是相當(dāng)經(jīng)典的一本書,我的導(dǎo)師一直推薦我們看這本書。這本書確實很好,很值得一讀啊。
  •   紙張 印刷質(zhì)量都不錯,送貨也很快,內(nèi)容更好 。
  •   印刷質(zhì)量還可以,就是書被壓搓變形了
  •   書內(nèi)頁有20多頁一摸就掉了,可能裝訂的時候不太留心。希望能檢查書的質(zhì)量,保證服務(wù)的品質(zhì)。
  •   跟圖書館借來的書剛好形成了對比,不過質(zhì)量還是過得去的。
  •   書不錯,送貨很快,態(tài)度很好。
  •   剛開始學(xué)習(xí),貌似還不錯!
  •   幫老師買的,送貨很快,態(tài)度也不錯,書也很好,總體不錯啦!
  •   給老公買的,沒有聽到他說什么不好的
  •   這本書基本上是把一些理論堆砌在了一起,許多只是簡單性的介紹,缺少例子,書中的公式缺乏推倒,解釋也不全面,如果想真正學(xué)會點東西或技術(shù),需要閱讀書中提到的相關(guān)文獻(xiàn),自學(xué)此書有一定困難??赡鼙救怂接邢蓿狈ο鄳?yīng)基礎(chǔ)...
  •   還在看,很多公式感覺寫得不嚴(yán)謹(jǐn)。有些解釋也寫得不夠清楚,可能還得再細(xì)看理解、參考論文再整理。
  •   教材書,必看的,推薦
  •   剛買回來,還沒有仔細(xì)看!
    從目錄上看,內(nèi)容很豐富!
  •   前面幾個章節(jié)還可以,再往后就都是數(shù)學(xué)公式,講的比較籠統(tǒng),不能讓人很好地理解
  •   各種定理和大段公式,教科書類書籍,不適合入門閱讀
  •   果然是大學(xué)教材書,里面全是理論。雖然這些思想很重要,但起碼要告訴一點編程的技巧吧~~
  •   自然語言處理經(jīng)典書籍
  •   統(tǒng)計自然語言處理
  •   不錯的書,屯著慢慢看
  •   是正版書,內(nèi)容不錯哦
  •   自然語言處理的入門書
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7