統(tǒng)計(jì)自然語(yǔ)言處理

出版時(shí)間:2008-5  出版社:清華大學(xué)出版社  作者:宗成慶  頁(yè)數(shù):475  
Tag標(biāo)簽:無(wú)  

內(nèi)容概要

本書(shū)全面介紹了統(tǒng)計(jì)自然語(yǔ)言處理的基本概念、理論方法和最新研究進(jìn)展,內(nèi)容包括形式語(yǔ)言與自動(dòng)機(jī)及其在自然語(yǔ)言處理中的應(yīng)用、語(yǔ)言模型、隱馬爾可夫模型、語(yǔ)料庫(kù)技術(shù)、漢語(yǔ)自動(dòng)分詞與詞性標(biāo)注、句法分析、詞義消歧、統(tǒng)計(jì)機(jī)器翻譯、語(yǔ)音翻譯、文本分類、信息檢索與問(wèn)答系統(tǒng)、自動(dòng)文摘和信息抽取、口語(yǔ)信息處理與人機(jī)對(duì)話系統(tǒng)等,既有對(duì)基礎(chǔ)知識(shí)和理論模型的介紹,也有對(duì)相關(guān)問(wèn)題的研究背景、實(shí)現(xiàn)方法和技術(shù)現(xiàn)狀的詳細(xì)闡述。    本書(shū)可作為高等院校計(jì)算機(jī)、信息技術(shù)等相關(guān)專業(yè)的高年級(jí)本科生或研究生的教材或參考書(shū),也可供從事自然語(yǔ)言處理、數(shù)據(jù)挖掘和人工智能等研究的相關(guān)人員參考。

作者簡(jiǎn)介

宗成慶,1998年3月畢業(yè)于中國(guó)科學(xué)院計(jì)算技術(shù)研究所,獲博士學(xué)位。1998年5月至2000年4月在中國(guó)科學(xué)院自動(dòng)化研究所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室從事博士后研究,博士后出站以后留在模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室工作至今。曾于1999年和2001年兩次在日本國(guó)際電氣通信基礎(chǔ)技術(shù)研究所(ATR)

書(shū)籍目錄

第1章 緒論  1.1 基本概念   1.1.1 語(yǔ)言學(xué)與語(yǔ)音學(xué)  1.1.2 自然語(yǔ)言處理  1.1.3 關(guān)于“理解”的標(biāo)準(zhǔn) 1.2 自然語(yǔ)言處理研究的內(nèi)容和面臨的困難  1.2.1 自然語(yǔ)言處理研究的內(nèi)容  1.2.2 自然語(yǔ)言處理涉及的幾個(gè)層次  1.2.3 自然語(yǔ)言處理面臨的困難 1.3 自然語(yǔ)言處理的基本方法及其發(fā)展  1.3.1 自然語(yǔ)言處理的基本方法  1.3.2 自然語(yǔ)言處理的發(fā)展 1.4 自然語(yǔ)言處理的研究現(xiàn)狀第2章 預(yù)備知識(shí) 2.1 概率論基本概念  2.1.1 概率  2.1.2 最大似然估計(jì)  2.1.3 條件概率  2.1.4 貝葉斯法則  2.1.5 隨機(jī)變量  2.1.6 二項(xiàng)式分布  2.1.7 聯(lián)合概率分布和條件概率分布  2.1.8 貝葉斯決策理論  2.1.9 期望和方差 2.2 信息論基本概念  2.2.1 熵  2.2.2 聯(lián)合熵和條件熵  2.2.3 互信息  2.2.4 相對(duì)熵  2.2.5 交叉熵  2.2.6 困惑度  2.2.7 噪聲信道模型 2.3 支持向量機(jī)  2.3.1 線性分類  2.3.2 線性不可分  2.3.3 構(gòu)造核函數(shù)第3章 形式語(yǔ)言與自動(dòng)機(jī) 3.1 基本概念  3.1.1 圖  3.1.2 樹(shù)  3.1.3 字符串 3.2 形式語(yǔ)言  3.2.1 概述  3.2.2 形式語(yǔ)法的定義  3.2.3 形式語(yǔ)法的類型  3.2.4 CFG識(shí)別句子的派生樹(shù)表示 3.3 自動(dòng)機(jī)理論  3.3.1 有限自動(dòng)機(jī)  3.3.2 正則文法與自動(dòng)機(jī)的關(guān)系  3.3.3 上下文無(wú)關(guān)文法與下推自動(dòng)機(jī)  3.3.4 圖靈機(jī)  3.3.5 線性界限自動(dòng)機(jī) 3.4 自動(dòng)機(jī)在自然語(yǔ)言處理中的應(yīng)用  3.4.1 單詞拼寫(xiě)檢查  3.4.2 單詞形態(tài)分析  3.4.3 詞性消歧第4章 語(yǔ)料庫(kù)與詞匯知識(shí)庫(kù) 4.1 語(yǔ)料庫(kù)技術(shù)  4.1.1 概述  4.1.2 語(yǔ)料庫(kù)語(yǔ)言學(xué)的發(fā)展  4.1.3 語(yǔ)料庫(kù)的類型  4.1.4 典型語(yǔ)料庫(kù)介紹  4.1.5 漢語(yǔ)語(yǔ)料庫(kù)建設(shè)中的問(wèn)題 4.2 詞匯知識(shí)庫(kù)  ……第5章 語(yǔ)言模型第6章 隱馬爾可夫模型第7章 漢語(yǔ)自動(dòng)分詞與詞性標(biāo)注第8章 句法分析第9章 語(yǔ)義消歧第10章 統(tǒng)計(jì)機(jī)器翻譯第11章 語(yǔ)音翻譯第12章 文本分類第13章 信息檢索與問(wèn)答系統(tǒng)第14章 自動(dòng)文摘與信息抽取第15章 口語(yǔ)信息處理與人機(jī)對(duì)話系統(tǒng)附錄 項(xiàng)目作業(yè)名詞術(shù)語(yǔ)索引參考文獻(xiàn)

章節(jié)摘錄

  第1章 緒論  1.1 基本概念  1.1.1 語(yǔ)言學(xué)與語(yǔ)音學(xué)  我們知道,語(yǔ)言作為人類特有的用來(lái)表達(dá)情感,交流思想的工具,是一種特殊的社會(huì)現(xiàn)象,由語(yǔ)音、詞匯和語(yǔ)法構(gòu)成。語(yǔ)音和文字是構(gòu)成語(yǔ)言的兩個(gè)基本屬性,語(yǔ)音是語(yǔ)言的物質(zhì)外殼,文字則是記錄語(yǔ)言的書(shū)寫(xiě)符號(hào)系統(tǒng)〔黃伯榮等,1991〕。  根據(jù)《現(xiàn)代語(yǔ)言學(xué)詞典》〔克里斯特爾,2002〕的定義,語(yǔ)言學(xué)(linguistics)是指對(duì)語(yǔ)言的科學(xué)研究。作為一門(mén)純理論的學(xué)科,語(yǔ)言學(xué)在近期獲得了快速發(fā)展,尤其從20世紀(jì)60年代起,已經(jīng)成為一門(mén)知曉度很高的廣泛教授的學(xué)科?! 「鶕?jù)語(yǔ)言學(xué)家的注意中心和興趣范圍,語(yǔ)言學(xué)可以區(qū)分為一些不同的分支,例如,歷時(shí)語(yǔ)言(diachronic linguistics)或稱歷史語(yǔ)言學(xué)(historical linguistics)、共時(shí)語(yǔ)言學(xué)(synchronic linguistics)、一般語(yǔ)言學(xué)(descriptive linguistics)、理論語(yǔ)言學(xué)(theoretical linguistics)、描述語(yǔ)言學(xué)(descriptive linguistics)、對(duì)比語(yǔ)言學(xué)(contrastive linguistics)或類型語(yǔ)言學(xué)(typological linguistics)、結(jié)構(gòu)語(yǔ)言學(xué)(structural linguistics)等。  語(yǔ)音學(xué)(phonetics)是研究人類發(fā)音特點(diǎn),特別是語(yǔ)音發(fā)音特點(diǎn),并提出各種語(yǔ)音描述、分類和轉(zhuǎn)寫(xiě)方法的科學(xué)。語(yǔ)音學(xué)一般有三個(gè)分支:①發(fā)音語(yǔ)音學(xué)(articulatory),研究發(fā)音器官是如何產(chǎn)生語(yǔ)音的;②聲學(xué)語(yǔ)音學(xué)(acoustic phonetics),研究口耳之間傳遞語(yǔ)音的物理屬性;③聽(tīng)覺(jué)語(yǔ)音學(xué)(auditory phonetics),研究人通過(guò)耳、聽(tīng)覺(jué)神經(jīng)和大腦對(duì)語(yǔ)音的知覺(jué)反應(yīng)。儀器語(yǔ)音學(xué)(instrumendal phonetics)則是利用各種物理設(shè)備,如測(cè)量氣流或分析聲波的儀器等,來(lái)研究上述三個(gè)問(wèn)題的任一方面〔克里斯特爾,2002〕。

編輯推薦

  《中文信息處理叢書(shū)·統(tǒng)計(jì)自然語(yǔ)言處理》可作為高等院校計(jì)算機(jī)、信息技術(shù)等相關(guān)專業(yè)的高年級(jí)本科生或研究生的教材或參考書(shū),也可供從事自然語(yǔ)言處理、數(shù)據(jù)挖掘和人工智能等研究的相關(guān)人員參考。

圖書(shū)封面

圖書(shū)標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    統(tǒng)計(jì)自然語(yǔ)言處理 PDF格式下載


用戶評(píng)論 (總計(jì)69條)

 
 

  •   雖然統(tǒng)計(jì)機(jī)器翻譯已經(jīng)成為主流,但是系統(tǒng)地把方方面面的最新內(nèi)容綜合在一起的書(shū)還確實(shí)沒(méi)有.雖然因?yàn)闀r(shí)間原因還沒(méi)有仔細(xì)閱讀,但是相信對(duì)自然語(yǔ)言處理方面的初學(xué)者還是非常有用的.
  •   該書(shū)系統(tǒng)介紹了自然語(yǔ)言處理中最新的一些理論和方法,對(duì)從事自然語(yǔ)言處理研究的人有很好的理論指導(dǎo)意義。書(shū)的封面設(shè)計(jì)的很有特色,給人一種厚重的感覺(jué),我認(rèn)為理論著作就應(yīng)該是這種感覺(jué),文字排版美觀大方,紙張質(zhì)量也不錯(cuò),讀起來(lái)感覺(jué)很舒適。總之這是一本非常值得收藏的書(shū)。
  •   除了國(guó)外翻譯的書(shū)以外,全面系統(tǒng)的專門(mén)論述統(tǒng)計(jì)語(yǔ)言處理方法的中文圖書(shū)很少。本書(shū)深入淺出的敘述了統(tǒng)計(jì)方法在語(yǔ)言處理各個(gè)領(lǐng)域的應(yīng)用,是一本很好的學(xué)習(xí)資料和參考書(shū)。
  •   我一口氣看完了這本書(shū),書(shū)寫(xiě)的很好!
    內(nèi)容非常豐富!
    確實(shí)是統(tǒng)計(jì)自然語(yǔ)言處理方面較全的書(shū),很值得一看!

  •   這本書(shū)無(wú)論從排版還是內(nèi)容都屬精品。比較適合研究自然語(yǔ)言處理的科研人員使用,里面有很多算法,也有較新的方法。需要代碼的就不必買(mǎi)了。
  •   自然語(yǔ)言處理這塊有點(diǎn)偏,這本書(shū)已經(jīng)算權(quán)威了。
  •   在自然語(yǔ)言處理領(lǐng)域中值得學(xué)習(xí),可以考慮購(gòu)買(mǎi)。

































































  •   對(duì)于自然語(yǔ)言處理入門(mén)的同學(xué),是本好書(shū)
  •   理論性較強(qiáng),最做自然語(yǔ)言處理有很大幫助
  •   中文信息處理的經(jīng)典書(shū)籍,應(yīng)該是國(guó)內(nèi)相關(guān)領(lǐng)域排名靠前的著作,大家的作品
  •   自然語(yǔ)言的東東講的比較全面系統(tǒng),是不多的教材撒~~~
  •   很不錯(cuò)的一本書(shū),尤其機(jī)器翻譯部分幫助不小。
  •   互聯(lián)網(wǎng)時(shí)代的重要技術(shù)。
  •   清華老師的講義,書(shū)很厚很全面,要花大力氣研究
  •   介紹得很詳細(xì),完全是數(shù)學(xué),呵呵!
  •   還沒(méi)有認(rèn)真讀。書(shū)應(yīng)該不錯(cuò)吧。中文nlp,要認(rèn)真讀。
  •   讀過(guò)好幾章了,覺(jué)得很難看懂,很抽象,要是有具體的案例分析那該有多好的。
  •   這書(shū)還是很好的,比較全面
  •   有些地方寫(xiě)的有問(wèn)題。
  •   很喜歡的一本書(shū),雖然圖書(shū)館有,還是忍不住入手為私有!
  •   書(shū)的品質(zhì)和內(nèi)容都不錯(cuò)!學(xué)習(xí)NLP的好書(shū)。
  •   書(shū)不錯(cuò)內(nèi)容也很好
  •   第一版就是我做搜索引擎入門(mén)的書(shū),第二版加入了一些新的內(nèi)容,非常好。尤其是最后一章,性能調(diào)試,真的非常棒,受益匪淺。
  •   此書(shū)內(nèi)容豐富,是一本好書(shū)
  •   書(shū)的內(nèi)容真的很有真諦!
  •   非常好,很優(yōu)惠。就是送貨圖中耽擱了下,沒(méi)滿足我新年看新書(shū)的愿望~
  •   國(guó)人寫(xiě)的書(shū)中相當(dāng)不錯(cuò)的了。。。
  •   是國(guó)內(nèi)領(lǐng)先的系統(tǒng)性、理論性很強(qiáng)的NLP書(shū)籍。
  •   速度快 服務(wù)好 質(zhì)量沒(méi)的說(shuō)
  •   送貨快,比書(shū)店里買(mǎi)還實(shí)惠,非常好!
  •   忙過(guò)這幾天就開(kāi)讀.........
  •   正品,送貨效率也不錯(cuò)!
  •   沒(méi)開(kāi)發(fā)票啊,失誤了
  •   需要學(xué)一下這書(shū),學(xué)長(zhǎng)推薦的。
  •   用心寫(xiě)的書(shū)啊
  •   服務(wù)不錯(cuò),基本祥實(shí).
  •   主要介紹了當(dāng)今統(tǒng)計(jì)自然語(yǔ)言處理的熱門(mén)技術(shù)及發(fā)展現(xiàn)狀。但沒(méi)有對(duì)一些技術(shù)進(jìn)行深入講解,是一本較好的入門(mén)級(jí)參考文獻(xiàn)。
  •   內(nèi)容很全面,但是基本算法都是點(diǎn)到而止,這樣一個(gè)厚度的書(shū),也就只能寫(xiě)到這么多了,統(tǒng)計(jì)自然語(yǔ)言很多值得研究的地方,不是一本書(shū)可以積累的
  •   此書(shū)是國(guó)內(nèi)自然語(yǔ)言處理領(lǐng)域第一層次的書(shū)了,值得一看
  •   該圖書(shū)較全面的介紹了漢文信息處理,當(dāng)然不是中文,對(duì)中文和漢文的區(qū)別不甚了解,建議您閱讀“通用文字法”...
  •   這本書(shū)呢 整體上來(lái)講 還不錯(cuò),雖然絕大部分章節(jié)都是按照國(guó)外的原文翻譯的,但是也有很高的參考價(jià)值,只是希望作者能夠在外文原文的基礎(chǔ)上能給出適當(dāng)?shù)睦?,這樣感覺(jué)更好些,比如第五章的“語(yǔ)言模型”,雖然,前兩個(gè)算法有例題,但是后面的平滑算法就沒(méi)有,當(dāng)然原論文也是沒(méi)有的,如果作者能夠給予添加適當(dāng)?shù)睦},這樣才是好書(shū),要不就是成翻譯書(shū)了。
    總體上推薦購(gòu)買(mǎi)!
  •   還不錯(cuò),不過(guò)需要一些數(shù)理統(tǒng)計(jì)的知識(shí)基礎(chǔ)才能看得很明白。在國(guó)人寫(xiě)的書(shū)里面算是上品了。正在搞文本挖掘的項(xiàng)目,這書(shū)給了很大的幫助,頂一個(gè)
  •   自然語(yǔ)言類的好書(shū),,是正版的,,值得一看
  •   是本好書(shū),要是把書(shū)名改《機(jī)器翻譯》然后去掉一些根本沒(méi)有用心寫(xiě)的章節(jié)那就經(jīng)典了!
  •   比較全面的介紹 比較理論 深度不夠 具體算法描述的還不夠細(xì)致
  •   感覺(jué)這本書(shū)還不錯(cuò),內(nèi)容很全面,適合我這樣的初學(xué)者
  •   內(nèi)容比較細(xì)致,有點(diǎn)教材的感覺(jué),照顧到了初學(xué)者。
  •   經(jīng)典教材,慢慢理解
  •   這本書(shū)是相當(dāng)經(jīng)典的一本書(shū),我的導(dǎo)師一直推薦我們看這本書(shū)。這本書(shū)確實(shí)很好,很值得一讀啊。
  •   紙張 印刷質(zhì)量都不錯(cuò),送貨也很快,內(nèi)容更好 。
  •   印刷質(zhì)量還可以,就是書(shū)被壓搓變形了
  •   書(shū)內(nèi)頁(yè)有20多頁(yè)一摸就掉了,可能裝訂的時(shí)候不太留心。希望能檢查書(shū)的質(zhì)量,保證服務(wù)的品質(zhì)。
  •   跟圖書(shū)館借來(lái)的書(shū)剛好形成了對(duì)比,不過(guò)質(zhì)量還是過(guò)得去的。
  •   書(shū)不錯(cuò),送貨很快,態(tài)度很好。
  •   剛開(kāi)始學(xué)習(xí),貌似還不錯(cuò)!
  •   幫老師買(mǎi)的,送貨很快,態(tài)度也不錯(cuò),書(shū)也很好,總體不錯(cuò)啦!
  •   給老公買(mǎi)的,沒(méi)有聽(tīng)到他說(shuō)什么不好的
  •   這本書(shū)基本上是把一些理論堆砌在了一起,許多只是簡(jiǎn)單性的介紹,缺少例子,書(shū)中的公式缺乏推倒,解釋也不全面,如果想真正學(xué)會(huì)點(diǎn)東西或技術(shù),需要閱讀書(shū)中提到的相關(guān)文獻(xiàn),自學(xué)此書(shū)有一定困難??赡鼙救怂接邢?,缺乏相應(yīng)基礎(chǔ)...
  •   還在看,很多公式感覺(jué)寫(xiě)得不嚴(yán)謹(jǐn)。有些解釋也寫(xiě)得不夠清楚,可能還得再細(xì)看理解、參考論文再整理。
  •   教材書(shū),必看的,推薦
  •   剛買(mǎi)回來(lái),還沒(méi)有仔細(xì)看!
    從目錄上看,內(nèi)容很豐富!
  •   前面幾個(gè)章節(jié)還可以,再往后就都是數(shù)學(xué)公式,講的比較籠統(tǒng),不能讓人很好地理解
  •   各種定理和大段公式,教科書(shū)類書(shū)籍,不適合入門(mén)閱讀
  •   果然是大學(xué)教材書(shū),里面全是理論。雖然這些思想很重要,但起碼要告訴一點(diǎn)編程的技巧吧~~
  •   自然語(yǔ)言處理經(jīng)典書(shū)籍
  •   統(tǒng)計(jì)自然語(yǔ)言處理
  •   不錯(cuò)的書(shū),屯著慢慢看
  •   是正版書(shū),內(nèi)容不錯(cuò)哦
  •   自然語(yǔ)言處理的入門(mén)書(shū)
 

250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7