自然語(yǔ)言處理的形式模型

出版時(shí)間:2010  出版社:中國(guó)科學(xué)技術(shù)大學(xué)出版社  作者:馮志偉  頁(yè)數(shù):638  
Tag標(biāo)簽:無(wú)  

前言

  大學(xué)最重要的功能是向社會(huì)輸送人才,大學(xué)對(duì)于一個(gè)國(guó)家、民族乃至世界的重要性和貢獻(xiàn)度,很大程度上是通過(guò)畢業(yè)生在社會(huì)各領(lǐng)域所取得的成就來(lái)體現(xiàn)的?! ≈袊?guó)科學(xué)技術(shù)大學(xué)建校只有短短的五十年,之所以迅速成為享有較高國(guó)際聲譽(yù)的著名大學(xué)之一,主要就是因?yàn)樗囵B(yǎng)出了一大批德才兼?zhèn)涞膬?yōu)秀畢業(yè)生。他們志向高遠(yuǎn)、基礎(chǔ)扎實(shí)、綜合素質(zhì)高、創(chuàng)新能力強(qiáng),在國(guó)內(nèi)外科技、經(jīng)濟(jì)、教育等領(lǐng)域做出了杰出的貢獻(xiàn),為中國(guó)科大贏得了“科技英才的搖籃”的美譽(yù)?! ?008年9月,胡錦濤總書(shū)記為中國(guó)科大建校五十周年發(fā)來(lái)賀信,信中稱(chēng)贊說(shuō):半個(gè)世紀(jì)以來(lái),中國(guó)科學(xué)技術(shù)大學(xué)依托中國(guó)科學(xué)院,按照全院辦校、所系結(jié)合的方針,弘揚(yáng)紅專(zhuān)并進(jìn)、理實(shí)交融的校風(fēng),努力推進(jìn)教學(xué)和科研工作的改革創(chuàng)新,為黨和國(guó)家培養(yǎng)了一大批科技人才,取得了一系列具有世界先進(jìn)水平的原創(chuàng)性科技成果,為推動(dòng)我國(guó)科教事業(yè)發(fā)展和社會(huì)主義現(xiàn)代化建設(shè)做出了重要貢獻(xiàn)?! ?jù)統(tǒng)計(jì),中國(guó)科大迄今已畢業(yè)的5萬(wàn)人中,已有42人當(dāng)選中國(guó)科學(xué)院和中國(guó)工程院院士,是同期(自1963年以來(lái))畢業(yè)生中當(dāng)選院士數(shù)最多的高校之一。其中,本科畢業(yè)生中平均每1000人就產(chǎn)生1名院士和700多名碩士、博士,比例位居全國(guó)高校之首。還有眾多的中青年才俊成為我國(guó)科技、企業(yè)、教育等領(lǐng)域的領(lǐng)軍人物和骨干。在歷年評(píng)選的“中國(guó)青年五四獎(jiǎng)?wù)隆鲍@得者中,作為科技界、科技創(chuàng)新型企業(yè)界青年才俊代表,科大畢業(yè)生已連續(xù)多年榜上有名,獲獎(jiǎng)總?cè)藬?shù)位居全國(guó)高校前列。鮮為人知的是,有數(shù)千名優(yōu)秀畢業(yè)生踏上國(guó)防戰(zhàn)線,為科技強(qiáng)軍做出了重要貢獻(xiàn),涌現(xiàn)出20多名科技將軍和一大批國(guó)防科技中堅(jiān)。

內(nèi)容概要

  本書(shū)對(duì)自然語(yǔ)言處理中的各種形式模型進(jìn)行了系統(tǒng)的梳理,分別討論了基于短語(yǔ)結(jié)構(gòu)語(yǔ)法的形式模型、基于合一運(yùn)算的形式模型、基于依存和配價(jià)的形式模型、基于格語(yǔ)法的形式模型、基于詞匯主義的形式模型、語(yǔ)義自動(dòng)處理的形式模型、語(yǔ)用自動(dòng)處理的形式模型、隱馬爾可夫模型、統(tǒng)計(jì)機(jī)器翻譯的形式模型?!蹲匀徽Z(yǔ)言處理的形式模型》說(shuō)理透徹、語(yǔ)言流暢、實(shí)例豐富、深入淺出,適合于從事自然語(yǔ)言處理教學(xué)和研究的科研人員、大學(xué)師生閱讀,也可以作為人工智能、計(jì)算語(yǔ)言學(xué)等課程的教學(xué)參考。

書(shū)籍目錄

總序前言第1章 自然語(yǔ)言處理的學(xué)科定位 1.1 從自然語(yǔ)言處理的過(guò)程來(lái)考察其學(xué)科定位 1.2 從自然語(yǔ)言處理的范圍來(lái)考察其學(xué)科定位 1.3 從自然語(yǔ)言處理的歷史來(lái)考察其學(xué)科定位 1.4 當(dāng)前自然語(yǔ)言處理發(fā)展的幾個(gè)特點(diǎn)第2章 語(yǔ)言計(jì)算研究的先驅(qū) 2.1 Markov鏈 2.2 Zipf定律 2.3 Shannon關(guān)于“熵”的研究 2.4 Bar-Hillel的范疇語(yǔ)法 2.5 Harris的語(yǔ)言串分析法 2.6 o.c.KysmrHHa的語(yǔ)言集合論模型第3章 基于短語(yǔ)結(jié)構(gòu)語(yǔ)法的形式模型 3.1 語(yǔ)法的Chomsky層級(jí) 3.2 有限狀態(tài)語(yǔ)法和它的局限性 3.3 短語(yǔ)結(jié)構(gòu)語(yǔ)法 3.4 遞歸轉(zhuǎn)移網(wǎng)絡(luò)和擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò) 3.5 自底向上分析和自頂向下分析 3.6 通用句法生成器和線圖分析法 3.7 Earley算法 3.8 左角分析法 3.9 CYK算法 3.10 Tomita算法 3.11 管轄-約束理論與最簡(jiǎn)方案 3.12 Joshi的樹(shù)鄰接語(yǔ)法 3.13 漢字結(jié)構(gòu)的形式描述第4章 基于合一運(yùn)算的形式模型 4.1 中文信息MMT模型 4.2 Kaplan的詞匯功能語(yǔ)法 4.3 MartinKay的功能合一語(yǔ)法 4.4 Gazdar的廣義短語(yǔ)結(jié)構(gòu)語(yǔ)法 4.5 Shieber的PATR 4.6 Pollard的中心語(yǔ)驅(qū)動(dòng)的短語(yǔ)結(jié)構(gòu)語(yǔ)法 4.7 Pereira和Warren定子句語(yǔ)法第5章 基于依存和配價(jià)的形式模型 5.1 配價(jià)觀念的起源 5.2 Tesni6re的依存語(yǔ)法 5.3 依存語(yǔ)法在自然語(yǔ)言處理中的應(yīng)用 5.4 配價(jià)語(yǔ)法 5.5 配價(jià)語(yǔ)法在自然語(yǔ)言處理中的應(yīng)用第6章 基于格語(yǔ)法的形式模型 6.1 Fillmore的格語(yǔ)法 6.2 Fillmore的框架網(wǎng)絡(luò)第7章 基于詞匯主義的形式模型 7.1 Gross的詞匯語(yǔ)法 7.2 鏈語(yǔ)法 7.3 詞匯語(yǔ)義學(xué) 7.4 知識(shí)本體 7.5 詞網(wǎng)WordNet 7.6 知網(wǎng)HowNet第8章 語(yǔ)義自動(dòng)處理的形式模型 8.1 義素分析法 8.2 語(yǔ)義場(chǎng) 8.3 語(yǔ)義網(wǎng)絡(luò) 8.4 Montague的蒙塔鳩語(yǔ)法 8.5 Wilks的優(yōu)選語(yǔ)義學(xué) 8.6 Schank的概念依存理論 8.7 Mel’chuk的意義㈢文本理論 8.8 詞義排歧方法第9章 系統(tǒng)功能語(yǔ)法 9.1 系統(tǒng)功能語(yǔ)法的基本概念 9.2 系統(tǒng)功能語(yǔ)法在自然語(yǔ)言處理中的應(yīng)用第10章 語(yǔ)用自動(dòng)處理的形式模型 10.1 Mann和Thompson的修辭結(jié)構(gòu)理論 10.2 文本連貫中的常識(shí)推理技術(shù)第11章 概率語(yǔ)法 11.1 概率上下文無(wú)關(guān)語(yǔ)法與句子的歧義 11.2 概率上下文無(wú)關(guān)語(yǔ)法的基本原理 11.3 概率上下文無(wú)關(guān)語(yǔ)法的三個(gè)假設(shè) 11.4 概率詞匯化上下文無(wú)關(guān)語(yǔ)法第12章 Bayes公式與動(dòng)態(tài)規(guī)劃算法 12.1 拼寫(xiě)錯(cuò)誤的檢查與更正 12.2 Bayes公式與噪聲信道模型 12.3 最小編輯距離算法 12.4 發(fā)音問(wèn)題研究中的Bayes方法 12.5 發(fā)音變異的決策樹(shù)模型 12.6 加權(quán)自動(dòng)機(jī) 12.7 向前算法 12.8 Viterbi算法 本章附錄第13章 N元語(yǔ)法和數(shù)據(jù)平滑 13.1 N元語(yǔ)法 13.2 數(shù)據(jù)平滑第14章 隱馬爾可夫模型(HMM) 14.1 HMM模型概述 14.2 HMM模型在語(yǔ)音識(shí)別中的應(yīng)用第15章 統(tǒng)計(jì)機(jī)器翻譯中的形式模型 15.1 機(jī)器翻譯與噪聲信道模型 15.2 最大熵模型 15.3 基于平行概率語(yǔ)法的形式模型 15.4 基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯 15.5 基于句法的統(tǒng)計(jì)機(jī)器翻譯第16章 自然語(yǔ)言處理系統(tǒng)的評(píng)測(cè) 16.1 評(píng)測(cè)的一般原則和方法 16.2 語(yǔ)音合成和文語(yǔ)轉(zhuǎn)換系統(tǒng)的評(píng)測(cè) 16.3 機(jī)器翻譯系統(tǒng)的評(píng)測(cè) 16.4 語(yǔ)料庫(kù)系統(tǒng)的評(píng)測(cè) 16.5 國(guó)外自然語(yǔ)言處理系統(tǒng)的評(píng)測(cè)第17章 自然語(yǔ)言處理中的理性主義與經(jīng)驗(yàn)主義 17.1 哲學(xué)中的理性主義和經(jīng)驗(yàn)主義 17.2 自然語(yǔ)言處理中理性主義和經(jīng)驗(yàn)主義的消長(zhǎng) 17.3 理性主義和經(jīng)驗(yàn)主義的利弊得失 17.4 探索理性主義方法和經(jīng)驗(yàn)主義方法結(jié)合的途徑

章節(jié)摘錄

  HAL也應(yīng)該能夠做信息檢索(information retrieval,發(fā)現(xiàn)它所需要的文本資源在哪里)和信息抽?。╥nformation extraction,從文本資源中抽取它所需要的信息),并且進(jìn)行知識(shí)推理(reference,根據(jù)已知的事實(shí)推出結(jié)論)。  盡管這些問(wèn)題現(xiàn)在還遠(yuǎn)遠(yuǎn)沒(méi)有完全解決,HAL需要的一些與語(yǔ)言相關(guān)的技術(shù)現(xiàn)在已經(jīng)研制出來(lái)了,有一部分技術(shù)已經(jīng)商品化。解決這樣的問(wèn)題以及其他類(lèi)似的問(wèn)題,是自然語(yǔ)言處理、計(jì)算語(yǔ)言學(xué)、語(yǔ)音識(shí)別與語(yǔ)音合成的主要研究?jī)?nèi)容。我們把它們統(tǒng)稱(chēng)為語(yǔ)音與語(yǔ)言的計(jì)算機(jī)處理(speech and language processing),或者簡(jiǎn)單地稱(chēng)為自然語(yǔ)言處理(natural language processing),因此,自然語(yǔ)言處理也同時(shí)包括了語(yǔ)音處理的內(nèi)容?! ∠馠AL這樣有復(fù)雜的語(yǔ)言能力的智能機(jī)器人將要求非常廣泛和深刻的語(yǔ)言知識(shí)。我們只要讀一讀前面在。HAL和Dave之間進(jìn)行的對(duì)話(huà),我們就可以了解到這樣的更加復(fù)雜的應(yīng)用所需要的語(yǔ)言知識(shí)的范圍和種類(lèi)。  為了確定Dave講什么,HAL必須能夠分析它所接收的聲音信號(hào),并且把Dave的這些信號(hào)復(fù)原成詞的系列。與此相似,為了生成回答,HAL必須把它的回答組織成詞的系列,并且生成Dave能夠識(shí)別的聲音信號(hào)。要完成這兩方面的任務(wù),需要語(yǔ)音學(xué)(phonetics)和音系學(xué)(phonology)的知識(shí),這樣的知識(shí)可以幫助我們建立詞如何在話(huà)語(yǔ)中發(fā)音的模型。  值得注意的是,HAL還能夠說(shuō)出如像Im和cant這樣的縮約形式,HAL必須把它們分別還原為I am和can not,才能在它的詞庫(kù)中找到這些單詞的對(duì)應(yīng)物,從而明白這些縮約形式究竟代表什么樣的語(yǔ)言成分。HAL還要能夠產(chǎn)生并且識(shí)別單詞的這樣或那樣的變體(例如,識(shí)別doors是復(fù)數(shù))。這些都要求HAL具有形態(tài)學(xué)方面的知識(shí),這些知識(shí)能夠反映關(guān)于上下文中詞的形態(tài)和行為的有關(guān)信息。  除了處理一個(gè)一個(gè)的單詞之外,HAL還應(yīng)該知道怎樣分析Dave所提出的請(qǐng)求的結(jié)構(gòu)。這樣的分析能夠使HAL確定,Dave說(shuō)的話(huà)是關(guān)于要HAL采取某種行動(dòng)的一個(gè)請(qǐng)求,這樣的請(qǐng)求不同于下面關(guān)于陳述客觀世界的簡(jiǎn)單命題,也不同于下面關(guān)于door的問(wèn)話(huà),它們是Dave請(qǐng)求的不同變體:  HAL,the pod bay door is open.(HAL,分離艙的門(mén)是開(kāi)著的。)  HAL,is the pod bay door open?(HAL,分離艙的門(mén)是開(kāi)著的嗎?)  此外,HAL還必須使用類(lèi)似的結(jié)構(gòu)知識(shí)把一個(gè)個(gè)的單詞組織成為符號(hào)串,構(gòu)成它的回答。例如,HAL必須知道,下面的單詞序列對(duì)于Dave是沒(méi)有意義的,盡管這個(gè)單詞系列所包含的單詞與它原來(lái)的回答中所包含的單詞完全一樣:  Im I do,Sorry that afraid Dave Im cant.  這里所說(shuō)的關(guān)于組詞成句的知識(shí),叫做句法(syntax)?! ★@而易見(jiàn),如果只是知道Dave所說(shuō)的話(huà)語(yǔ)的各個(gè)單詞以及句法結(jié)構(gòu),并不能使HAL了解Dave提出的請(qǐng)求的實(shí)質(zhì)。為了理解Dave的請(qǐng)求事實(shí)上是關(guān)于要求關(guān)閉pod bay door(分離艙門(mén))的一個(gè)命令,而不是講關(guān)于當(dāng)天中飯的菜單的事情,就要有復(fù)合詞的語(yǔ)義的知識(shí)、詞匯語(yǔ)義學(xué)(lexical semantics)的知識(shí)以及如何把這樣的復(fù)合詞組成更大的意義的知識(shí),即關(guān)于組合語(yǔ)義學(xué)(compositional semantics)的知識(shí)。

編輯推薦

  當(dāng)代科學(xué)技術(shù)基礎(chǔ)理論與前沿問(wèn)題研究叢書(shū):中國(guó)科學(xué)技術(shù)大學(xué)校友文庫(kù)

圖書(shū)封面

圖書(shū)標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    自然語(yǔ)言處理的形式模型 PDF格式下載


用戶(hù)評(píng)論 (總計(jì)12條)

 
 

  •   書(shū)一拿到就開(kāi)始看,前面的綜述配圖很多,頗有代入感。全書(shū)介紹了NLP涉及的絕大部分形式模型,適合入門(mén)或者工作參考,作者也很資深,據(jù)說(shuō)曾參與測(cè)算漢字的熵,建議與“統(tǒng)計(jì)自然語(yǔ)言處理”一起看。
  •   準(zhǔn)備報(bào)考自然語(yǔ)言處理方向,就買(mǎi)了兩本相關(guān)的書(shū)來(lái)看,惡補(bǔ)一下。這本書(shū)實(shí)在很有厚度!呵呵。很沉,內(nèi)容講的很詳細(xì),先是對(duì)自然語(yǔ)言處理這個(gè)方向進(jìn)行了詳細(xì)說(shuō)明,之后有分別對(duì)自然語(yǔ)言處理中的一些知識(shí)進(jìn)行了講解,很多講解并不詳細(xì),但是通過(guò)這本書(shū)你可以對(duì)這個(gè)方向有個(gè)認(rèn)識(shí),進(jìn)而對(duì)感興趣的部分自己在深入學(xué)習(xí)??傮w來(lái)說(shuō),還是不錯(cuò)的。書(shū)的封片很有質(zhì)感,畢竟是為了紀(jì)念中科大校慶周年的書(shū),還是很不錯(cuò)的!
  •   更適合研究語(yǔ)言方面的讀者,計(jì)算機(jī)在自然語(yǔ)言處理方面的應(yīng)用手段沒(méi)有介紹
  •   自然語(yǔ)言處理的經(jīng)典書(shū)
  •   這幾天有幸上了馮教授的課,感覺(jué)他老人家真是知識(shí)淵博,平易近人,而且能把高深的知識(shí)用非常簡(jiǎn)單、易懂的語(yǔ)言講述出來(lái)。真不愧是學(xué)界泰斗啊。
  •   非常全面,介紹詳細(xì)
  •   馮老師很好的著作
  •   學(xué)科是相通的,文字和計(jì)算機(jī)也可以很完美的結(jié)合
  •   比較滿(mǎn)意,內(nèi)容不錯(cuò)
  •   內(nèi)容很翔實(shí),很容易讀懂,
  •   還沒(méi)讀完,不過(guò)不錯(cuò),有深度
  •   還不錯(cuò),有深度
 

250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7