自然語言處理的形式模型

出版時間:2010  出版社:中國科學(xué)技術(shù)大學(xué)出版社  作者:馮志偉  頁數(shù):638  
Tag標(biāo)簽:無  

前言

  大學(xué)最重要的功能是向社會輸送人才,大學(xué)對于一個國家、民族乃至世界的重要性和貢獻(xiàn)度,很大程度上是通過畢業(yè)生在社會各領(lǐng)域所取得的成就來體現(xiàn)的?! ≈袊茖W(xué)技術(shù)大學(xué)建校只有短短的五十年,之所以迅速成為享有較高國際聲譽(yù)的著名大學(xué)之一,主要就是因為她培養(yǎng)出了一大批德才兼?zhèn)涞膬?yōu)秀畢業(yè)生。他們志向高遠(yuǎn)、基礎(chǔ)扎實、綜合素質(zhì)高、創(chuàng)新能力強(qiáng),在國內(nèi)外科技、經(jīng)濟(jì)、教育等領(lǐng)域做出了杰出的貢獻(xiàn),為中國科大贏得了“科技英才的搖籃”的美譽(yù)。  2008年9月,胡錦濤總書記為中國科大建校五十周年發(fā)來賀信,信中稱贊說:半個世紀(jì)以來,中國科學(xué)技術(shù)大學(xué)依托中國科學(xué)院,按照全院辦校、所系結(jié)合的方針,弘揚(yáng)紅專并進(jìn)、理實交融的校風(fēng),努力推進(jìn)教學(xué)和科研工作的改革創(chuàng)新,為黨和國家培養(yǎng)了一大批科技人才,取得了一系列具有世界先進(jìn)水平的原創(chuàng)性科技成果,為推動我國科教事業(yè)發(fā)展和社會主義現(xiàn)代化建設(shè)做出了重要貢獻(xiàn)?! ?jù)統(tǒng)計,中國科大迄今已畢業(yè)的5萬人中,已有42人當(dāng)選中國科學(xué)院和中國工程院院士,是同期(自1963年以來)畢業(yè)生中當(dāng)選院士數(shù)最多的高校之一。其中,本科畢業(yè)生中平均每1000人就產(chǎn)生1名院士和700多名碩士、博士,比例位居全國高校之首。還有眾多的中青年才俊成為我國科技、企業(yè)、教育等領(lǐng)域的領(lǐng)軍人物和骨干。在歷年評選的“中國青年五四獎?wù)隆鲍@得者中,作為科技界、科技創(chuàng)新型企業(yè)界青年才俊代表,科大畢業(yè)生已連續(xù)多年榜上有名,獲獎總?cè)藬?shù)位居全國高校前列。鮮為人知的是,有數(shù)千名優(yōu)秀畢業(yè)生踏上國防戰(zhàn)線,為科技強(qiáng)軍做出了重要貢獻(xiàn),涌現(xiàn)出20多名科技將軍和一大批國防科技中堅。

內(nèi)容概要

  本書對自然語言處理中的各種形式模型進(jìn)行了系統(tǒng)的梳理,分別討論了基于短語結(jié)構(gòu)語法的形式模型、基于合一運(yùn)算的形式模型、基于依存和配價的形式模型、基于格語法的形式模型、基于詞匯主義的形式模型、語義自動處理的形式模型、語用自動處理的形式模型、隱馬爾可夫模型、統(tǒng)計機(jī)器翻譯的形式模型?!蹲匀徽Z言處理的形式模型》說理透徹、語言流暢、實例豐富、深入淺出,適合于從事自然語言處理教學(xué)和研究的科研人員、大學(xué)師生閱讀,也可以作為人工智能、計算語言學(xué)等課程的教學(xué)參考。

書籍目錄

總序前言第1章 自然語言處理的學(xué)科定位 1.1 從自然語言處理的過程來考察其學(xué)科定位 1.2 從自然語言處理的范圍來考察其學(xué)科定位 1.3 從自然語言處理的歷史來考察其學(xué)科定位 1.4 當(dāng)前自然語言處理發(fā)展的幾個特點第2章 語言計算研究的先驅(qū) 2.1 Markov鏈 2.2 Zipf定律 2.3 Shannon關(guān)于“熵”的研究 2.4 Bar-Hillel的范疇語法 2.5 Harris的語言串分析法 2.6 o.c.KysmrHHa的語言集合論模型第3章 基于短語結(jié)構(gòu)語法的形式模型 3.1 語法的Chomsky層級 3.2 有限狀態(tài)語法和它的局限性 3.3 短語結(jié)構(gòu)語法 3.4 遞歸轉(zhuǎn)移網(wǎng)絡(luò)和擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò) 3.5 自底向上分析和自頂向下分析 3.6 通用句法生成器和線圖分析法 3.7 Earley算法 3.8 左角分析法 3.9 CYK算法 3.10 Tomita算法 3.11 管轄-約束理論與最簡方案 3.12 Joshi的樹鄰接語法 3.13 漢字結(jié)構(gòu)的形式描述第4章 基于合一運(yùn)算的形式模型 4.1 中文信息MMT模型 4.2 Kaplan的詞匯功能語法 4.3 MartinKay的功能合一語法 4.4 Gazdar的廣義短語結(jié)構(gòu)語法 4.5 Shieber的PATR 4.6 Pollard的中心語驅(qū)動的短語結(jié)構(gòu)語法 4.7 Pereira和Warren定子句語法第5章 基于依存和配價的形式模型 5.1 配價觀念的起源 5.2 Tesni6re的依存語法 5.3 依存語法在自然語言處理中的應(yīng)用 5.4 配價語法 5.5 配價語法在自然語言處理中的應(yīng)用第6章 基于格語法的形式模型 6.1 Fillmore的格語法 6.2 Fillmore的框架網(wǎng)絡(luò)第7章 基于詞匯主義的形式模型 7.1 Gross的詞匯語法 7.2 鏈語法 7.3 詞匯語義學(xué) 7.4 知識本體 7.5 詞網(wǎng)WordNet 7.6 知網(wǎng)HowNet第8章 語義自動處理的形式模型 8.1 義素分析法 8.2 語義場 8.3 語義網(wǎng)絡(luò) 8.4 Montague的蒙塔鳩語法 8.5 Wilks的優(yōu)選語義學(xué) 8.6 Schank的概念依存理論 8.7 Mel’chuk的意義㈢文本理論 8.8 詞義排歧方法第9章 系統(tǒng)功能語法 9.1 系統(tǒng)功能語法的基本概念 9.2 系統(tǒng)功能語法在自然語言處理中的應(yīng)用第10章 語用自動處理的形式模型 10.1 Mann和Thompson的修辭結(jié)構(gòu)理論 10.2 文本連貫中的常識推理技術(shù)第11章 概率語法 11.1 概率上下文無關(guān)語法與句子的歧義 11.2 概率上下文無關(guān)語法的基本原理 11.3 概率上下文無關(guān)語法的三個假設(shè) 11.4 概率詞匯化上下文無關(guān)語法第12章 Bayes公式與動態(tài)規(guī)劃算法 12.1 拼寫錯誤的檢查與更正 12.2 Bayes公式與噪聲信道模型 12.3 最小編輯距離算法 12.4 發(fā)音問題研究中的Bayes方法 12.5 發(fā)音變異的決策樹模型 12.6 加權(quán)自動機(jī) 12.7 向前算法 12.8 Viterbi算法 本章附錄第13章 N元語法和數(shù)據(jù)平滑 13.1 N元語法 13.2 數(shù)據(jù)平滑第14章 隱馬爾可夫模型(HMM) 14.1 HMM模型概述 14.2 HMM模型在語音識別中的應(yīng)用第15章 統(tǒng)計機(jī)器翻譯中的形式模型 15.1 機(jī)器翻譯與噪聲信道模型 15.2 最大熵模型 15.3 基于平行概率語法的形式模型 15.4 基于短語的統(tǒng)計機(jī)器翻譯 15.5 基于句法的統(tǒng)計機(jī)器翻譯第16章 自然語言處理系統(tǒng)的評測 16.1 評測的一般原則和方法 16.2 語音合成和文語轉(zhuǎn)換系統(tǒng)的評測 16.3 機(jī)器翻譯系統(tǒng)的評測 16.4 語料庫系統(tǒng)的評測 16.5 國外自然語言處理系統(tǒng)的評測第17章 自然語言處理中的理性主義與經(jīng)驗主義 17.1 哲學(xué)中的理性主義和經(jīng)驗主義 17.2 自然語言處理中理性主義和經(jīng)驗主義的消長 17.3 理性主義和經(jīng)驗主義的利弊得失 17.4 探索理性主義方法和經(jīng)驗主義方法結(jié)合的途徑

章節(jié)摘錄

  HAL也應(yīng)該能夠做信息檢索(information retrieval,發(fā)現(xiàn)它所需要的文本資源在哪里)和信息抽?。╥nformation extraction,從文本資源中抽取它所需要的信息),并且進(jìn)行知識推理(reference,根據(jù)已知的事實推出結(jié)論)?! ”M管這些問題現(xiàn)在還遠(yuǎn)遠(yuǎn)沒有完全解決,HAL需要的一些與語言相關(guān)的技術(shù)現(xiàn)在已經(jīng)研制出來了,有一部分技術(shù)已經(jīng)商品化。解決這樣的問題以及其他類似的問題,是自然語言處理、計算語言學(xué)、語音識別與語音合成的主要研究內(nèi)容。我們把它們統(tǒng)稱為語音與語言的計算機(jī)處理(speech and language processing),或者簡單地稱為自然語言處理(natural language processing),因此,自然語言處理也同時包括了語音處理的內(nèi)容?! ∠馠AL這樣有復(fù)雜的語言能力的智能機(jī)器人將要求非常廣泛和深刻的語言知識。我們只要讀一讀前面在。HAL和Dave之間進(jìn)行的對話,我們就可以了解到這樣的更加復(fù)雜的應(yīng)用所需要的語言知識的范圍和種類?! 榱舜_定Dave講什么,HAL必須能夠分析它所接收的聲音信號,并且把Dave的這些信號復(fù)原成詞的系列。與此相似,為了生成回答,HAL必須把它的回答組織成詞的系列,并且生成Dave能夠識別的聲音信號。要完成這兩方面的任務(wù),需要語音學(xué)(phonetics)和音系學(xué)(phonology)的知識,這樣的知識可以幫助我們建立詞如何在話語中發(fā)音的模型?! ≈档米⒁獾氖?,HAL還能夠說出如像Im和cant這樣的縮約形式,HAL必須把它們分別還原為I am和can not,才能在它的詞庫中找到這些單詞的對應(yīng)物,從而明白這些縮約形式究竟代表什么樣的語言成分。HAL還要能夠產(chǎn)生并且識別單詞的這樣或那樣的變體(例如,識別doors是復(fù)數(shù))。這些都要求HAL具有形態(tài)學(xué)方面的知識,這些知識能夠反映關(guān)于上下文中詞的形態(tài)和行為的有關(guān)信息?! 〕颂幚硪粋€一個的單詞之外,HAL還應(yīng)該知道怎樣分析Dave所提出的請求的結(jié)構(gòu)。這樣的分析能夠使HAL確定,Dave說的話是關(guān)于要HAL采取某種行動的一個請求,這樣的請求不同于下面關(guān)于陳述客觀世界的簡單命題,也不同于下面關(guān)于door的問話,它們是Dave請求的不同變體:  HAL,the pod bay door is open.(HAL,分離艙的門是開著的。)  HAL,is the pod bay door open?(HAL,分離艙的門是開著的嗎?)  此外,HAL還必須使用類似的結(jié)構(gòu)知識把一個個的單詞組織成為符號串,構(gòu)成它的回答。例如,HAL必須知道,下面的單詞序列對于Dave是沒有意義的,盡管這個單詞系列所包含的單詞與它原來的回答中所包含的單詞完全一樣:  Im I do,Sorry that afraid Dave Im cant.  這里所說的關(guān)于組詞成句的知識,叫做句法(syntax)。  顯而易見,如果只是知道Dave所說的話語的各個單詞以及句法結(jié)構(gòu),并不能使HAL了解Dave提出的請求的實質(zhì)。為了理解Dave的請求事實上是關(guān)于要求關(guān)閉pod bay door(分離艙門)的一個命令,而不是講關(guān)于當(dāng)天中飯的菜單的事情,就要有復(fù)合詞的語義的知識、詞匯語義學(xué)(lexical semantics)的知識以及如何把這樣的復(fù)合詞組成更大的意義的知識,即關(guān)于組合語義學(xué)(compositional semantics)的知識。

編輯推薦

  當(dāng)代科學(xué)技術(shù)基礎(chǔ)理論與前沿問題研究叢書:中國科學(xué)技術(shù)大學(xué)校友文庫

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    自然語言處理的形式模型 PDF格式下載


用戶評論 (總計12條)

 
 

  •   書一拿到就開始看,前面的綜述配圖很多,頗有代入感。全書介紹了NLP涉及的絕大部分形式模型,適合入門或者工作參考,作者也很資深,據(jù)說曾參與測算漢字的熵,建議與“統(tǒng)計自然語言處理”一起看。
  •   準(zhǔn)備報考自然語言處理方向,就買了兩本相關(guān)的書來看,惡補(bǔ)一下。這本書實在很有厚度!呵呵。很沉,內(nèi)容講的很詳細(xì),先是對自然語言處理這個方向進(jìn)行了詳細(xì)說明,之后有分別對自然語言處理中的一些知識進(jìn)行了講解,很多講解并不詳細(xì),但是通過這本書你可以對這個方向有個認(rèn)識,進(jìn)而對感興趣的部分自己在深入學(xué)習(xí)??傮w來說,還是不錯的。書的封片很有質(zhì)感,畢竟是為了紀(jì)念中科大校慶周年的書,還是很不錯的!
  •   更適合研究語言方面的讀者,計算機(jī)在自然語言處理方面的應(yīng)用手段沒有介紹
  •   自然語言處理的經(jīng)典書
  •   這幾天有幸上了馮教授的課,感覺他老人家真是知識淵博,平易近人,而且能把高深的知識用非常簡單、易懂的語言講述出來。真不愧是學(xué)界泰斗啊。
  •   非常全面,介紹詳細(xì)
  •   馮老師很好的著作
  •   學(xué)科是相通的,文字和計算機(jī)也可以很完美的結(jié)合
  •   比較滿意,內(nèi)容不錯
  •   內(nèi)容很翔實,很容易讀懂,
  •   還沒讀完,不過不錯,有深度
  •   還不錯,有深度
 

250萬本中文圖書簡介、評論、評分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號-7