語音語言處理導(dǎo)論

出版時間:2010-8  出版社:北京大學(xué)出版社  作者:John Coleman  頁數(shù):301  
Tag標(biāo)簽:無  

前言

  計算語言學(xué)《iotaputational Linguistics,CL)在語言科學(xué)與信息科學(xué)的研究領(lǐng)域扮演關(guān)鍵性的角色。語言學(xué)理論尋求對語言現(xiàn)象規(guī)律性的揭示與完整的解釋。計算語言學(xué)正好提供了驗證與應(yīng)用這些規(guī)律與解釋的大好機(jī)會。作為語言學(xué)、信息科學(xué)乃至于心理學(xué)與認(rèn)知科學(xué)結(jié)合的交叉學(xué)科,計算語言學(xué)更提供了語言學(xué)基礎(chǔ)研究與應(yīng)用研究的絕佳界面。事實上,計算語言學(xué)與人類語言科技(Human Language Technology,HLT)可以視為一體兩面,不可分割?! ∮嬎阏Z言學(xué)研究濫觴于上世紀(jì)五六十年代的機(jī)器翻譯研究。中文的相關(guān)研究也幾乎同步開始,1960年起在柏克萊加州大學(xué)研究室,王士元、鄒嘉彥、C.Y.Dougherty等人已開始研究中英、中俄機(jī)器翻譯。他們的中文計算語言學(xué)研究,可說是與世界最尖端科技同步的。中國國內(nèi)中俄翻譯研究也不遑多讓,大約在上世紀(jì)50年代中期便已開始。可惜的是,這些中文相關(guān)早期機(jī)器翻譯研究,由于硬件與軟件的限制,沒能延續(xù)下來。中文計算語言學(xué)研究比較有系統(tǒng)的進(jìn)展,還要等到1986年;海峽兩岸在同一年成立了兩個致力于中文計算語言學(xué)基礎(chǔ)架構(gòu)建立的研究群。北京大學(xué)的計算語言學(xué)研究所在朱德熙先生倡導(dǎo)下成立,隨后一段時間由陸儉明、俞士汶主持。而臺灣“中研院”的中文詞知識庫小組,由謝清俊創(chuàng)立,陳克健主持,黃居仁1987年返臺后加入。

內(nèi)容概要

  中國國內(nèi)中俄翻譯研究也不遑多讓,大約在上世紀(jì)50年代中期便已開始??上У氖?,這些中文相關(guān)早期機(jī)器翻譯研究,由于硬件與軟件的限制,沒能延續(xù)下來。中文計算語言學(xué)研究比較有系統(tǒng)的進(jìn)展,還要等到1986年;海峽兩岸在同一年成立了兩個致力于中文計算語言學(xué)基礎(chǔ)架構(gòu)建立的研究群。北京大學(xué)的計算語言學(xué)研究所在朱德熙先生倡導(dǎo)下成立,隨后一段時間由陸儉明、俞士汶主持。而臺灣“中研院”的中文詞知識庫小組,由謝清俊創(chuàng)立,陳克健主持,黃居仁1987年返臺后加入。

書籍目錄

導(dǎo)讀Acknowledgements and copyright notices1 Introduction1.1 About this book1.2 Purpose of this book1.3 Some reasons to use this book1.4 What's in the book (and what's not)1.5 Computational set-up needed for this book1.6 Computational skills that are necessary in order to use the book1.7 Free software suggestions1.8 Book structureSounds and numbers2.1 Preparatory assignments2.2 Solutions2.3 Sampling2.4 Quantization2.5 The sampling theorem2.6 Generating a signal2.7 Numeric data types2.8 The program2.9 Structure of a loop2.10 Structure of an array2.11 Calculating the cosine values2.12 Structure of the program2.13 Writing the signal to a fileChapter summaryFurther ExercisesFurther readingDigital filters and resonators3.1 Operations on sequences of numbers3.2 A program for calculating RMS amplitude3.3 Filtering3.4 A program for calculating running means of 43.5 Smoothing over a longer time-window3.6 Avoiding the need for long window 3.7 IIR filters in C3.8 Structure of the Klatt formant synthesizerChapter summaryExercisesFurther reading Frequency analysis and linear predictive coding4.1 Spectral analysis4.2 Spectral analysis in C4.3 Cepstral analysis4.4 Computation of the cepstrum in C4.5 Pitch tracking using cepstral analysis4.6 Voicing detection4.7 f0estimation by the autocorrelation method4.8 Linear predictive coding4.9 C programs for LPC analysis and resynthesis4.10 Trying it out4.11 Applications of LPCChapter SummaryFurther exercisesFurther readingFinite-state machines5. 1 Some simple examples5.2 A more serious example5.3 Deterministic and non-deterministic automata5.4 Implementation in Prolog5.5 Prolog's processing strategy and the treatmentof variables5.6 Generating strings5.7 Three possibly useful applications o{ that idea5.8 Another approach to describing finite-state machines5.9 Self-loops5.10 Finite-state transducers(FSTs)5.11 Using finite-state transducers to relate speech to phonemes5.12 Finite-state phonology5.13 Finite-state syntactic processingChapter summaryFurther exercisesFurther readingIntroduction to speech recognition techniques6.1 Architectures for speech recognition6.2 The pattern-recognition approach6.3 Dynamic time warping6.4 Applications6.5 Sources of variability in speechChapter summaryFurther readingProbabilistic finite-state models7.1 Introduction7.2 Indeterminacy: n-gram models for part-of-speech tagging ~7.3 Some probability theory for language modelling7.4 Markov models7.5 Trigram models7.6 Incompleteness of the training corpus7.7 Part-of-speech model calculations7.8 Using HMMs for speech recognition7.9 Chomsky's objections to Markov models and some rejoindersChapter summaryFurther readingParsing8.1 Introduction8.9 A demo8.3 Intuitive parsing8.4 Recursive descent parsing8.5 The simplest parsing program8.6 Difference lists8.7 Generating a parse tree8.8 Syllabification8.9 Other parsing algorithms8.10 Chart parsing8.11 Depth-first vs. breadth-first search8.19 Deterministic parsing, Marcus parsing and minimal commitment parsing8.13 Parallel parsingChapter summaryFurther readingUsing probabilistie grammars9.1 Motivations9.2 Probabilistic context-free grammars9.3 Estimation of rule probabilities9.4 A practical example9.5 A limitation of probabilistic context-free grammars9.6 Tree adjoining grammars……

章節(jié)摘錄

  語音和語言處理都以人類語言為處理對象,但處理的層面卻不相同。語音處理關(guān)注的是利用計算機(jī)對語音信號進(jìn)行分析和綜合,從而實現(xiàn)合成和識別人類語音。而語言處理更多關(guān)注對人類語言的句法、語義進(jìn)行建模,終極目標(biāo)是實現(xiàn)人類語言的機(jī)器理解?! ”M管語音處理和語言處理的對象都是人類語言,不過傳統(tǒng)上這是兩個相互獨立的學(xué)科,這兩個領(lǐng)域的研究和教學(xué)也是獨立進(jìn)行的,教科書內(nèi)容通常也不交叉。不過近年來,隨著這兩個學(xué)科的進(jìn)一步發(fā)展,它們之間的關(guān)系變得日益密切,兩個學(xué)科之間的聯(lián)系越來越受到人們的重視。人們越來越意識到,對于語言理解而言,語音特征絕非沒有價值。反過來,語音處理研究也需要關(guān)注語言處理的進(jìn)展,將語言處理的成果應(yīng)用到語音識別和語音合成研究,有利于提升語音處理的性能。此外,這兩個學(xué)科在方法論方面也有共性,相互影響和借鑒的情況也時有發(fā)生。例如,在20世紀(jì)80年代,隱馬爾可夫模型被用來解決詞性自動標(biāo)注問題,就是受到該模型應(yīng)用在語音識別研究中獲得成功的啟發(fā),尤其值得一提的是,隱馬爾可夫模型引入語言處理領(lǐng)域所產(chǎn)生的影響決不是局部性的,它帶動了以語料庫為基礎(chǔ)的經(jīng)驗主義方法在語言處理領(lǐng)域的全面復(fù)蘇,有著十分重要的意義。這些事例說明,語音和語言處理正在日趨交叉和融合,未來的相關(guān)研究和開發(fā)需要對這兩個領(lǐng)域都有相當(dāng)理解和把握的人才?!  ?/pre>

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    語音語言處理導(dǎo)論 PDF格式下載


用戶評論 (總計0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號-7