口語機(jī)器翻譯

出版時(shí)間:2010-8  出版社:北京大學(xué)出版社  作者:瑞諾爾,卡特爾,布伊隆 等編  頁數(shù):337  字?jǐn)?shù):388000  
Tag標(biāo)簽:無  

前言

  計(jì)算語言學(xué)(Computational Lingljistics,CL)在語言科學(xué)與信息科學(xué)的研究領(lǐng)域扮演關(guān)鍵性的角色。語言學(xué)理論尋求對語言現(xiàn)象規(guī)律性的揭示與完整的解釋。計(jì)算語言學(xué)正好提供了驗(yàn)證與應(yīng)用這些規(guī)律與解釋的大好機(jī)會。作為語言學(xué)、信息科學(xué)乃至于心理學(xué)與認(rèn)知科學(xué)結(jié)合的交叉學(xué)科,計(jì)算語言學(xué)更提供了語言學(xué)基礎(chǔ)研究與應(yīng)用研究的絕佳界面。事實(shí)上,計(jì)算語言學(xué)與人類語言科技(Human Langllage Technology,HLT)可以視為一體兩面,不可分割?! ∮?jì)算語言學(xué)研究濫觴于上世紀(jì)五六十年代的機(jī)器翻譯研究。中文的相關(guān)研究也幾乎同步開始,1960年起在柏克萊加州大學(xué)研究室,王士元、鄒嘉彥、C.Y.Dougherty等人已開始研究中英、中俄機(jī)器翻譯。他們的中文計(jì)算語言學(xué)研究,可說是與世界最尖端科技同步的。中國國內(nèi)中俄翻譯研究也不遑多讓,大約在上世紀(jì)50年代中期便已開始??上У氖?,這些中文相關(guān)早期機(jī)器翻譯研究,由于硬件與軟件的限制,沒能延續(xù)下來。中文計(jì)算語言學(xué)研究比較有系統(tǒng)的進(jìn)展,還要等到1986年;海峽兩岸在同一年成立了兩個致力于中文計(jì)算語言學(xué)基礎(chǔ)架構(gòu)建立的研究群。北京大學(xué)的計(jì)算語言學(xué)研究所在朱德熙先生倡導(dǎo)下成立,隨后一段時(shí)間由陸儉明、俞士汶主持。而臺灣“中研院”的中文詞知識庫小組,由謝清俊創(chuàng)立,陳克健主持,黃居仁1987年返臺后加入。

內(nèi)容概要

口語翻譯(Spoken Language Translation, SLT)是指讓計(jì)算機(jī)實(shí)現(xiàn)從一種語言的語音到另一種語言的語音自動翻譯的過程。其理想目標(biāo)是,讓計(jì)算機(jī)像人一樣充當(dāng)持不同語言的說話人之間的翻譯角色。會議演講、交談(通過電話、網(wǎng)絡(luò)或面對面)、廣播等場景下的話語翻譯都是口語翻譯應(yīng)用的重要領(lǐng)域。由于多數(shù)情況下說話人的話語都以口語風(fēng)格為主,人們尤其希望翻譯系統(tǒng)可以接受并實(shí)現(xiàn)任意口語化的、自由交談式的對話語音直接翻譯。本書全面、系統(tǒng)地介紹了SLT項(xiàng)目研究的主要成果,內(nèi)容包括語言處理與語料收集、語言覆蓋性、語音處理和系統(tǒng)評估等各個方面,其中語言處理部分是本書的主要內(nèi)容。

書籍目錄

導(dǎo)讀PrefaceAcknowledgements  1 IntroductionPart 1 Language Processing and Corpora  2 Translation Using the Core Language Engine  3 Grammar Specialisation  4 Choosing among Interpretations  5 The TreeBanker  6 Acquisition of Lexical Entries  7 Spelling and Morphology  8 Corpora and Data CollectionPart 2 Linguistic Coverage  9 English Coverage  10 French Coverage  11 Swedish Coverage  12 Transfer Coverage  13 Rational Reuse of Linguistic DataPart 3 Speech Processing  14 Speech Recognition  15 Acoustic Modelling  16 Language Modelling for Multilingual Speech Translation  17 Porting a Recogniser to a New Language  18 Multiple Dialects and Languages  19 Common Speech/Language IssuePart 4 Evaluation and Conclusions  20 Evaluation  21 ConclusionsReferencesIndex

章節(jié)摘錄

  棒性和系統(tǒng)的自適應(yīng)能力。同書面語相比,口語的聲學(xué)特性有一定的特殊性,這類語音的基頻、時(shí)長、幅度等特征都隨表達(dá)內(nèi)容、感情色彩等不同,變化的范圍比朗讀語音大得多,同時(shí)還有非語聲信號和噪聲,充分研究這些特性,建立精細(xì)的聲學(xué)模型非常重要。而且,講話人往往是在較強(qiáng)的背景噪聲或多講話人環(huán)境下發(fā)音的,如果是電話自動語音翻譯系統(tǒng),還存在通訊干擾等其他因素的影響,因此,提高語音識別在不同說話人、不同聲學(xué)環(huán)境及通道條件下的魯棒性,在口語翻譯系統(tǒng)中尤其重要。另外,在語言學(xué)層面,口語句子中含有大量的修正、重復(fù)、口頭語、省略等非規(guī)范語言現(xiàn)象,研究這些特征,對語言模型進(jìn)行完善,包括建模、算法和訓(xùn)練等各個方面,將有助于提高語音識別的正確率?! 。?)翻譯方法有待于進(jìn)一步研究。盡管統(tǒng)計(jì)翻譯方法具有較高的魯棒性,但是,對非規(guī)范語言現(xiàn)象和噪聲的處理能力仍然十分有限,而且這種方法與訓(xùn)練語料的規(guī)模和質(zhì)量密切相關(guān)。統(tǒng)計(jì)方法與規(guī)則方法的結(jié)合一直是人們所追求的,但是具體如何融合,多翻譯引擎以什么樣的集成方式可以獲得最好的系統(tǒng)性能,統(tǒng)計(jì)模型賴以訓(xùn)練的語料規(guī)模達(dá)到多大才算充分,非語言信息(手勢、表情、說話人角色等)如何融人翻譯模型等,諸多問題都遠(yuǎn)遠(yuǎn)沒有得到解決?!  ?/pre>

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    口語機(jī)器翻譯 PDF格式下載


用戶評論 (總計(jì)0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號-7