口語機(jī)器翻譯

出版時(shí)間：2010-8 出版社：北京大學(xué)出版社作者：瑞諾爾，卡特爾，布伊隆　等編頁(yè)數(shù)：337 字?jǐn)?shù)：388000
Tag標(biāo)簽：無

前言

　　計(jì)算語言學(xué)（Computational Lingljistics，CL）在語言科學(xué)與信息科學(xué)的研究領(lǐng)域扮演關(guān)鍵性的角色。語言學(xué)理論尋求對(duì)語言現(xiàn)象規(guī)律性的揭示與完整的解釋。計(jì)算語言學(xué)正好提供了驗(yàn)證與應(yīng)用這些規(guī)律與解釋的大好機(jī)會(huì)。作為語言學(xué)、信息科學(xué)乃至于心理學(xué)與認(rèn)知科學(xué)結(jié)合的交叉學(xué)科，計(jì)算語言學(xué)更提供了語言學(xué)基礎(chǔ)研究與應(yīng)用研究的絕佳界面。事實(shí)上，計(jì)算語言學(xué)與人類語言科技（Human Langllage Technology，HLT）可以視為一體兩面，不可分割?！　∮?jì)算語言學(xué)研究濫觴于上世紀(jì)五六十年代的機(jī)器翻譯研究。中文的相關(guān)研究也幾乎同步開始，1960年起在柏克萊加州大學(xué)研究室，王士元、鄒嘉彥、C.Y.Dougherty等人已開始研究中英、中俄機(jī)器翻譯。他們的中文計(jì)算語言學(xué)研究，可說是與世界最尖端科技同步的。中國(guó)國(guó)內(nèi)中俄翻譯研究也不遑多讓，大約在上世紀(jì)50年代中期便已開始?？上У氖?，這些中文相關(guān)早期機(jī)器翻譯研究，由于硬件與軟件的限制，沒能延續(xù)下來。中文計(jì)算語言學(xué)研究比較有系統(tǒng)的進(jìn)展，還要等到1986年；海峽兩岸在同一年成立了兩個(gè)致力于中文計(jì)算語言學(xué)基礎(chǔ)架構(gòu)建立的研究群。北京大學(xué)的計(jì)算語言學(xué)研究所在朱德熙先生倡導(dǎo)下成立，隨后一段時(shí)間由陸儉明、俞士汶主持。而臺(tái)灣“中研院”的中文詞知識(shí)庫(kù)小組，由謝清俊創(chuàng)立，陳克健主持，黃居仁1987年返臺(tái)后加入。

內(nèi)容概要

口語翻譯(Spoken Language Translation, SLT)是指讓計(jì)算機(jī)實(shí)現(xiàn)從一種語言的語音到另一種語言的語音自動(dòng)翻譯的過程。其理想目標(biāo)是，讓計(jì)算機(jī)像人一樣充當(dāng)持不同語言的說話人之間的翻譯角色。會(huì)議演講、交談(通過電話、網(wǎng)絡(luò)或面對(duì)面)、廣播等場(chǎng)景下的話語翻譯都是口語翻譯應(yīng)用的重要領(lǐng)域。由于多數(shù)情況下說話人的話語都以口語風(fēng)格為主，人們尤其希望翻譯系統(tǒng)可以接受并實(shí)現(xiàn)任意口語化的、自由交談式的對(duì)話語音直接翻譯。本書全面、系統(tǒng)地介紹了SLT項(xiàng)目研究的主要成果，內(nèi)容包括語言處理與語料收集、語言覆蓋性、語音處理和系統(tǒng)評(píng)估等各個(gè)方面，其中語言處理部分是本書的主要內(nèi)容。

書籍目錄

導(dǎo)讀PrefaceAcknowledgements  1 IntroductionPart 1 Language Processing and Corpora  2 Translation Using the Core Language Engine  3 Grammar Specialisation  4 Choosing among Interpretations  5 The TreeBanker  6 Acquisition of Lexical Entries  7 Spelling and Morphology  8 Corpora and Data CollectionPart 2 Linguistic Coverage  9 English Coverage  10 French Coverage  11 Swedish Coverage  12 Transfer Coverage  13 Rational Reuse of Linguistic DataPart 3 Speech Processing  14 Speech Recognition  15 Acoustic Modelling  16 Language Modelling for Multilingual Speech Translation  17 Porting a Recogniser to a New Language  18 Multiple Dialects and Languages  19 Common Speech/Language IssuePart 4 Evaluation and Conclusions  20 Evaluation  21 ConclusionsReferencesIndex

章節(jié)摘錄

　　棒性和系統(tǒng)的自適應(yīng)能力。同書面語相比，口語的聲學(xué)特性有一定的特殊性，這類語音的基頻、時(shí)長(zhǎng)、幅度等特征都隨表達(dá)內(nèi)容、感情色彩等不同，變化的范圍比朗讀語音大得多，同時(shí)還有非語聲信號(hào)和噪聲，充分研究這些特性，建立精細(xì)的聲學(xué)模型非常重要。而且，講話人往往是在較強(qiáng)的背景噪聲或多講話人環(huán)境下發(fā)音的，如果是電話自動(dòng)語音翻譯系統(tǒng)，還存在通訊干擾等其他因素的影響，因此，提高語音識(shí)別在不同說話人、不同聲學(xué)環(huán)境及通道條件下的魯棒性，在口語翻譯系統(tǒng)中尤其重要。另外，在語言學(xué)層面，口語句子中含有大量的修正、重復(fù)、口頭語、省略等非規(guī)范語言現(xiàn)象，研究這些特征，對(duì)語言模型進(jìn)行完善，包括建模、算法和訓(xùn)練等各個(gè)方面，將有助于提高語音識(shí)別的正確率。　?。?）翻譯方法有待于進(jìn)一步研究。盡管統(tǒng)計(jì)翻譯方法具有較高的魯棒性，但是，對(duì)非規(guī)范語言現(xiàn)象和噪聲的處理能力仍然十分有限，而且這種方法與訓(xùn)練語料的規(guī)模和質(zhì)量密切相關(guān)。統(tǒng)計(jì)方法與規(guī)則方法的結(jié)合一直是人們所追求的，但是具體如何融合，多翻譯引擎以什么樣的集成方式可以獲得最好的系統(tǒng)性能，統(tǒng)計(jì)模型賴以訓(xùn)練的語料規(guī)模達(dá)到多大才算充分，非語言信息（手勢(shì)、表情、說話人角色等）如何融人翻譯模型等，諸多問題都遠(yuǎn)遠(yuǎn)沒有得到解決?！　　?/pre>







圖書封面



圖書標(biāo)簽Tags
無




評(píng)論、評(píng)分、閱讀與下載



還沒讀過(74)
勉強(qiáng)可看(539)
一般般(919)
內(nèi)容豐富(3814)
強(qiáng)力推薦(312)


 


    口語機(jī)器翻譯 PDF格式下載

用戶評(píng)論 (總計(jì)0條)

口語機(jī)器翻譯

用戶評(píng)論 (總計(jì)0條)

推薦圖書

相關(guān)圖書