出版時(shí)間:2010-8 出版社:北京大學(xué)出版社 作者:瑞諾爾,卡特爾,布伊隆 等編 頁(yè)數(shù):337 字?jǐn)?shù):388000
Tag標(biāo)簽:無
前言
計(jì)算語言學(xué)(Computational Lingljistics,CL)在語言科學(xué)與信息科學(xué)的研究領(lǐng)域扮演關(guān)鍵性的角色。語言學(xué)理論尋求對(duì)語言現(xiàn)象規(guī)律性的揭示與完整的解釋。計(jì)算語言學(xué)正好提供了驗(yàn)證與應(yīng)用這些規(guī)律與解釋的大好機(jī)會(huì)。作為語言學(xué)、信息科學(xué)乃至于心理學(xué)與認(rèn)知科學(xué)結(jié)合的交叉學(xué)科,計(jì)算語言學(xué)更提供了語言學(xué)基礎(chǔ)研究與應(yīng)用研究的絕佳界面。事實(shí)上,計(jì)算語言學(xué)與人類語言科技(Human Langllage Technology,HLT)可以視為一體兩面,不可分割?! ∮?jì)算語言學(xué)研究濫觴于上世紀(jì)五六十年代的機(jī)器翻譯研究。中文的相關(guān)研究也幾乎同步開始,1960年起在柏克萊加州大學(xué)研究室,王士元、鄒嘉彥、C.Y.Dougherty等人已開始研究中英、中俄機(jī)器翻譯。他們的中文計(jì)算語言學(xué)研究,可說是與世界最尖端科技同步的。中國(guó)國(guó)內(nèi)中俄翻譯研究也不遑多讓,大約在上世紀(jì)50年代中期便已開始??上У氖?,這些中文相關(guān)早期機(jī)器翻譯研究,由于硬件與軟件的限制,沒能延續(xù)下來。中文計(jì)算語言學(xué)研究比較有系統(tǒng)的進(jìn)展,還要等到1986年;海峽兩岸在同一年成立了兩個(gè)致力于中文計(jì)算語言學(xué)基礎(chǔ)架構(gòu)建立的研究群。北京大學(xué)的計(jì)算語言學(xué)研究所在朱德熙先生倡導(dǎo)下成立,隨后一段時(shí)間由陸儉明、俞士汶主持。而臺(tái)灣“中研院”的中文詞知識(shí)庫(kù)小組,由謝清俊創(chuàng)立,陳克健主持,黃居仁1987年返臺(tái)后加入。
內(nèi)容概要
口語翻譯(Spoken Language Translation, SLT)是指讓計(jì)算機(jī)實(shí)現(xiàn)從一種語言的語音到另一種語言的語音自動(dòng)翻譯的過程。其理想目標(biāo)是,讓計(jì)算機(jī)像人一樣充當(dāng)持不同語言的說話人之間的翻譯角色。會(huì)議演講、交談(通過電話、網(wǎng)絡(luò)或面對(duì)面)、廣播等場(chǎng)景下的話語翻譯都是口語翻譯應(yīng)用的重要領(lǐng)域。由于多數(shù)情況下說話人的話語都以口語風(fēng)格為主,人們尤其希望翻譯系統(tǒng)可以接受并實(shí)現(xiàn)任意口語化的、自由交談式的對(duì)話語音直接翻譯。本書全面、系統(tǒng)地介紹了SLT項(xiàng)目研究的主要成果,內(nèi)容包括語言處理與語料收集、語言覆蓋性、語音處理和系統(tǒng)評(píng)估等各個(gè)方面,其中語言處理部分是本書的主要內(nèi)容。
書籍目錄
導(dǎo)讀PrefaceAcknowledgements 1 IntroductionPart 1 Language Processing and Corpora 2 Translation Using the Core Language Engine 3 Grammar Specialisation 4 Choosing among Interpretations 5 The TreeBanker 6 Acquisition of Lexical Entries 7 Spelling and Morphology 8 Corpora and Data CollectionPart 2 Linguistic Coverage 9 English Coverage 10 French Coverage 11 Swedish Coverage 12 Transfer Coverage 13 Rational Reuse of Linguistic DataPart 3 Speech Processing 14 Speech Recognition 15 Acoustic Modelling 16 Language Modelling for Multilingual Speech Translation 17 Porting a Recogniser to a New Language 18 Multiple Dialects and Languages 19 Common Speech/Language IssuePart 4 Evaluation and Conclusions 20 Evaluation 21 ConclusionsReferencesIndex
章節(jié)摘錄
棒性和系統(tǒng)的自適應(yīng)能力。同書面語相比,口語的聲學(xué)特性有一定的特殊性,這類語音的基頻、時(shí)長(zhǎng)、幅度等特征都隨表達(dá)內(nèi)容、感情色彩等不同,變化的范圍比朗讀語音大得多,同時(shí)還有非語聲信號(hào)和噪聲,充分研究這些特性,建立精細(xì)的聲學(xué)模型非常重要。而且,講話人往往是在較強(qiáng)的背景噪聲或多講話人環(huán)境下發(fā)音的,如果是電話自動(dòng)語音翻譯系統(tǒng),還存在通訊干擾等其他因素的影響,因此,提高語音識(shí)別在不同說話人、不同聲學(xué)環(huán)境及通道條件下的魯棒性,在口語翻譯系統(tǒng)中尤其重要。另外,在語言學(xué)層面,口語句子中含有大量的修正、重復(fù)、口頭語、省略等非規(guī)范語言現(xiàn)象,研究這些特征,對(duì)語言模型進(jìn)行完善,包括建模、算法和訓(xùn)練等各個(gè)方面,將有助于提高語音識(shí)別的正確率。 ?。?)翻譯方法有待于進(jìn)一步研究。盡管統(tǒng)計(jì)翻譯方法具有較高的魯棒性,但是,對(duì)非規(guī)范語言現(xiàn)象和噪聲的處理能力仍然十分有限,而且這種方法與訓(xùn)練語料的規(guī)模和質(zhì)量密切相關(guān)。統(tǒng)計(jì)方法與規(guī)則方法的結(jié)合一直是人們所追求的,但是具體如何融合,多翻譯引擎以什么樣的集成方式可以獲得最好的系統(tǒng)性能,統(tǒng)計(jì)模型賴以訓(xùn)練的語料規(guī)模達(dá)到多大才算充分,非語言信息(手勢(shì)、表情、說話人角色等)如何融人翻譯模型等,諸多問題都遠(yuǎn)遠(yuǎn)沒有得到解決?! ?/pre>圖書封面
圖書標(biāo)簽Tags
無評(píng)論、評(píng)分、閱讀與下載
- 還沒讀過(74)
- 勉強(qiáng)可看(539)
- 一般般(919)
- 內(nèi)容豐富(3814)
- 強(qiáng)力推薦(312)