出版時間:2009-3 出版社:清華大學(xué)出版社 作者:吳朝暉,楊瑩春 著 頁數(shù):329
Tag標(biāo)簽:無
前言
說話人識別屬于生物特征識別技術(shù)的一種,是一項根據(jù)語音波形中反映說話人生理和行為的特征的語音參數(shù),自動識別說話人身份的技術(shù)。與語音識別不同的是,說話人識別利用的是語音信號中的說話人信息,而不考慮語音中的字詞意思,它強調(diào)說話人的個性;而語音識別的目的是識別出語音信號中的言語內(nèi)容,并不考慮說話人是誰,它強調(diào)共性。說話人識別技術(shù)的崛起得益于信號檢測與處理、模式識別、人工智能、機器學(xué)習(xí)等理論與技術(shù)的發(fā)展,這是一個涉夏生理學(xué)、心理學(xué)、聲學(xué)、語音學(xué)等多學(xué)科的研究領(lǐng)域。本書結(jié)合我們對說話人識別進行的研究和工作,在對說話人識別的基本概念和方法進簡要介紹的基礎(chǔ)上詳細介紹了我們在測試語料庫、特征組合、特征變換、識別模型以及應(yīng)用系統(tǒng)開發(fā)的最新重要研究成果。我們從事說話人識別研究至今已8年有余,簡單回顧下作者與本書寫作內(nèi)容有關(guān)的幾個重要時間標(biāo)記。1999年,在杭州中正生物認證有限公司的資助下,我們的生物認證實驗室宣告成立。
內(nèi)容概要
說話人識別是根據(jù)語音波形中反映說話人生理和行為的特征的語音參數(shù),自動識別說話人身份的技術(shù)。本書作者結(jié)合多年的科研丁作,分5個部分介紹了說話人識別的基本概念、方法以及最新研究進展。第1部分概括介紹說話人識別的主要概念、基本原理、研究歷史與現(xiàn)狀,以及測試語料庫的構(gòu)建;第2部分介紹作者對特征提取提出的不同改進方法,包括特征組合與特征變換;第3部分是作者提出的新的說話人識別模型,包括支持向量機、動態(tài)貝葉斯網(wǎng)絡(luò)、主成分分析;第4部分介紹作者在基于信息融合的說話人識別上的創(chuàng)新工作;第5部分介紹作者開發(fā)的一個軟件平臺及其基礎(chǔ)上的兩個具體應(yīng)用系統(tǒng),最后是全書總結(jié)并展望發(fā)展趨勢?! ”緯晒┬畔⒐こ?、電子工程、計算機科學(xué)與技術(shù)、公安、軍事偵察等領(lǐng)域的科技工作者參考,也可以作為高等院校信號與信息處理、通信與電子系統(tǒng)、模式識別、生物醫(yī)學(xué)等學(xué)科專業(yè)的研究生或高年級本科生的教學(xué)參考書。
書籍目錄
第一篇 緒論 第1章 背景與概述 1.1 研究背景及意義 1.2 研究進展與趨勢 1.3 本書結(jié)構(gòu) 參考文獻 第2章 技術(shù)基礎(chǔ)與理論 2.1 背景知識 2.2 說話人識別系統(tǒng)結(jié)構(gòu) 2.3 特征提取 2.4 說話人識別模型 2.5 得分規(guī)整 2.6 系統(tǒng)性能評價 2.7 小結(jié) 參考文獻 第3章 說話人識別語料庫 3.1 常用語料庫 3.2 面向移動互聯(lián)環(huán)境的說話人識別語料庫(SRMC) 3.3 電話語音庫(PHONE) 3.4 多模態(tài)說話人識別庫 3.5 NOISEX-92數(shù)據(jù)庫 3.6 小結(jié) 參考文獻第二篇 特征提取 第4章 說話人特征分析與優(yōu)化 4.1 特征性能分析 4.2 特征參數(shù)優(yōu)化 4.3 特征組合 4.4 二次特征提取 4.5 小結(jié) 參考文獻 第5章 基于主成分分析(PCA)的說話人特征變換 5.1 高維說話人特征的缺陷 5.2 說話人特征與PCA變換 5.3 PCA特征變換應(yīng)用于說話人鑒別 5.4 局部PCA特征變換 5.5 全局PCA特征普換 5.6 基準系統(tǒng)、局部PCA變換與全局PCA變換的比較 5.7 小結(jié) 參考文獻 第6章 基于線性判別分析(LDA)的說話人特征變換 6.1 LDA變換與PCA變換的聯(lián)系與區(qū)別 6.2 LDA特征變換 6.3 基準系統(tǒng)、全局PCA變換與LDA變換的比較 6.4 小結(jié) 第7章 基于軌線模型的說話人特征時序性發(fā)掘第三篇 識別模型 第8章 基于支持向量機的識別模型 第9章 基于動態(tài)貝葉斯網(wǎng)絡(luò)的識別模型 第10章 基于主成分分析分類器的說話人識別第四篇 信息融合 第11章 聲門信息融合 第12章 人臉信息融合第五篇 應(yīng)用展望 第13章 支持說話人識別研究與開發(fā)的開放式平臺SONAR 第14章 應(yīng)用系統(tǒng) 第15章 總結(jié)與展望
章節(jié)摘錄
插圖:第一篇 緒論第1章 背景與概述1.1 研究背景及意義1.1.2 說話人識別的優(yōu)勢與應(yīng)用前景與其他生物認證技術(shù)如指紋識別、掌形識別、虹膜識別等一樣,聲紋識別有不會遺失、無須記憶和使用方便等優(yōu)點。在生物認證技術(shù)領(lǐng)域中,說話人識別技術(shù)以其獨特的方便性、經(jīng)濟性和準確性受到世人矚目,并日益成為人們?nèi)粘I詈凸ぷ髦兄匾移占暗陌踩炞C方式。在眾多的生物認證技術(shù)中,說話人識別技術(shù)表現(xiàn)出很多應(yīng)用上的優(yōu)勢。首先,說話人識別有著天然的優(yōu)點:以聲音作為識別特征,因其非接觸性和自然性,用戶容易接受。在說話人識別中,用戶不用刻意地將手指放在傳感器上,或者把眼睛湊向攝像頭,只需要簡單地說一兩句話即可完成識別。其次,說話人識別所用的設(shè)備成本很低。對輸入設(shè)備如麥克風(fēng)、電話送話器等沒有特別的要求;聲音的采樣與量化對芯片的要求也不高;特征提取、模型訓(xùn)練和匹配只需普通計算機即可完成。另外,因為普遍存在的電話網(wǎng)絡(luò)和麥克風(fēng)、計算機的一體化,所以說話人識別系統(tǒng)所需的硬件成本幾乎為零。再次,其他生物特征識別技術(shù)各有其比較劣勢。指紋識別技術(shù)雖然已經(jīng)比較成熟,但用戶的接受度不高,人們經(jīng)常把指紋同犯罪聯(lián)系在一起,不衛(wèi)生是另外一個不利因素。虹膜、視網(wǎng)膜識別技術(shù)的精確度雖然很高,但所需的設(shè)備非常昂貴,并且據(jù)研究,這些特征中包含用戶的健康狀況等隱私信息,大眾接受度也不高。臉部、步法等特征,雖然比較自然,用戶也容易接受,但實現(xiàn)難度很大。因此,說話人識別的優(yōu)勢更加明顯。
編輯推薦
《說話人識別模型與方法》可供信息工程、電子工程、計算機科學(xué)與技術(shù)、公安、軍事偵察等領(lǐng)域的科技工作者參考,也可以作為高等院校信號與信息處理、通信與電子系統(tǒng)、模式識別、生物醫(yī)學(xué)等學(xué)科專業(yè)的研究生或高年級本科生的教學(xué)參考書。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載