出版時間:2009-3 出版社:清華大學出版社 作者:吳朝暉,楊瑩春 著 頁數:329
Tag標簽:無
前言
說話人識別屬于生物特征識別技術的一種,是一項根據語音波形中反映說話人生理和行為的特征的語音參數,自動識別說話人身份的技術。與語音識別不同的是,說話人識別利用的是語音信號中的說話人信息,而不考慮語音中的字詞意思,它強調說話人的個性;而語音識別的目的是識別出語音信號中的言語內容,并不考慮說話人是誰,它強調共性。說話人識別技術的崛起得益于信號檢測與處理、模式識別、人工智能、機器學習等理論與技術的發(fā)展,這是一個涉夏生理學、心理學、聲學、語音學等多學科的研究領域。本書結合我們對說話人識別進行的研究和工作,在對說話人識別的基本概念和方法進簡要介紹的基礎上詳細介紹了我們在測試語料庫、特征組合、特征變換、識別模型以及應用系統開發(fā)的最新重要研究成果。我們從事說話人識別研究至今已8年有余,簡單回顧下作者與本書寫作內容有關的幾個重要時間標記。1999年,在杭州中正生物認證有限公司的資助下,我們的生物認證實驗室宣告成立。
內容概要
說話人識別是根據語音波形中反映說話人生理和行為的特征的語音參數,自動識別說話人身份的技術。本書作者結合多年的科研丁作,分5個部分介紹了說話人識別的基本概念、方法以及最新研究進展。第1部分概括介紹說話人識別的主要概念、基本原理、研究歷史與現狀,以及測試語料庫的構建;第2部分介紹作者對特征提取提出的不同改進方法,包括特征組合與特征變換;第3部分是作者提出的新的說話人識別模型,包括支持向量機、動態(tài)貝葉斯網絡、主成分分析;第4部分介紹作者在基于信息融合的說話人識別上的創(chuàng)新工作;第5部分介紹作者開發(fā)的一個軟件平臺及其基礎上的兩個具體應用系統,最后是全書總結并展望發(fā)展趨勢?! ”緯晒┬畔⒐こ?、電子工程、計算機科學與技術、公安、軍事偵察等領域的科技工作者參考,也可以作為高等院校信號與信息處理、通信與電子系統、模式識別、生物醫(yī)學等學科專業(yè)的研究生或高年級本科生的教學參考書。
書籍目錄
第一篇 緒論 第1章 背景與概述 1.1 研究背景及意義 1.2 研究進展與趨勢 1.3 本書結構 參考文獻 第2章 技術基礎與理論 2.1 背景知識 2.2 說話人識別系統結構 2.3 特征提取 2.4 說話人識別模型 2.5 得分規(guī)整 2.6 系統性能評價 2.7 小結 參考文獻 第3章 說話人識別語料庫 3.1 常用語料庫 3.2 面向移動互聯環(huán)境的說話人識別語料庫(SRMC) 3.3 電話語音庫(PHONE) 3.4 多模態(tài)說話人識別庫 3.5 NOISEX-92數據庫 3.6 小結 參考文獻第二篇 特征提取 第4章 說話人特征分析與優(yōu)化 4.1 特征性能分析 4.2 特征參數優(yōu)化 4.3 特征組合 4.4 二次特征提取 4.5 小結 參考文獻 第5章 基于主成分分析(PCA)的說話人特征變換 5.1 高維說話人特征的缺陷 5.2 說話人特征與PCA變換 5.3 PCA特征變換應用于說話人鑒別 5.4 局部PCA特征變換 5.5 全局PCA特征普換 5.6 基準系統、局部PCA變換與全局PCA變換的比較 5.7 小結 參考文獻 第6章 基于線性判別分析(LDA)的說話人特征變換 6.1 LDA變換與PCA變換的聯系與區(qū)別 6.2 LDA特征變換 6.3 基準系統、全局PCA變換與LDA變換的比較 6.4 小結 第7章 基于軌線模型的說話人特征時序性發(fā)掘第三篇 識別模型 第8章 基于支持向量機的識別模型 第9章 基于動態(tài)貝葉斯網絡的識別模型 第10章 基于主成分分析分類器的說話人識別第四篇 信息融合 第11章 聲門信息融合 第12章 人臉信息融合第五篇 應用展望 第13章 支持說話人識別研究與開發(fā)的開放式平臺SONAR 第14章 應用系統 第15章 總結與展望
章節(jié)摘錄
插圖:第一篇 緒論第1章 背景與概述1.1 研究背景及意義1.1.2 說話人識別的優(yōu)勢與應用前景與其他生物認證技術如指紋識別、掌形識別、虹膜識別等一樣,聲紋識別有不會遺失、無須記憶和使用方便等優(yōu)點。在生物認證技術領域中,說話人識別技術以其獨特的方便性、經濟性和準確性受到世人矚目,并日益成為人們日常生活和工作中重要且普及的安全驗證方式。在眾多的生物認證技術中,說話人識別技術表現出很多應用上的優(yōu)勢。首先,說話人識別有著天然的優(yōu)點:以聲音作為識別特征,因其非接觸性和自然性,用戶容易接受。在說話人識別中,用戶不用刻意地將手指放在傳感器上,或者把眼睛湊向攝像頭,只需要簡單地說一兩句話即可完成識別。其次,說話人識別所用的設備成本很低。對輸入設備如麥克風、電話送話器等沒有特別的要求;聲音的采樣與量化對芯片的要求也不高;特征提取、模型訓練和匹配只需普通計算機即可完成。另外,因為普遍存在的電話網絡和麥克風、計算機的一體化,所以說話人識別系統所需的硬件成本幾乎為零。再次,其他生物特征識別技術各有其比較劣勢。指紋識別技術雖然已經比較成熟,但用戶的接受度不高,人們經常把指紋同犯罪聯系在一起,不衛(wèi)生是另外一個不利因素。虹膜、視網膜識別技術的精確度雖然很高,但所需的設備非常昂貴,并且據研究,這些特征中包含用戶的健康狀況等隱私信息,大眾接受度也不高。臉部、步法等特征,雖然比較自然,用戶也容易接受,但實現難度很大。因此,說話人識別的優(yōu)勢更加明顯。
編輯推薦
《說話人識別模型與方法》可供信息工程、電子工程、計算機科學與技術、公安、軍事偵察等領域的科技工作者參考,也可以作為高等院校信號與信息處理、通信與電子系統、模式識別、生物醫(yī)學等學科專業(yè)的研究生或高年級本科生的教學參考書。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載