高維信息幾何與語音分析

出版時間:2011-3  出版社:科學(xué)出版社  作者:曹文明  頁數(shù):208  
Tag標(biāo)簽:無  

內(nèi)容概要

全書共三個部分,第一部分是介紹語音分析的常見研究方法,第二部分是高維信息幾何基礎(chǔ)知識,它主要介紹了高維信息幾何的歐氏空間與高維信息幾何線性代數(shù)基礎(chǔ)理論基本算法,第三部分給出了高維信息幾何理論及其算法在語音分析中的實際應(yīng)用,它主要是提出了高維信息幾何點覆蓋理論及幾何分析方法,對連續(xù)語音在高維空間中的種種表現(xiàn)形式加以探討,給出了語音信息映射到高維空間后的分布概況。

書籍目錄

前言
第1章 緒論
1.1 語音識別研究的重要意義
1.2 研究背景
1.2.1
國外語音識別研究的發(fā)展概況
1.2.2
漢語語音識別研究的發(fā)展概況
1.2.3
連續(xù)語音識別研究中遇到的挫折
1.3 連續(xù)語音識別的難點
1.3.1 連續(xù)語音的多變性和復(fù)雜性
1.3.2
高噪聲環(huán)境下語音模型的不穩(wěn)定性
1.3.3 連續(xù)語音識別技術(shù)的難點
1.4 連續(xù)語音識別問題的解決方法
1.4.1 傳統(tǒng)的算法
1.4.2 本書采用的方法
1.5 本書的研究內(nèi)容
第2章 語音的識別與處理方法概述
2.1 語音識別的分類
2.2 語音識別的基本步驟
2.3 語音的短時特性和窗函數(shù)
2.3.1 短時特性
2.3.2 窗函數(shù)
2.4 語音的特征提取
2.4.1 時域特征參數(shù)
2.4.2 頻域特征參數(shù)
2.4.3 倒譜域特征參數(shù)
2.5 語音識別算法簡介
2.5.1 動態(tài)時間彎折(DTW)
2.5.2 隱馬爾可夫模型(HMM)
2.5.3 矢量量化(VQ)
2.5.4 人工神經(jīng)網(wǎng)絡(luò)(ANN)
第3章 隱馬爾可夫模型與語音識別
3.1 馬爾可夫鏈
3.2 隱馬爾可夫模型
3.3 隱馬爾可夫模型的基本算法
3.4 語音識別中的隱馬爾可夫模型類型
3.5 基于隱馬爾可夫模型的語音識別系統(tǒng)
3.6 混合高斯模型
3.7 基于聲激勵源與聲道互補性信息的說話人識別
3.7.1
線性預(yù)測分析及聲激勵源信號提取
3.7.2 說話人特征參數(shù)的提取
3.7.3
WOCOR和MFCC區(qū)分不同說話人的性能分析
3.7.4
基于WOCOR和MFCC的說話人辨認(rèn)實驗
3.7.5
基于WOCOR和MFCC的說話人確認(rèn)實驗
3.8 總結(jié)與討論
第4章 高維信息幾何的歐氏空間
4.1 點的向量表示,向量的運算
4.2 n維歐氏空間
4.2.1
n維歐氏空間的有關(guān)概念與基本性質(zhì)
4.2.2 基本圖形的度量方程
4.3 變換
4.3.1
平移變換、合同變換、正交變換
4.3.2 變換的簡單應(yīng)用
4.3.3
基于高維空間幾何點分布理論的圖像復(fù)原算法
4.4 子空間、凸集、凸多胞形
4.4.1 子空間
4.4.2 凸集
4.4.3 凸多胞形
4.4.4 復(fù)雜幾何體神經(jīng)元
4.5 點距關(guān)系
4.6 同調(diào)連續(xù)性理論
4.6.1 同調(diào)連續(xù)原理
4.6.2 拓?fù)淞餍蔚挠?xùn)練與識別
4.7 小結(jié)
第5章 高維信息幾何線性代數(shù)
5.1 n維歐氏空間公理化系統(tǒng)及基本性質(zhì)
5.1.1 公理化系統(tǒng)
5.1.2 n維歐氏空間基本性質(zhì)
5.2 基本幾何術(shù)語及符號
5.3 點到?面及平面間距離
5.3.1 點到平面的距離
5.3.2 兩平面間距離
5.4 平面間夾角
5.4.1 直線與平面間夾角
5.4.2 兩平面間夾角
5.4.3 兩平面及其夾角
5.5 k_平行四邊形:k_矢量
5.5.1
R<sup>n</sup>中矢量的線性相關(guān)或獨立的測試
5.5.2
k_平行四邊形的k_維體積
5.5.3 k_矢量
5.6 k_單形幾何學(xué)和三角學(xué)
5.6.1 k_單形的k_維體積
5.6.2 Dihedral角
5.6.3 投影定律
5.6.4 余弦定律
5.6.5 正弦定律
5.7 重心坐標(biāo)
5.7.1
R<sup>n</sup>的點在重心坐標(biāo)和直角坐標(biāo)之間的變換
5.7.2
n_單形在重心坐標(biāo)下的體積及其應(yīng)用
5.7.3
在重心坐標(biāo)下兩點之間的距離
5.7.4 重心、內(nèi)心和外接球心
5.8 點覆蓋
5.8.1 覆蓋
5.8.2 覆蓋比
5.8.3 局部頂點覆蓋
5.8.4 覆蓋積
5.9 主元分析法及其高維空間幾何意義
5.9.1 主元分析法簡介
5.9.2
主元分析法的高維空間幾何意義
5.10 語音在高維空間中的形態(tài)分析
5.10.1
語音點在高維空間中的分布概況
5.10.2
不同類語音覆蓋區(qū)的覆蓋方法
5.10.3 采用點覆蓋方法的優(yōu)點
第6章 基于高維空間覆蓋動態(tài)搜索方法的非特定人連續(xù)數(shù)字語音識別
6.1 數(shù)字語音分析
6.2 連續(xù)數(shù)字語音識別的特征提取方法和高維空間分類覆蓋區(qū)的神經(jīng)網(wǎng)絡(luò)構(gòu)筑
6.2.1
構(gòu)筑神經(jīng)網(wǎng)絡(luò)所用樣本庫的建立
6.2.2
構(gòu)筑神經(jīng)網(wǎng)絡(luò)所用樣本的特征提取方法
6.2.3 構(gòu)造特征空間識別覆蓋區(qū)
6.3 高維空間語音搜索算法及實現(xiàn)
6.3.1
被識別的連續(xù)語音樣本庫的建立
6.3.2
被識別的連續(xù)語音樣本的特征提取方法
6.3.3
高維空間點覆蓋動態(tài)搜索識別方法
6.4 實驗結(jié)果與討論
6.4.1 本實驗的統(tǒng)計結(jié)果與討論
6.4.2
與隱馬爾可夫模型方法的比較結(jié)果及討論
第7章 基于多權(quán)值神經(jīng)網(wǎng)絡(luò)的語音情感識別及其比較
7.1 情感類型的劃分
7.2 語音情感特征的選擇和提取
7.3 語音情感識別所用的樣本庫的建立
7.4 多權(quán)值神經(jīng)網(wǎng)絡(luò)的構(gòu)建與識別過程
7.4.1
多權(quán)值神經(jīng)網(wǎng)絡(luò)的構(gòu)建具體算法描述
7.4.2 多權(quán)值神經(jīng)網(wǎng)絡(luò)的識別
7.5 實驗結(jié)果與討論
7.5.1 本實驗的統(tǒng)計結(jié)果與討論
7.5.2 與SVM模型的比較結(jié)果
7.6 小結(jié)
參考文獻

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    高維信息幾何與語音分析 PDF格式下載


用戶評論 (總計0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7