音頻信息檢索理論與技術(shù)

出版時間:2011-3  出版社:科學(xué)出版社  作者:韓紀(jì)慶 等 著  頁數(shù):256  
Tag標(biāo)簽:無  

內(nèi)容概要

  《音頻信息檢索理論與技術(shù)》系統(tǒng)地介紹語音檢索研究的相關(guān)理論、技術(shù)與方法,以及該學(xué)科領(lǐng)域取得的新進展。內(nèi)容將涉及基于語音內(nèi)容的信息檢索、基于說話人特征的信息檢索、基于音頻及音樂特征的信息檢索等范疇?!兑纛l信息檢索理論與技術(shù)》將從語音檢索的理論框架、適合檢索要求的語音特征表示、高效索引的構(gòu)建、高速搜索算法、典型的實用技術(shù),以及典型應(yīng)用實例等方面系統(tǒng)地介紹語音檢索相關(guān)的理論與技術(shù)。

書籍目錄

前言第一部分 音頻信息檢索的發(fā)展與理論基礎(chǔ)第1章 緒論1.1 信息檢索技術(shù)的分類及進展1.1.1 概述1.1.2 文本信息檢索1.1.3 多媒體信息檢索1.2 音頻信息檢索技術(shù)的發(fā)展1.2.1 語音文檔檢索1.2.2 說話人檢索1.2.3 音樂檢索1.3 音頻信息檢索的應(yīng)用1.4 本書的構(gòu)成參考文獻第2章 音頻信息檢索的基礎(chǔ)2.1 人類對音頻信息的認(rèn)知機理2.1.1 聽覺的生理基礎(chǔ)2.1.2 聽覺的感知機制2.1.3 聽覺特性2.2 音頻信號的數(shù)字處理及特征表示2.2.1 信號的統(tǒng)計特征2.2.2 感知特征2.3 音頻信息檢索框架及模型2.4 音頻信息檢索的評價參考文獻第二部分 表示級的音頻檢索第3章 基于直接匹配的音頻樣例檢索方法3.1 基于分段的實時檢索方法3.1.1 片段劃分3.1.2 基于檢索窗的檢索控制3.1.3 基于分段的檢索方法3.1.4 快速分段檢索方法3.2 MPEG-1壓縮域模糊分類的檢索方法3.2.1 MPEG音頻編碼簡介3.2.2 MPEG-1壓縮域特征選擇和提取3.2.3基于MPEG-1壓縮域模糊分類的檢索方法參考文獻第4章 基于索引的音頻樣例檢索方法4.1 局部敏感哈希索引方法4.1.1 局部敏感哈希4.1.2 ρ-穩(wěn)定分布局部敏感哈希4.1.3 ρ-穩(wěn)定分布局部敏感哈希音頻索引方法4.2 基于局部敏感哈希倒排索引的檢索方法4.2.1 基于局部敏感哈希的倒排索引構(gòu)造4.2.2 基于局部敏感哈希倒排索引的搜索4.3 基于樹與鏈表混合索引的檢索方法4.3.1 模糊直方圖模型4.3.2 樹與鏈表混合索引構(gòu)造4.3.3 基于樹與鏈表混合索引的搜索4.3.4 時間復(fù)雜度分析參考文獻第5章 基于GPU通用計算的快速音頻樣例檢索方法5.1 通用圖形處理器與統(tǒng)一計算設(shè)備框架5.1.1 通用圖形處理器5.1.2 統(tǒng)一計算設(shè)備框架5.2 檢索算法GPU加速的可行性分析5.2.1 檢索算法可移植性分析5.2.2 檢索算法計算特點分析5.3 檢索算法GPU加速的實現(xiàn)5.3.1 以線程為粒度的算法實現(xiàn)5.3.2 以線程塊為粒度的算法實現(xiàn)5.3.3 加速效果比較參考文獻第三部分 語義級語音文檔檢索第6章 語音文檔檢索的預(yù)處理技術(shù)6.1 語音文檔檢索系統(tǒng)的組成6.2 檢索系統(tǒng)中的預(yù)處理技術(shù)6.2.1 連續(xù)語音識別6.2.2 關(guān)鍵詞檢出6.3 語音文檔檢索的評價指標(biāo)參考文獻第7章 語音文檔檢索的索引和搜索技術(shù)7.1 基于關(guān)鍵詞檢出的檢索方法7.2 基于語音識別器最優(yōu)候選的檢索方法7.2.1 基于大詞表連續(xù)語音識別器最優(yōu)候選的檢索方法7.2.2 基于子詞識別器最優(yōu)候選的檢索方法7.3 基于音節(jié)網(wǎng)格搜索的檢索方法7.3.1 音節(jié)網(wǎng)格的若干定義及性質(zhì)7.3.2 基于音節(jié)網(wǎng)格搜索的檢索方法7.3.3 索引去冗余方法7.3.4 檢索性能分析7.4 基于音節(jié)倒排索引的檢索方法7.4.1 倒排索引結(jié)構(gòu)7.4.2 采用時間匹配機制的檢索方法7.4.3 采用位置匹配機制的檢索方法7.4.4 檢索性能分析7.5 基于后驗概率鄰接音節(jié)矩陣的檢索方法7.5.1 語音文檔的表示7.5.2 網(wǎng)格的鄰接音節(jié)后驗概率矩陣7.5.3 語音文檔的鄰接音節(jié)后驗概率矩陣7.5.4 檢索方法描述7.5.5 基于韻律加權(quán)的索引修正7.5.6 檢索性能分析參考文獻第8章 語音文檔檢索中的容錯技術(shù)8.1 基于模糊匹配策略的容錯方法8.2 基于融合策略的容錯方法8.2.1 索引層面的融合8.2.2 分?jǐn)?shù)層面的融合8.3 基于擴充網(wǎng)格的容錯方法8.3.1 算法的基本思想8.3.2 基于局部路徑的簡化計算8.3.3 基于擴充網(wǎng)格的檢索精度提高方法8.3.4 檢索性能分析8.4 基于詞片語言模型的容錯方法8.4.1 詞片8.4.2 基于互信息的詞片選擇算法8.4.3 基于詞片的語言模型8.4.4 采用詞片識別器的檢索方法參考文獻第四部分 語義級的說話人檢索第9章 說話人檢索9.1 說話人分割9.2 檢索中的說話人識別技術(shù)9.2.1 基于GMM的識別方法9.2.2 基于GMM-UBM的識別方法9.3 直接利用說話人識別實現(xiàn)的檢索技術(shù)9.3.1 極低錯誤接受率的實現(xiàn)9.3.2 訓(xùn)練語料不充分問題的解決9.4 間接利用說話人識別實現(xiàn)的檢索技術(shù)9.4.1 錨模型索引方法9.4.2 GMM模型索引方法參考文獻第五部分 語義級的音樂檢索第10章 音樂自動標(biāo)注10.1 音樂聲學(xué)基礎(chǔ)10.1.1 樂音的感知10.1.2 音程、音律、音名與音高標(biāo)準(zhǔn)10.1.3 音樂的要素10.2 音樂自動標(biāo)注方法及存在的問題10.3 基于諧波結(jié)構(gòu)信息的音樂標(biāo)注10.3.1 基于BP神經(jīng)網(wǎng)絡(luò)的起始點檢測10.3.2 基于諧波結(jié)構(gòu)信息的多基頻估計方法10.4 基于半音域頻率系數(shù)的歌曲旋律提取10.4.1 半音域頻率系數(shù)10.4.2 基于viterbi方法的旋律提取參考文獻第11章 音樂檢索11.1 哼唱檢索11.1.1 基于規(guī)則的哼唱旋律提取11.1.2 樂曲庫的索引方法11.1.3 旋律匹配11.2 拍打檢索11.2.1 特征提取11.2.2 基于DTW的匹配計算11.3 基于色度圖的復(fù)調(diào)音樂檢索11.3.1 色度11.3.2 色度圖11.3.3 離散色度圖和色度特征11.3.4 基于色度的相關(guān)計算與檢索參考文獻

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    音頻信息檢索理論與技術(shù) PDF格式下載


用戶評論 (總計0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7