出版時(shí)間:2011-3 出版社:科學(xué)出版社 作者:韓紀(jì)慶 等 著 頁(yè)數(shù):256
Tag標(biāo)簽:無
內(nèi)容概要
《音頻信息檢索理論與技術(shù)》系統(tǒng)地介紹語(yǔ)音檢索研究的相關(guān)理論、技術(shù)與方法,以及該學(xué)科領(lǐng)域取得的新進(jìn)展。內(nèi)容將涉及基于語(yǔ)音內(nèi)容的信息檢索、基于說話人特征的信息檢索、基于音頻及音樂特征的信息檢索等范疇。《音頻信息檢索理論與技術(shù)》將從語(yǔ)音檢索的理論框架、適合檢索要求的語(yǔ)音特征表示、高效索引的構(gòu)建、高速搜索算法、典型的實(shí)用技術(shù),以及典型應(yīng)用實(shí)例等方面系統(tǒng)地介紹語(yǔ)音檢索相關(guān)的理論與技術(shù)。
書籍目錄
前言第一部分 音頻信息檢索的發(fā)展與理論基礎(chǔ)第1章 緒論1.1 信息檢索技術(shù)的分類及進(jìn)展1.1.1 概述1.1.2 文本信息檢索1.1.3 多媒體信息檢索1.2 音頻信息檢索技術(shù)的發(fā)展1.2.1 語(yǔ)音文檔檢索1.2.2 說話人檢索1.2.3 音樂檢索1.3 音頻信息檢索的應(yīng)用1.4 本書的構(gòu)成參考文獻(xiàn)第2章 音頻信息檢索的基礎(chǔ)2.1 人類對(duì)音頻信息的認(rèn)知機(jī)理2.1.1 聽覺的生理基礎(chǔ)2.1.2 聽覺的感知機(jī)制2.1.3 聽覺特性2.2 音頻信號(hào)的數(shù)字處理及特征表示2.2.1 信號(hào)的統(tǒng)計(jì)特征2.2.2 感知特征2.3 音頻信息檢索框架及模型2.4 音頻信息檢索的評(píng)價(jià)參考文獻(xiàn)第二部分 表示級(jí)的音頻檢索第3章 基于直接匹配的音頻樣例檢索方法3.1 基于分段的實(shí)時(shí)檢索方法3.1.1 片段劃分3.1.2 基于檢索窗的檢索控制3.1.3 基于分段的檢索方法3.1.4 快速分段檢索方法3.2 MPEG-1壓縮域模糊分類的檢索方法3.2.1 MPEG音頻編碼簡(jiǎn)介3.2.2 MPEG-1壓縮域特征選擇和提取3.2.3基于MPEG-1壓縮域模糊分類的檢索方法參考文獻(xiàn)第4章 基于索引的音頻樣例檢索方法4.1 局部敏感哈希索引方法4.1.1 局部敏感哈希4.1.2 ρ-穩(wěn)定分布局部敏感哈希4.1.3 ρ-穩(wěn)定分布局部敏感哈希音頻索引方法4.2 基于局部敏感哈希倒排索引的檢索方法4.2.1 基于局部敏感哈希的倒排索引構(gòu)造4.2.2 基于局部敏感哈希倒排索引的搜索4.3 基于樹與鏈表混合索引的檢索方法4.3.1 模糊直方圖模型4.3.2 樹與鏈表混合索引構(gòu)造4.3.3 基于樹與鏈表混合索引的搜索4.3.4 時(shí)間復(fù)雜度分析參考文獻(xiàn)第5章 基于GPU通用計(jì)算的快速音頻樣例檢索方法5.1 通用圖形處理器與統(tǒng)一計(jì)算設(shè)備框架5.1.1 通用圖形處理器5.1.2 統(tǒng)一計(jì)算設(shè)備框架5.2 檢索算法GPU加速的可行性分析5.2.1 檢索算法可移植性分析5.2.2 檢索算法計(jì)算特點(diǎn)分析5.3 檢索算法GPU加速的實(shí)現(xiàn)5.3.1 以線程為粒度的算法實(shí)現(xiàn)5.3.2 以線程塊為粒度的算法實(shí)現(xiàn)5.3.3 加速效果比較參考文獻(xiàn)第三部分 語(yǔ)義級(jí)語(yǔ)音文檔檢索第6章 語(yǔ)音文檔檢索的預(yù)處理技術(shù)6.1 語(yǔ)音文檔檢索系統(tǒng)的組成6.2 檢索系統(tǒng)中的預(yù)處理技術(shù)6.2.1 連續(xù)語(yǔ)音識(shí)別6.2.2 關(guān)鍵詞檢出6.3 語(yǔ)音文檔檢索的評(píng)價(jià)指標(biāo)參考文獻(xiàn)第7章 語(yǔ)音文檔檢索的索引和搜索技術(shù)7.1 基于關(guān)鍵詞檢出的檢索方法7.2 基于語(yǔ)音識(shí)別器最優(yōu)候選的檢索方法7.2.1 基于大詞表連續(xù)語(yǔ)音識(shí)別器最優(yōu)候選的檢索方法7.2.2 基于子詞識(shí)別器最優(yōu)候選的檢索方法7.3 基于音節(jié)網(wǎng)格搜索的檢索方法7.3.1 音節(jié)網(wǎng)格的若干定義及性質(zhì)7.3.2 基于音節(jié)網(wǎng)格搜索的檢索方法7.3.3 索引去冗余方法7.3.4 檢索性能分析7.4 基于音節(jié)倒排索引的檢索方法7.4.1 倒排索引結(jié)構(gòu)7.4.2 采用時(shí)間匹配機(jī)制的檢索方法7.4.3 采用位置匹配機(jī)制的檢索方法7.4.4 檢索性能分析7.5 基于后驗(yàn)概率鄰接音節(jié)矩陣的檢索方法7.5.1 語(yǔ)音文檔的表示7.5.2 網(wǎng)格的鄰接音節(jié)后驗(yàn)概率矩陣7.5.3 語(yǔ)音文檔的鄰接音節(jié)后驗(yàn)概率矩陣7.5.4 檢索方法描述7.5.5 基于韻律加權(quán)的索引修正7.5.6 檢索性能分析參考文獻(xiàn)第8章 語(yǔ)音文檔檢索中的容錯(cuò)技術(shù)8.1 基于模糊匹配策略的容錯(cuò)方法8.2 基于融合策略的容錯(cuò)方法8.2.1 索引層面的融合8.2.2 分?jǐn)?shù)層面的融合8.3 基于擴(kuò)充網(wǎng)格的容錯(cuò)方法8.3.1 算法的基本思想8.3.2 基于局部路徑的簡(jiǎn)化計(jì)算8.3.3 基于擴(kuò)充網(wǎng)格的檢索精度提高方法8.3.4 檢索性能分析8.4 基于詞片語(yǔ)言模型的容錯(cuò)方法8.4.1 詞片8.4.2 基于互信息的詞片選擇算法8.4.3 基于詞片的語(yǔ)言模型8.4.4 采用詞片識(shí)別器的檢索方法參考文獻(xiàn)第四部分 語(yǔ)義級(jí)的說話人檢索第9章 說話人檢索9.1 說話人分割9.2 檢索中的說話人識(shí)別技術(shù)9.2.1 基于GMM的識(shí)別方法9.2.2 基于GMM-UBM的識(shí)別方法9.3 直接利用說話人識(shí)別實(shí)現(xiàn)的檢索技術(shù)9.3.1 極低錯(cuò)誤接受率的實(shí)現(xiàn)9.3.2 訓(xùn)練語(yǔ)料不充分問題的解決9.4 間接利用說話人識(shí)別實(shí)現(xiàn)的檢索技術(shù)9.4.1 錨模型索引方法9.4.2 GMM模型索引方法參考文獻(xiàn)第五部分 語(yǔ)義級(jí)的音樂檢索第10章 音樂自動(dòng)標(biāo)注10.1 音樂聲學(xué)基礎(chǔ)10.1.1 樂音的感知10.1.2 音程、音律、音名與音高標(biāo)準(zhǔn)10.1.3 音樂的要素10.2 音樂自動(dòng)標(biāo)注方法及存在的問題10.3 基于諧波結(jié)構(gòu)信息的音樂標(biāo)注10.3.1 基于BP神經(jīng)網(wǎng)絡(luò)的起始點(diǎn)檢測(cè)10.3.2 基于諧波結(jié)構(gòu)信息的多基頻估計(jì)方法10.4 基于半音域頻率系數(shù)的歌曲旋律提取10.4.1 半音域頻率系數(shù)10.4.2 基于viterbi方法的旋律提取參考文獻(xiàn)第11章 音樂檢索11.1 哼唱檢索11.1.1 基于規(guī)則的哼唱旋律提取11.1.2 樂曲庫(kù)的索引方法11.1.3 旋律匹配11.2 拍打檢索11.2.1 特征提取11.2.2 基于DTW的匹配計(jì)算11.3 基于色度圖的復(fù)調(diào)音樂檢索11.3.1 色度11.3.2 色度圖11.3.3 離散色度圖和色度特征11.3.4 基于色度的相關(guān)計(jì)算與檢索參考文獻(xiàn)
圖書封面
圖書標(biāo)簽Tags
無
評(píng)論、評(píng)分、閱讀與下載