出版時間:2010-8 出版社:科學(xué)出版社 作者:(英)Durbin,R 等編著 頁數(shù):312
Tag標(biāo)簽:無
前言
1992年在Snowbird舉行的一次神經(jīng)網(wǎng)絡(luò)會議上,Darid Haussler及其加州大學(xué)圣克魯斯分校(UCSC)的同事們(其中也包括本書作者之一Anders Krogh)描述了使用概率論模型對蛋白質(zhì)序列進行多序列聯(lián)配建模的初步結(jié)果,他們稱這種模型為隱馬模型(HMM)。隨后他們的技術(shù)報告復(fù)本被廣泛地傳播,其中一些流傳到劍橋大學(xué)的MR(分子生物學(xué)實驗室。在那里,Richard Durbin和Graeme Mitchison剛剛將自己的研究興趣從神經(jīng)建模轉(zhuǎn)移到計算基因組序列分析上來,Sean Eddy當(dāng)時是該實驗室的一名博士后,其研究背景是實驗分子遺傳學(xué),他對計算分析非常感興趣。不久以后Anders Krogkt也到劍橋大學(xué)工作了一年?! ∥覀兌伎焖俚亟邮芰烁怕收摻5乃枷?,并且相信HMM及其隨機文法對應(yīng)物是優(yōu)美的數(shù)學(xué)對象,十分適合獲取埋藏在生物序列中的信息。圣克魯斯小組和劍橋小組很快獨立地開發(fā)了各自免費的HMM序列分析軟件包,并且各自獨立地將HMM方法推廣到用于RNA二級結(jié)構(gòu)分析的隨機上下文無關(guān)文法上。與此同時,在加州理工學(xué)院噴氣推進實驗室(JPL/caltech),由Pierre Baldi領(lǐng)導(dǎo)的另一個研究小組也受Snowbird會議成果的啟發(fā),進行著基于HMM方法的研究。
內(nèi)容概要
本書在結(jié)構(gòu)上大致可以分為四個部分,每個部分所覆蓋的問題分別是:二序列聯(lián)配、多序列聯(lián)配、系統(tǒng)發(fā)育樹和RNA結(jié)構(gòu)。具體分為:二序列聯(lián)配、Markov鏈與隱馬模型、使用HMM的二序列聯(lián)配、用于序列家族的列型HMM、多序列聯(lián)配方法、構(gòu)造系統(tǒng)發(fā)育樹和系統(tǒng)發(fā)育的概率論方法。本書介紹的列型чMM、多序列聯(lián)配方法、構(gòu)造系統(tǒng)發(fā)育樹和系統(tǒng)發(fā)育的概率論方法。本書介紹的一些方法將不同的生物信息來源整合到一般的、清晰且可操作的序列分析概率論模型中,有助于研究者深入了解生物序列分析的基礎(chǔ)。 本書可供生物信息學(xué)、分子生物學(xué)、數(shù)學(xué)、計算機科學(xué)以及物理學(xué)專業(yè)的研究生或高年級本科生及這些領(lǐng)域的老師和研究人員參考。
作者簡介
英)Durbin,R,1987年獲得博士學(xué)位,研究方向為蠕蟲神經(jīng)系統(tǒng)的發(fā)育與組織。英國Sat3ger中心生物信息部負(fù)責(zé)人,先后參與線蟲基因組和人類基因組項目、WormBase線蟲模式生物數(shù)據(jù)庫、ACEDB基因組數(shù)據(jù)庫、Pfam蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)庫以及Ensembl脊椎動物基因組注釋。
書籍目錄
譯者名單中文版序一中文版序二譯者的話前言第1章 緒論 1.1 序列的相似性、同源性及聯(lián)配 1.2 本書概述 1.3 概率與概率論模型 1.4 補充讀物第2章 二序列聯(lián)配 2.1 引言 2.2 計分模型 2.3 聯(lián)配算法 2.4 更復(fù)雜模型的動態(tài)規(guī)劃 2.5 啟發(fā)式聯(lián)配算法 2.6 線性空間聯(lián)配 2.7 分值的顯著性 2.8 從聯(lián)配數(shù)據(jù)推導(dǎo)計分參數(shù) 2.9 補充讀物第3章 Markov鏈與隱馬模型(HMM) 3.1 Markov鏈 3.2 隱馬模型 3.3 HMM的參數(shù)估計 3.4 HMM的模型結(jié)構(gòu) 3.5 更復(fù)雜的Markov鏈 3.6 HMM算法的數(shù)值穩(wěn)定性 3.7 補充讀物第4章 采用HMM的二序列聯(lián)配 4.1 索引 4.2 X和Y的對所有路徑求和的全概率 4.3 次優(yōu)聯(lián)配 4.4 Xi聯(lián)配上Yi的后驗概率 4.5 用于搜索的成對HMM與FSA之對比 4.6 補充讀物第5章 用于序列家族的列型ItMM 5.1 無空位計分矩陣 5.2 添加插入與刪除狀態(tài)以獲得列型HMM 5.3 從多序列聯(lián)配中導(dǎo)出列型HMM 5.4 基于列型HMM的搜索 5.5 用于非全局聯(lián)配的列型HMM變體 5.6 對概率估計的深入說明 5.7 最優(yōu)模型的構(gòu)建 5.8 訓(xùn)練序列的加權(quán) 5.9 補充讀物第6章 多序列聯(lián)配方法 6.1 多序列聯(lián)配的含義 6.2 為多序列聯(lián)配計分 6.3 多維動態(tài)規(guī)劃 6.4 漸進聯(lián)配方法 6.5 由列型HMM訓(xùn)練的多序列聯(lián)配 6.6 補充讀物第7章 構(gòu)造系統(tǒng)發(fā)育樹 7.1 生命之樹 7.2 樹的背景知識 7.3 用成對距離建樹 7.4 簡約法 7.5 樹的評估:自舉法 7.6 聯(lián)配與系統(tǒng)發(fā)育的同時處理 7.7 補充讀物 7.8 附錄:鄰接法定理的證明第8章 系統(tǒng)發(fā)育的概率論方法 8.1 引言 8.2 進化的概率論模型 8.3 計算無空位聯(lián)配的似然 8.4 用似然做推斷 8.5 更現(xiàn)實的進化模型 8.6 概率論方法與非概率論方法的比較 8.7 補充讀物第9章 轉(zhuǎn)換文法 9.1 轉(zhuǎn)換文法 9.2 正則文法 9.3 上下文無關(guān)文法 9.4 上下文有關(guān)文法 9.5 隨機文法 9.6 用于序列建模的隨機上下文無關(guān)文法 9.7 補充讀物第10章 RNA結(jié)構(gòu)分析 10.1 RNA 10.2 RNA二級結(jié)構(gòu)預(yù)測 10.3 協(xié)方差模型:基于SCFG的RNA列型 10.4 補充讀物第11章 概率論背景 11.1 概率分布 11.2 熵 11.3 推斷 11.4 抽樣 11.5 從計數(shù)估計概率 11.6 EM算法參考文獻(xiàn)部分術(shù)語漢英對照部分術(shù)語英漢對照索引
章節(jié)摘錄
當(dāng)巴比倫人繪制星空圖時,天文學(xué)誕生了。雖然我們的子孫一定不會認(rèn)同生物學(xué)始于當(dāng)前的基因組計劃,但是也許他們會清楚地認(rèn)識到,生物學(xué)知識的快速積累正是始于我們這個時代。如何發(fā)掘這些知識的科學(xué)意義是一件極具挑戰(zhàn)性的工作,需要進一步理解細(xì)胞和有機體的生物學(xué)。但其中的部分挑戰(zhàn)只在于對極其豐富的生物學(xué)序列數(shù)據(jù)進行組織、分類和解析。這不僅僅是一件抽象的字符串分析工作,因為隱藏存堿基或氨基酸序列背后的是整個分子生物學(xué)的復(fù)雜性。本書介紹的一些方法將不同的生物信息來源整合到一般的、清晰且可操作的序列分析概率論模型中,原則上有能力把握部分的上述復(fù)雜性。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載