基因組信號(hào)處理

出版時(shí)間:2010-4  出版社:科學(xué)出版社  作者:(俄羅斯)什穆列維奇 等編著,劉文斌,高琳 譯  頁(yè)數(shù):214  字?jǐn)?shù):317000  
Tag標(biāo)簽:無(wú)  

前言

  近年來(lái),各種高通量技術(shù)的出現(xiàn)極大地促進(jìn)了大規(guī)?;虮磉_(dá)的研究,人們可以同時(shí)確定成千上萬(wàn)個(gè)基因的表達(dá)水平。特別是表達(dá)微陣列這種復(fù)雜的生化一光學(xué)系統(tǒng),它集成了機(jī)器點(diǎn)樣、計(jì)算機(jī)成像和分析等技術(shù)。由于轉(zhuǎn)錄調(diào)控是一種多變量輸人的復(fù)雜處理過(guò)程,人們迫切需要一種分析表達(dá)譜數(shù)據(jù)的工具來(lái)揭示復(fù)雜遺傳網(wǎng)絡(luò)中所發(fā)生的各種作用關(guān)系。也就是說(shuō),只有對(duì)基因組的這些信號(hào)進(jìn)行處理,才能刻畫(huà)它們的調(diào)控結(jié)果及其在遺傳水平和表觀水平所發(fā)生的變化。功能基因組學(xué)的兩個(gè)主要目的是,篩選能夠解釋特定細(xì)胞顯型(如疾?。┑年P(guān)鍵基因和基因組合,并在分子水平利用基因組信號(hào)進(jìn)行疾病的分類(lèi)?! ∮捎谵D(zhuǎn)錄信號(hào)的傳遞及相關(guān)路徑模擬的重要作用,對(duì)結(jié)構(gòu)和功能的理解都需要信號(hào)處理的理論?;蚪M信號(hào)處理(GSP)是一個(gè)主要研究基因組信號(hào)處理的工程學(xué)科。人們可能會(huì)由此聯(lián)想到數(shù)字信號(hào)處理(DSP),總的來(lái)說(shuō),GSP和DSP都要應(yīng)用信號(hào)處理的某種數(shù)學(xué)方法。然而,這兩門(mén)學(xué)科的名稱(chēng)沒(méi)有一個(gè)與這些數(shù)學(xué)方法有關(guān),反而是根據(jù)它們所處理的物理信號(hào)來(lái)命名的。GSP將信號(hào)處理的方法、理論應(yīng)用于功能基因組的研究,其重點(diǎn)是基因組的調(diào)控。因此,GSP涉及與表達(dá)譜研究相關(guān)的各種方法,如檢測(cè)、預(yù)測(cè)、分類(lèi)、控制、統(tǒng)計(jì)以及基因網(wǎng)絡(luò)的動(dòng)態(tài)模擬等??傊?,GSP是將工程學(xué)科中基于模型的結(jié)構(gòu)分析和合成方法引入基因組學(xué)研究的一門(mén)基礎(chǔ)學(xué)科?! ∵@一學(xué)科主要用于生物組織(切片)的分類(lèi)及信號(hào)轉(zhuǎn)導(dǎo)路徑的發(fā)現(xiàn)。實(shí)現(xiàn)這些目標(biāo)需要大量信號(hào)處理的方法,其中包括轉(zhuǎn)錄信號(hào)的表示(如小波分解和隨機(jī)時(shí)間序列分解)和非線性動(dòng)態(tài)系統(tǒng)的建模。以往兩個(gè)基因或細(xì)胞效應(yīng)(cellular effect)對(duì)之間的相關(guān)性分析方法已經(jīng)不適用于基因組這種多元非線性的復(fù)雜網(wǎng)絡(luò),調(diào)控模型需要各種非線性動(dòng)力學(xué)的方法。而這些方法已在信號(hào)處理、控制,尤其是分布式計(jì)算機(jī)系統(tǒng)中的隨機(jī)數(shù)據(jù)流網(wǎng)絡(luò)等領(lǐng)域得到廣泛應(yīng)用。當(dāng)然,僅有這些模型系統(tǒng)還不夠?;蚪M學(xué)需要自己的模型系統(tǒng),而不僅僅是對(duì)現(xiàn)有模型的簡(jiǎn)單應(yīng)用。而且,新系統(tǒng)必須能夠反映基因組內(nèi)部的運(yùn)行規(guī)律及分布式調(diào)控的機(jī)理。因此,必須發(fā)展相應(yīng)的數(shù)學(xué)理論,其中包括用于治療干預(yù)的優(yōu)化理論以及近似理論,并建立一種具有合理復(fù)雜度的非線性動(dòng)態(tài)模型。具體地說(shuō),一方面,從診斷和治療的角度,它能夠充分描述基因之間的調(diào)控關(guān)系;另一方面,相對(duì)于現(xiàn)有的實(shí)驗(yàn)數(shù)據(jù)量或者計(jì)算機(jī)硬件的計(jì)算能力,又不過(guò)于復(fù)雜。廣義上講,GSP是一門(mén)由基因組學(xué)研究推動(dòng)產(chǎn)生的學(xué)科。盡管這種概括性的描述無(wú)法反映其中所需的數(shù)學(xué)知識(shí)結(jié)構(gòu),但它還是強(qiáng)調(diào)了數(shù)學(xué)在基因組科學(xué)中的地位。實(shí)際上,這也是數(shù)學(xué)在所有科學(xué)研究中的總體地位的體現(xiàn)。隨著對(duì)科學(xué)認(rèn)知論理解的深入,我們將會(huì)逐漸體會(huì)到這一點(diǎn)。

內(nèi)容概要

隨著各種高通量微陣列技術(shù)的飛速發(fā)展,基于基因表達(dá)譜數(shù)據(jù)的分析已經(jīng)成為系統(tǒng)生物學(xué)研究中的一個(gè)非常重要的領(lǐng)域?;虮磉_(dá)譜數(shù)據(jù)的最大特點(diǎn)是高噪聲、高維數(shù)和小樣本,針對(duì)這種數(shù)據(jù)的特點(diǎn),本書(shū)主要介紹了基因調(diào)控網(wǎng)絡(luò)的建模方法及其動(dòng)態(tài)行為分析、分類(lèi)器的設(shè)計(jì)及其誤差估計(jì)、數(shù)據(jù)和特征的正則化,以及聚類(lèi)算法及其驗(yàn)證過(guò)程等內(nèi)容。    本書(shū)主要面向具有一定數(shù)學(xué)基礎(chǔ)的生物信息學(xué)、計(jì)算生物學(xué)或系統(tǒng)生物學(xué)等領(lǐng)域的研究生或科研人員,也可以作為研究基因組學(xué)的教科書(shū)或參考書(shū)。

作者簡(jiǎn)介

  劉文斌,男,工學(xué)博士。溫州大學(xué)物理與電子信息工程學(xué)院副教授,浙江省中青年學(xué)科帶頭人。2004年在華中科技大學(xué)控制系系統(tǒng)工程專(zhuān)業(yè)獲博士學(xué)位,2004-2006年在華中科技大學(xué)生物醫(yī)學(xué)工程專(zhuān)業(yè)博士后流動(dòng)站從事博士后研究。2007年在美國(guó)系統(tǒng)生物學(xué)研究所(Institute for Systems Biology)計(jì)算生物學(xué)小組做訪問(wèn)學(xué)者,主要從事基因調(diào)控網(wǎng)絡(luò)的預(yù)測(cè)及干預(yù)研究。主要研究方向?yàn)橛?jì)算生物學(xué)、DNA計(jì)算、數(shù)據(jù)挖掘、模式識(shí)別、智能計(jì)算等。累計(jì)在國(guó)內(nèi)外重要期刊和會(huì)議發(fā)表學(xué)術(shù)論文40余篇,主持兩項(xiàng)國(guó)家自然科學(xué)基金項(xiàng)目,一項(xiàng)浙江省自然科學(xué)基金項(xiàng)目和一項(xiàng)中國(guó)博士后科學(xué)基金項(xiàng)目(二等)。獲得省部級(jí)獎(jiǎng)勵(lì)兩項(xiàng),廳級(jí)獎(jiǎng)勵(lì)兩項(xiàng)。  高琳,女,工學(xué)博士,西安電子科技大學(xué)計(jì)算機(jī)學(xué)院教授,學(xué)術(shù)帶頭人,博士生導(dǎo)師。在西安交通大學(xué)計(jì)算數(shù)學(xué)專(zhuān)業(yè)獲理學(xué)學(xué)士學(xué)位,在西北大學(xué)計(jì)算數(shù)學(xué)專(zhuān)業(yè)獲理學(xué)碩士學(xué)位,在西安電子科技大學(xué)電路與系統(tǒng)專(zhuān)業(yè)獲工學(xué)博士學(xué)位。1990~1994年在西電公司計(jì)算技術(shù)應(yīng)用研究所從事有限元工程算法設(shè)計(jì)、計(jì)算與分析等研究與應(yīng)用工作。1994年10月調(diào)入西安電子科技大學(xué)從事教學(xué)和科研工作至今。2004~2005年被國(guó)家留學(xué)基金委選派赴加拿大Guelph大學(xué)做訪問(wèn)學(xué)者。在科研方面,主持國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目一項(xiàng)、面上項(xiàng)目?jī)身?xiàng),教育部博士點(diǎn)學(xué)科基金,國(guó)家留學(xué)回國(guó)人員基金及多項(xiàng)省部級(jí)項(xiàng)目。參與了多項(xiàng)國(guó)家自然科學(xué)基金、國(guó)防科技預(yù)先研究基金等科研項(xiàng)目,成果獲省部級(jí)獎(jiǎng)勵(lì)兩項(xiàng),廳局級(jí)獎(jiǎng)勵(lì)兩項(xiàng)。在教學(xué)方面,榮獲校“永新”、“貝爾”、“華為”等獎(jiǎng)教金,獲西安電子科技大學(xué)“十佳師德標(biāo)兵”稱(chēng)號(hào)、“陜西省師德標(biāo)兵”稱(chēng)號(hào)。近年來(lái)的主要研究方向?yàn)橛?jì)算生物信息學(xué)、數(shù)據(jù)挖掘、圖論與組合優(yōu)化算法及應(yīng)用等,累計(jì)在國(guó)內(nèi)外核心期刊和國(guó)際會(huì)議發(fā)表學(xué)術(shù)論文60余篇。

書(shū)籍目錄

譯者序前言第1章  生物基礎(chǔ)  1.1  遺傳學(xué)    1.1.1  核酸結(jié)構(gòu)    1.1.2  基因    1.1.3  RNA    1.1.4  轉(zhuǎn)錄    1.1.5  蛋白質(zhì)    1.1.6  翻譯    1.1.7  轉(zhuǎn)錄調(diào)控  1.2  基因組學(xué)    1.2.1  微陣列技術(shù)  1.3  蛋白質(zhì)組學(xué)第2章  基因網(wǎng)絡(luò)的確定性模型  2.1  圖模型  2.2  布爾網(wǎng)絡(luò)    2.2.1  細(xì)胞分化和細(xì)胞的功能狀態(tài)    2.2.2  網(wǎng)絡(luò)特性及動(dòng)態(tài)行為    2.2.3  網(wǎng)絡(luò)推理  2.3  布爾網(wǎng)絡(luò)的推廣    2.3.1  異步    2.3.2  多值網(wǎng)絡(luò)  2.4  微分方程模型    2.4.1  有轉(zhuǎn)錄和翻譯過(guò)程的微分方程模型    2.4.2  連續(xù)微分方程模型的離散化第3章  基因網(wǎng)絡(luò)的隨機(jī)模型  3.1  貝葉斯網(wǎng)絡(luò)  3.2  概率布爾網(wǎng)絡(luò)    3.2.1  定義    3.2.2  推理    3.2.3  PBN的動(dòng)力學(xué)    3.2.4  暫態(tài)隨機(jī)PBN的穩(wěn)態(tài)分析    3.2.5  PBN與貝葉斯網(wǎng)絡(luò)的關(guān)系    3.2.6  基于種子基因的子網(wǎng)絡(luò)的生長(zhǎng)  3.3  干預(yù)    3.3.1  基因干預(yù)    3.3.2  結(jié)構(gòu)干預(yù)    3.3.3  外部控制第4章  分類(lèi)  4.1  貝葉斯分類(lèi)器  4.2  分類(lèi)規(guī)則    4.2.1  一致分類(lèi)器設(shè)計(jì)    4.2.2  分類(lèi)規(guī)則實(shí)例  4.3  有約束的分類(lèi)器    4.3.1  分散系數(shù)    4.3.2  VC維數(shù)  4.4  線性分類(lèi)    4.4.1  Rosenblatt感知器    4.4.2  線性及二次判別分析    4.4.3  基于最小二乘誤差的線性判別式    4.4.4  支持向量機(jī)    4.4.5  線性判別式的設(shè)計(jì)誤差的表示    4.4.6  基于樣本QDA判別式的分布  4.5  神經(jīng)網(wǎng)絡(luò)分類(lèi)器  4.6  分類(lèi)樹(shù)    4.6.1  分類(lèi)與回歸樹(shù)    4.6.2  基于數(shù)據(jù)劃分的強(qiáng)一致規(guī)則  4.7  誤差估計(jì)    4.7.1  重代人法    4.7.2  交叉驗(yàn)證    4.7.3  自舉法    4.7.4  支撐    4.7.5  誤差估計(jì)器性能    4.7.6  特征集排序  4.8  誤差校正  4.9  魯棒分類(lèi)器    4.9.1  最優(yōu)魯棒分類(lèi)器    4.9.2  魯棒分類(lèi)器的性能比較第5章  正則化  5.1  數(shù)據(jù)正則化    5.1.1  正則化判別分析    5.1.2  噪聲注入  5.2  復(fù)雜度正則化    5.2.1  誤差正則化    5.2.2  結(jié)構(gòu)風(fēng)險(xiǎn)最小化    5.2.3  經(jīng)驗(yàn)復(fù)雜度  5.3  特征選擇    5.3.1  峰值現(xiàn)象    5.3.2  特征選擇算法    5.3.3  誤差估計(jì)對(duì)特征選擇的影響    5.3.4  冗余    5.3.5  并行增量特征選擇    5.3.6  貝葉斯變量選擇  5.4  特征提取第6章  聚類(lèi)  6.1  聚類(lèi)算法的實(shí)例    6.1.1  歐氏距離聚類(lèi)    6.1.2  自組織映射    6.1.3  分層聚類(lèi)    6.1.4  基于模型的聚類(lèi)算子  6.2  聚類(lèi)算子    6.2.1  算法結(jié)構(gòu)    6.2.2  標(biāo)記算子    6.2.3  貝葉斯聚類(lèi)器    6.2.4  聚類(lèi)算子的分布測(cè)試  6.3  聚類(lèi)的驗(yàn)證    6.3.1  外部驗(yàn)證    6.3.2  內(nèi)部驗(yàn)證    6.3.3  不穩(wěn)定指數(shù)    6.3.4  貝葉斯因子  6.4  聚類(lèi)算子學(xué)習(xí)    6.4.1  經(jīng)驗(yàn)誤差聚類(lèi)算子    6.4.2  最近鄰聚類(lèi)規(guī)則索引

章節(jié)摘錄

  所有細(xì)胞都含有相同的DNA,那么,如何區(qū)分肝細(xì)胞和白細(xì)胞?細(xì)胞的特性(包括結(jié)構(gòu)和活性)由其中的基因活動(dòng)(特別是表達(dá)蛋白)決定。這說(shuō)明一定有一種內(nèi)部、外部或者二者都有的調(diào)控機(jī)制,可以控制與細(xì)胞類(lèi)型或者功能狀態(tài)有關(guān)的蛋白質(zhì)的表達(dá)?;虻恼{(diào)控過(guò)程極其復(fù)雜,尤其是在真核生物中?! ∠旅嬉约?xì)菌為例,說(shuō)明蛋白質(zhì)對(duì)于細(xì)胞適應(yīng)環(huán)境變化的重要性。糖的代謝過(guò)程中有大量的酶參與,糖的種類(lèi)有多種,如乳糖、葡萄糖、半乳糖等,都可以作為細(xì)菌能量的來(lái)源。由于糖的種類(lèi)不同,其分解所需的酶也不同。一種可能的方法是在細(xì)胞中保存所需的各種酶,以便應(yīng)對(duì)出現(xiàn)的各種糖。顯然,這種方式將造成很大的浪費(fèi)且效率不高,而且合成這些酶需消耗很多能量,其中有很多酶并不需要。因此,細(xì)菌采取的方式是激活所需酶的基因,同時(shí)休眠或抑制那些不需要的酶的基因。這樣,就可以根據(jù)不同的環(huán)境狀況來(lái)激活或抑制這些基因?! ∥覀円呀?jīng)討論了轉(zhuǎn)錄啟動(dòng)所需的機(jī)制:RNA聚合酶必須結(jié)合到基因的啟動(dòng)子上。然而,還有其他的一些DNA結(jié)合蛋白能夠決定轉(zhuǎn)錄是否開(kāi)始。例如,在原核生物中,有一種稱(chēng)為激活子(activator)或阻遏子(repressor)的調(diào)控蛋白,可以識(shí)別啟動(dòng)子附近的一些位點(diǎn)。激活蛋白必須結(jié)合作用位點(diǎn)才能啟動(dòng)轉(zhuǎn)錄;阻遏蛋白則相反,它不結(jié)合目標(biāo)位點(diǎn)時(shí)才能啟動(dòng)轉(zhuǎn)錄,否則,轉(zhuǎn)錄將被阻塞。激活蛋白和阻遏蛋白改變基因轉(zhuǎn)錄的一種方式是與RNA聚合酶相互作用:阻遏蛋白的結(jié)合可以干擾RNA聚合酶結(jié)合DNA,而激活蛋白的結(jié)合則可以促進(jìn)RNA聚合酶結(jié)合DNA?! 〖热徽{(diào)控蛋白的結(jié)合能夠決定基因轉(zhuǎn)錄是否發(fā)生,那么,是什么決定這種蛋白質(zhì)能夠結(jié)合到目標(biāo)位點(diǎn)?大多數(shù)情況下,它由蛋白質(zhì)的DNA結(jié)合域(可以直接結(jié)合特定DNA序列的區(qū)域)和蛋白質(zhì)的變構(gòu)位點(diǎn)(allosteric site)[一種稱(chēng)為變構(gòu)效應(yīng)因子(allosteric effector)的小分子可以結(jié)合并引起構(gòu)型變化的位點(diǎn)]之間的相互作用決定。當(dāng)變構(gòu)效應(yīng)因子結(jié)合到調(diào)控蛋白的變構(gòu)位點(diǎn),DNA結(jié)合域?qū)l(fā)生變化從而改變蛋白質(zhì)結(jié)合目標(biāo)位點(diǎn)的能力,并最終決定轉(zhuǎn)錄是否發(fā)生。例如,對(duì)于激活子,變構(gòu)效應(yīng)因子的出現(xiàn)可能使得調(diào)控蛋白能夠結(jié)合到DNA上;另外,阻遏子則必須在沒(méi)有變構(gòu)效應(yīng)因子的情況下才能阻止轉(zhuǎn)錄的發(fā)生。例如,在大腸桿菌的乳糖(1actose)代謝中,當(dāng)乳糖(變構(gòu)效應(yīng)因子)結(jié)合到它的阻遏子時(shí),該阻遏子就會(huì)失去結(jié)合到目標(biāo)位點(diǎn)的能力并從DNA上脫落下來(lái)。這樣,附近的RNA聚合酶就能夠結(jié)合到DNA上編碼某個(gè)乳糖代謝所需的酶的基因附近(圖1.10)。

編輯推薦

  本書(shū)專(zhuān)門(mén)探討基因表達(dá)譜數(shù)據(jù)處理涉及的建模、分類(lèi)及聚類(lèi)的基本方法和理論。作者將生物網(wǎng)絡(luò)的進(jìn)化、細(xì)胞的功能狀態(tài)等生物學(xué)概念與基因調(diào)控網(wǎng)絡(luò)的動(dòng)態(tài)行為有機(jī)地結(jié)合在一起,揭示了這些抽象數(shù)學(xué)概念所代表的實(shí)際生物學(xué)意義。并對(duì)PBN這種新的概率模型,作者采取例子驅(qū)動(dòng)的方式,逐步介紹有關(guān)的概念、動(dòng)態(tài)行為分析及干預(yù)過(guò)程,非常淺顯易懂。作者還從算子的角度將分類(lèi)和聚類(lèi)統(tǒng)一起來(lái),詳細(xì)討論了二者涉及的算子的設(shè)計(jì)、誤差估計(jì)及魯棒性。

圖書(shū)封面

圖書(shū)標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    基因組信號(hào)處理 PDF格式下載


用戶(hù)評(píng)論 (總計(jì)0條)

 
 

 

250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7