出版時間:2010-4 出版社:科學(xué)出版社 作者:(俄羅斯)什穆列維奇 等編著,劉文斌,高琳 譯 頁數(shù):214 字?jǐn)?shù):317000
Tag標(biāo)簽:無
前言
近年來,各種高通量技術(shù)的出現(xiàn)極大地促進(jìn)了大規(guī)?;虮磉_(dá)的研究,人們可以同時確定成千上萬個基因的表達(dá)水平。特別是表達(dá)微陣列這種復(fù)雜的生化一光學(xué)系統(tǒng),它集成了機(jī)器點樣、計算機(jī)成像和分析等技術(shù)。由于轉(zhuǎn)錄調(diào)控是一種多變量輸人的復(fù)雜處理過程,人們迫切需要一種分析表達(dá)譜數(shù)據(jù)的工具來揭示復(fù)雜遺傳網(wǎng)絡(luò)中所發(fā)生的各種作用關(guān)系。也就是說,只有對基因組的這些信號進(jìn)行處理,才能刻畫它們的調(diào)控結(jié)果及其在遺傳水平和表觀水平所發(fā)生的變化。功能基因組學(xué)的兩個主要目的是,篩選能夠解釋特定細(xì)胞顯型(如疾病)的關(guān)鍵基因和基因組合,并在分子水平利用基因組信號進(jìn)行疾病的分類?! ∮捎谵D(zhuǎn)錄信號的傳遞及相關(guān)路徑模擬的重要作用,對結(jié)構(gòu)和功能的理解都需要信號處理的理論。基因組信號處理(GSP)是一個主要研究基因組信號處理的工程學(xué)科。人們可能會由此聯(lián)想到數(shù)字信號處理(DSP),總的來說,GSP和DSP都要應(yīng)用信號處理的某種數(shù)學(xué)方法。然而,這兩門學(xué)科的名稱沒有一個與這些數(shù)學(xué)方法有關(guān),反而是根據(jù)它們所處理的物理信號來命名的。GSP將信號處理的方法、理論應(yīng)用于功能基因組的研究,其重點是基因組的調(diào)控。因此,GSP涉及與表達(dá)譜研究相關(guān)的各種方法,如檢測、預(yù)測、分類、控制、統(tǒng)計以及基因網(wǎng)絡(luò)的動態(tài)模擬等??傊?,GSP是將工程學(xué)科中基于模型的結(jié)構(gòu)分析和合成方法引入基因組學(xué)研究的一門基礎(chǔ)學(xué)科?! ∵@一學(xué)科主要用于生物組織(切片)的分類及信號轉(zhuǎn)導(dǎo)路徑的發(fā)現(xiàn)。實現(xiàn)這些目標(biāo)需要大量信號處理的方法,其中包括轉(zhuǎn)錄信號的表示(如小波分解和隨機(jī)時間序列分解)和非線性動態(tài)系統(tǒng)的建模。以往兩個基因或細(xì)胞效應(yīng)(cellular effect)對之間的相關(guān)性分析方法已經(jīng)不適用于基因組這種多元非線性的復(fù)雜網(wǎng)絡(luò),調(diào)控模型需要各種非線性動力學(xué)的方法。而這些方法已在信號處理、控制,尤其是分布式計算機(jī)系統(tǒng)中的隨機(jī)數(shù)據(jù)流網(wǎng)絡(luò)等領(lǐng)域得到廣泛應(yīng)用。當(dāng)然,僅有這些模型系統(tǒng)還不夠。基因組學(xué)需要自己的模型系統(tǒng),而不僅僅是對現(xiàn)有模型的簡單應(yīng)用。而且,新系統(tǒng)必須能夠反映基因組內(nèi)部的運行規(guī)律及分布式調(diào)控的機(jī)理。因此,必須發(fā)展相應(yīng)的數(shù)學(xué)理論,其中包括用于治療干預(yù)的優(yōu)化理論以及近似理論,并建立一種具有合理復(fù)雜度的非線性動態(tài)模型。具體地說,一方面,從診斷和治療的角度,它能夠充分描述基因之間的調(diào)控關(guān)系;另一方面,相對于現(xiàn)有的實驗數(shù)據(jù)量或者計算機(jī)硬件的計算能力,又不過于復(fù)雜。廣義上講,GSP是一門由基因組學(xué)研究推動產(chǎn)生的學(xué)科。盡管這種概括性的描述無法反映其中所需的數(shù)學(xué)知識結(jié)構(gòu),但它還是強(qiáng)調(diào)了數(shù)學(xué)在基因組科學(xué)中的地位。實際上,這也是數(shù)學(xué)在所有科學(xué)研究中的總體地位的體現(xiàn)。隨著對科學(xué)認(rèn)知論理解的深入,我們將會逐漸體會到這一點。
內(nèi)容概要
隨著各種高通量微陣列技術(shù)的飛速發(fā)展,基于基因表達(dá)譜數(shù)據(jù)的分析已經(jīng)成為系統(tǒng)生物學(xué)研究中的一個非常重要的領(lǐng)域。基因表達(dá)譜數(shù)據(jù)的最大特點是高噪聲、高維數(shù)和小樣本,針對這種數(shù)據(jù)的特點,本書主要介紹了基因調(diào)控網(wǎng)絡(luò)的建模方法及其動態(tài)行為分析、分類器的設(shè)計及其誤差估計、數(shù)據(jù)和特征的正則化,以及聚類算法及其驗證過程等內(nèi)容。 本書主要面向具有一定數(shù)學(xué)基礎(chǔ)的生物信息學(xué)、計算生物學(xué)或系統(tǒng)生物學(xué)等領(lǐng)域的研究生或科研人員,也可以作為研究基因組學(xué)的教科書或參考書。
作者簡介
劉文斌,男,工學(xué)博士。溫州大學(xué)物理與電子信息工程學(xué)院副教授,浙江省中青年學(xué)科帶頭人。2004年在華中科技大學(xué)控制系系統(tǒng)工程專業(yè)獲博士學(xué)位,2004-2006年在華中科技大學(xué)生物醫(yī)學(xué)工程專業(yè)博士后流動站從事博士后研究。2007年在美國系統(tǒng)生物學(xué)研究所(Institute for Systems Biology)計算生物學(xué)小組做訪問學(xué)者,主要從事基因調(diào)控網(wǎng)絡(luò)的預(yù)測及干預(yù)研究。主要研究方向為計算生物學(xué)、DNA計算、數(shù)據(jù)挖掘、模式識別、智能計算等。累計在國內(nèi)外重要期刊和會議發(fā)表學(xué)術(shù)論文40余篇,主持兩項國家自然科學(xué)基金項目,一項浙江省自然科學(xué)基金項目和一項中國博士后科學(xué)基金項目(二等)。獲得省部級獎勵兩項,廳級獎勵兩項?! 「吡?,女,工學(xué)博士,西安電子科技大學(xué)計算機(jī)學(xué)院教授,學(xué)術(shù)帶頭人,博士生導(dǎo)師。在西安交通大學(xué)計算數(shù)學(xué)專業(yè)獲理學(xué)學(xué)士學(xué)位,在西北大學(xué)計算數(shù)學(xué)專業(yè)獲理學(xué)碩士學(xué)位,在西安電子科技大學(xué)電路與系統(tǒng)專業(yè)獲工學(xué)博士學(xué)位。1990~1994年在西電公司計算技術(shù)應(yīng)用研究所從事有限元工程算法設(shè)計、計算與分析等研究與應(yīng)用工作。1994年10月調(diào)入西安電子科技大學(xué)從事教學(xué)和科研工作至今。2004~2005年被國家留學(xué)基金委選派赴加拿大Guelph大學(xué)做訪問學(xué)者。在科研方面,主持國家自然科學(xué)基金重點項目一項、面上項目兩項,教育部博士點學(xué)科基金,國家留學(xué)回國人員基金及多項省部級項目。參與了多項國家自然科學(xué)基金、國防科技預(yù)先研究基金等科研項目,成果獲省部級獎勵兩項,廳局級獎勵兩項。在教學(xué)方面,榮獲?!坝佬隆?、“貝爾”、“華為”等獎教金,獲西安電子科技大學(xué)“十佳師德標(biāo)兵”稱號、“陜西省師德標(biāo)兵”稱號。近年來的主要研究方向為計算生物信息學(xué)、數(shù)據(jù)挖掘、圖論與組合優(yōu)化算法及應(yīng)用等,累計在國內(nèi)外核心期刊和國際會議發(fā)表學(xué)術(shù)論文60余篇。
書籍目錄
譯者序前言第1章 生物基礎(chǔ) 1.1 遺傳學(xué) 1.1.1 核酸結(jié)構(gòu) 1.1.2 基因 1.1.3 RNA 1.1.4 轉(zhuǎn)錄 1.1.5 蛋白質(zhì) 1.1.6 翻譯 1.1.7 轉(zhuǎn)錄調(diào)控 1.2 基因組學(xué) 1.2.1 微陣列技術(shù) 1.3 蛋白質(zhì)組學(xué)第2章 基因網(wǎng)絡(luò)的確定性模型 2.1 圖模型 2.2 布爾網(wǎng)絡(luò) 2.2.1 細(xì)胞分化和細(xì)胞的功能狀態(tài) 2.2.2 網(wǎng)絡(luò)特性及動態(tài)行為 2.2.3 網(wǎng)絡(luò)推理 2.3 布爾網(wǎng)絡(luò)的推廣 2.3.1 異步 2.3.2 多值網(wǎng)絡(luò) 2.4 微分方程模型 2.4.1 有轉(zhuǎn)錄和翻譯過程的微分方程模型 2.4.2 連續(xù)微分方程模型的離散化第3章 基因網(wǎng)絡(luò)的隨機(jī)模型 3.1 貝葉斯網(wǎng)絡(luò) 3.2 概率布爾網(wǎng)絡(luò) 3.2.1 定義 3.2.2 推理 3.2.3 PBN的動力學(xué) 3.2.4 暫態(tài)隨機(jī)PBN的穩(wěn)態(tài)分析 3.2.5 PBN與貝葉斯網(wǎng)絡(luò)的關(guān)系 3.2.6 基于種子基因的子網(wǎng)絡(luò)的生長 3.3 干預(yù) 3.3.1 基因干預(yù) 3.3.2 結(jié)構(gòu)干預(yù) 3.3.3 外部控制第4章 分類 4.1 貝葉斯分類器 4.2 分類規(guī)則 4.2.1 一致分類器設(shè)計 4.2.2 分類規(guī)則實例 4.3 有約束的分類器 4.3.1 分散系數(shù) 4.3.2 VC維數(shù) 4.4 線性分類 4.4.1 Rosenblatt感知器 4.4.2 線性及二次判別分析 4.4.3 基于最小二乘誤差的線性判別式 4.4.4 支持向量機(jī) 4.4.5 線性判別式的設(shè)計誤差的表示 4.4.6 基于樣本QDA判別式的分布 4.5 神經(jīng)網(wǎng)絡(luò)分類器 4.6 分類樹 4.6.1 分類與回歸樹 4.6.2 基于數(shù)據(jù)劃分的強(qiáng)一致規(guī)則 4.7 誤差估計 4.7.1 重代人法 4.7.2 交叉驗證 4.7.3 自舉法 4.7.4 支撐 4.7.5 誤差估計器性能 4.7.6 特征集排序 4.8 誤差校正 4.9 魯棒分類器 4.9.1 最優(yōu)魯棒分類器 4.9.2 魯棒分類器的性能比較第5章 正則化 5.1 數(shù)據(jù)正則化 5.1.1 正則化判別分析 5.1.2 噪聲注入 5.2 復(fù)雜度正則化 5.2.1 誤差正則化 5.2.2 結(jié)構(gòu)風(fēng)險最小化 5.2.3 經(jīng)驗復(fù)雜度 5.3 特征選擇 5.3.1 峰值現(xiàn)象 5.3.2 特征選擇算法 5.3.3 誤差估計對特征選擇的影響 5.3.4 冗余 5.3.5 并行增量特征選擇 5.3.6 貝葉斯變量選擇 5.4 特征提取第6章 聚類 6.1 聚類算法的實例 6.1.1 歐氏距離聚類 6.1.2 自組織映射 6.1.3 分層聚類 6.1.4 基于模型的聚類算子 6.2 聚類算子 6.2.1 算法結(jié)構(gòu) 6.2.2 標(biāo)記算子 6.2.3 貝葉斯聚類器 6.2.4 聚類算子的分布測試 6.3 聚類的驗證 6.3.1 外部驗證 6.3.2 內(nèi)部驗證 6.3.3 不穩(wěn)定指數(shù) 6.3.4 貝葉斯因子 6.4 聚類算子學(xué)習(xí) 6.4.1 經(jīng)驗誤差聚類算子 6.4.2 最近鄰聚類規(guī)則索引
章節(jié)摘錄
所有細(xì)胞都含有相同的DNA,那么,如何區(qū)分肝細(xì)胞和白細(xì)胞?細(xì)胞的特性(包括結(jié)構(gòu)和活性)由其中的基因活動(特別是表達(dá)蛋白)決定。這說明一定有一種內(nèi)部、外部或者二者都有的調(diào)控機(jī)制,可以控制與細(xì)胞類型或者功能狀態(tài)有關(guān)的蛋白質(zhì)的表達(dá)?;虻恼{(diào)控過程極其復(fù)雜,尤其是在真核生物中?! ∠旅嬉约?xì)菌為例,說明蛋白質(zhì)對于細(xì)胞適應(yīng)環(huán)境變化的重要性。糖的代謝過程中有大量的酶參與,糖的種類有多種,如乳糖、葡萄糖、半乳糖等,都可以作為細(xì)菌能量的來源。由于糖的種類不同,其分解所需的酶也不同。一種可能的方法是在細(xì)胞中保存所需的各種酶,以便應(yīng)對出現(xiàn)的各種糖。顯然,這種方式將造成很大的浪費且效率不高,而且合成這些酶需消耗很多能量,其中有很多酶并不需要。因此,細(xì)菌采取的方式是激活所需酶的基因,同時休眠或抑制那些不需要的酶的基因。這樣,就可以根據(jù)不同的環(huán)境狀況來激活或抑制這些基因?! ∥覀円呀?jīng)討論了轉(zhuǎn)錄啟動所需的機(jī)制:RNA聚合酶必須結(jié)合到基因的啟動子上。然而,還有其他的一些DNA結(jié)合蛋白能夠決定轉(zhuǎn)錄是否開始。例如,在原核生物中,有一種稱為激活子(activator)或阻遏子(repressor)的調(diào)控蛋白,可以識別啟動子附近的一些位點。激活蛋白必須結(jié)合作用位點才能啟動轉(zhuǎn)錄;阻遏蛋白則相反,它不結(jié)合目標(biāo)位點時才能啟動轉(zhuǎn)錄,否則,轉(zhuǎn)錄將被阻塞。激活蛋白和阻遏蛋白改變基因轉(zhuǎn)錄的一種方式是與RNA聚合酶相互作用:阻遏蛋白的結(jié)合可以干擾RNA聚合酶結(jié)合DNA,而激活蛋白的結(jié)合則可以促進(jìn)RNA聚合酶結(jié)合DNA。 既然調(diào)控蛋白的結(jié)合能夠決定基因轉(zhuǎn)錄是否發(fā)生,那么,是什么決定這種蛋白質(zhì)能夠結(jié)合到目標(biāo)位點?大多數(shù)情況下,它由蛋白質(zhì)的DNA結(jié)合域(可以直接結(jié)合特定DNA序列的區(qū)域)和蛋白質(zhì)的變構(gòu)位點(allosteric site)[一種稱為變構(gòu)效應(yīng)因子(allosteric effector)的小分子可以結(jié)合并引起構(gòu)型變化的位點]之間的相互作用決定。當(dāng)變構(gòu)效應(yīng)因子結(jié)合到調(diào)控蛋白的變構(gòu)位點,DNA結(jié)合域?qū)l(fā)生變化從而改變蛋白質(zhì)結(jié)合目標(biāo)位點的能力,并最終決定轉(zhuǎn)錄是否發(fā)生。例如,對于激活子,變構(gòu)效應(yīng)因子的出現(xiàn)可能使得調(diào)控蛋白能夠結(jié)合到DNA上;另外,阻遏子則必須在沒有變構(gòu)效應(yīng)因子的情況下才能阻止轉(zhuǎn)錄的發(fā)生。例如,在大腸桿菌的乳糖(1actose)代謝中,當(dāng)乳糖(變構(gòu)效應(yīng)因子)結(jié)合到它的阻遏子時,該阻遏子就會失去結(jié)合到目標(biāo)位點的能力并從DNA上脫落下來。這樣,附近的RNA聚合酶就能夠結(jié)合到DNA上編碼某個乳糖代謝所需的酶的基因附近(圖1.10)。
編輯推薦
本書專門探討基因表達(dá)譜數(shù)據(jù)處理涉及的建模、分類及聚類的基本方法和理論。作者將生物網(wǎng)絡(luò)的進(jìn)化、細(xì)胞的功能狀態(tài)等生物學(xué)概念與基因調(diào)控網(wǎng)絡(luò)的動態(tài)行為有機(jī)地結(jié)合在一起,揭示了這些抽象數(shù)學(xué)概念所代表的實際生物學(xué)意義。并對PBN這種新的概率模型,作者采取例子驅(qū)動的方式,逐步介紹有關(guān)的概念、動態(tài)行為分析及干預(yù)過程,非常淺顯易懂。作者還從算子的角度將分類和聚類統(tǒng)一起來,詳細(xì)討論了二者涉及的算子的設(shè)計、誤差估計及魯棒性。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載