蛋白質(zhì)結(jié)構(gòu)預(yù)測

出版時間:2008-9  出版社:科學出版社  作者:孫向東 等編著  頁數(shù):199  字數(shù):251000  

前言

  蛋白質(zhì)由氨基酸殘基線性序列構(gòu)成,折疊成特定的空間構(gòu)象后,蛋白質(zhì)就具有相應(yīng)生物學活性和功能。了解氨基酸殘基序列與其空間結(jié)構(gòu)的關(guān)系,是全面認識蛋白質(zhì)結(jié)構(gòu)和其生物學功能的關(guān)系的重要前提。近些年來,蛋白質(zhì)序列數(shù)據(jù)庫的數(shù)據(jù)積累速度非常快,與之相比,蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫的數(shù)據(jù)積累速度遠不及序列數(shù)據(jù)庫的數(shù)據(jù)積累速度。盡管蛋白質(zhì)結(jié)構(gòu)測定技術(shù)有了較為顯著的進展,但是通過實驗方法確定蛋白質(zhì)結(jié)構(gòu)的過程仍然非常復雜,實驗周期很長。  另外,隨著DNA測序技術(shù)的發(fā)展,人類基因組及很多模式生物基因組已經(jīng)或?qū)⒁耆珳y序,DNA序列數(shù)量將會急增。由于DNA序列分析技術(shù)和基因識別方法的進步,人們可以從DNA序列直接推導出大量的蛋白質(zhì)序列,這將導致蛋白質(zhì)序列數(shù)據(jù)數(shù)量急劇增加。了解了這些序列的結(jié)構(gòu),可以使它們直接為人類服務(wù)?! “被釟埢蛄械慕Y(jié)構(gòu)分析是對生物學家的極大挑戰(zhàn)。20世紀60年代后期,Anfinsen首先發(fā)現(xiàn)去折疊蛋白或者說變性蛋白質(zhì)在允許重新折疊的實驗條件下可以重新折疊到原來的結(jié)構(gòu),這種天然結(jié)構(gòu)對于蛋白質(zhì)行使生物功能具有重要作用,蛋白質(zhì)只有在折疊成其天然結(jié)構(gòu)的時候才能具有完全的生物活性。因此Anfinsen提出了蛋白質(zhì)折疊信息隱含在蛋白質(zhì)N——NN構(gòu)中的觀點。以這種觀點為基礎(chǔ),通過對蛋白質(zhì)一級結(jié)構(gòu)的研究,發(fā)現(xiàn)其折疊密碼后,僅通過一級結(jié)構(gòu)信息就能預(yù)測蛋白質(zhì)空間結(jié)構(gòu)?! 〉鞍踪|(zhì)結(jié)構(gòu)預(yù)測主要有兩大類方法。一類是蛋白質(zhì)分子特性理論分析方法或從頭算方法,通過理論計算(如分子力學、分子動力學計算)進行結(jié)構(gòu)預(yù)測。該類方法假設(shè)折疊后的蛋白質(zhì)取能量最低的構(gòu)象。從原則上來說,人們可以根據(jù)物理、化學原理,通過計算來進行結(jié)構(gòu)預(yù)測。另一類蛋白質(zhì)結(jié)構(gòu)預(yù)測的方法是統(tǒng)計學方法。該類方法對已知結(jié)構(gòu)的蛋白質(zhì)進行統(tǒng)計分析、建立序列到結(jié)構(gòu)的映射模型、進而根路映射模型對未知結(jié)構(gòu)的蛋白質(zhì)直接從氨基酸序列預(yù)測結(jié)構(gòu)。這是進行蛋白質(zhì)結(jié)陶預(yù)測較為成功的一類方法。這類方法包括經(jīng)驗性方法、結(jié)構(gòu)規(guī)律提取方法、同源漠型化方法等。統(tǒng)計學方法本身就是不確定性方法,目前雖然還不能完全替代第一類方法而成為預(yù)測蛋白質(zhì)結(jié)構(gòu)的主要方法,但是發(fā)展前景很廣闊。其中以統(tǒng)計學習哩論為基礎(chǔ)的支持向量機預(yù)測蛋白質(zhì)結(jié)構(gòu)的方法發(fā)展非常迅速?! 〗y(tǒng)計學習理論是在20世紀90年代逐漸成熟的機器學習理論,以這種理論為基礎(chǔ)的支持向量機與以往的學習機器相比具有支持小樣本、不會陷入局部勢井、具有很好的魯棒性以及運算成本低等優(yōu)勢。

內(nèi)容概要

統(tǒng)計學習理論是20世紀90年代逐漸成熟的機器學習理論,以這種理論為基礎(chǔ)的支持向量機與以往的學習機器相比具有支持小樣本、不會陷入局部勢井、魯棒性好以及運算成本低等優(yōu)勢。實現(xiàn)這種理論的支持向量機算法已經(jīng)成為機器學習和知識挖掘的標準工具?! ∽詮?001年支持向量機被首次用于蛋白質(zhì)二級結(jié)構(gòu)的預(yù)測以來,這種算法發(fā)展到蛋白質(zhì)的結(jié)構(gòu)類型、亞細胞結(jié)構(gòu)和膜蛋白的結(jié)構(gòu)等領(lǐng)域的預(yù)測中。本書詳細介紹了依據(jù)統(tǒng)計學習理論構(gòu)建支持向量機的方法、各種相關(guān)軟件原理和使用方法,并以二級結(jié)構(gòu)和結(jié)構(gòu)域為例介紹了以支持向量機為工具預(yù)測蛋白質(zhì)結(jié)構(gòu)的方法。書中使用了大量的原創(chuàng)性實驗結(jié)果,理論聯(lián)系實際,詳細闡述了以支持向量機為工具預(yù)測蛋白質(zhì)結(jié)構(gòu)的全過程?! ”緯m合從事蛋白質(zhì)結(jié)構(gòu)基礎(chǔ)研究的學生和科技工作者閱讀。

書籍目錄

前言第1章 蛋白質(zhì)結(jié)構(gòu)預(yù)測概述    1.1 蛋白質(zhì)預(yù)測基本方法簡介    1.2 蛋白質(zhì)二級結(jié)構(gòu)和結(jié)構(gòu)域預(yù)測方法簡介第2章 相關(guān)知識背景  2.1 生物信息學    2.1.1  生物信息學的定義、目的、內(nèi)容和發(fā)展趨勢    2.1.2 基因組學    2.1.3 蛋白質(zhì)組學    2.1.4 數(shù)據(jù)庫 2.2 蛋白質(zhì)序列、結(jié)構(gòu)與功能的關(guān)系 2.3 機器學習    2.3.1 機器學習的定義和特點    2.3.2 基本的機器學習模型    2.3.3 機器學習方法分類    2.3.4 應(yīng)用于生物信息學領(lǐng)域的機器學習方法第3章 統(tǒng)計學習理論  3.1 學習問題的表示方法    3.1.1 概述    3.1.2 學習問題的一般表示    3.1.3 學習問題的模型    3.1.4 經(jīng)驗風險最小化原則    3.1.5 復雜性和推廣能力    3.1.6 模式識別問題 3.2 統(tǒng)計學習理論的四個部分    3.2.1 學習過程的一致性    3.2.2 學習過程收斂速度的界    3.2.3 控制學習過程推廣能力的理論第4章 構(gòu)造支持向量機  4.1 優(yōu)化理論    4.1.1 問題公式化    4.1.2 拉格朗日理論    4.1.3 KKT理論  4.2 支持向量機    4.2.1 支持向量機基本原理簡介    4.2.2 線性分類    4.2.3 非線性分類    4.2.4 多重分類第5章  應(yīng)用于支持向量機的主要算法 5.1 支持向量機算法中目前的研究狀況 5.2 分解算法 5.3 順序最小優(yōu)化算法    5.3.1 順序最小優(yōu)化算法的原理    5.3.2 兩個拉格朗日乘子的優(yōu)化問題    5.3.3 選擇待優(yōu)化拉格朗日乘子的啟發(fā)式方法    5.3.4 每次最小優(yōu)化后的重置工作    5.3.5 順序最小優(yōu)化算法的特點和優(yōu)勢第6章 Libsvm簡介 6.1 公式    6.1.1 C-支持向量分類(二元)    6.1.2 V支持向量分類(二元)  6.2 二次規(guī)劃問題的解決    6.2.1 C—SVC的分解算法    6.2.2 工作集的選擇和停止循環(huán)的標準    6.2.3 V支持向量分類的分解方法    6.2.4 解析解法    6.2.5 b和P的計算  6.3 壓縮和緩存    6.3.1 壓縮    6.3.2 緩存 6.4 多元分類 6.5 非平衡數(shù)據(jù)集 6.6 模型的選擇 6.7 預(yù)測蛋白質(zhì)結(jié)構(gòu)中運用Libsvm的基本操作方法第7章  蛋白質(zhì)二級結(jié)構(gòu)預(yù)測  7.1 蛋白質(zhì)結(jié)構(gòu)    7.1.1 蛋白質(zhì)的一級結(jié)構(gòu) ……第8章 蛋白質(zhì)折疊類型的預(yù)測參考文獻附表1 RS126數(shù)據(jù)集附表2 CB513數(shù)據(jù)集附表3 蛋白質(zhì)結(jié)構(gòu)域拓撲層預(yù)測樣本集附表4 蛋白質(zhì)結(jié)構(gòu)域同源超族層預(yù)測本集附表5 蛋白質(zhì)結(jié)構(gòu)域序列家族層樣本集

章節(jié)摘錄

  第1章 蛋白質(zhì)結(jié)構(gòu)預(yù)測概述  1.1 蛋白質(zhì)預(yù)測基本方法簡介  生物信息學是近年來最有活力的生物學研究領(lǐng)域之一,人們從生物信息的研究中獲得了對生命本質(zhì)更豐富的知識和更深刻的理解。核酸序列中蘊含著生命的基本信息,這些信息是自然界留給人類的、解讀生命的“天書”。理解這本天書是最終了解自然、了解生命、了解人類自身的重要途徑,是人類從必然王國到自由王國飛躍的基本前提之一?! ∮苫驔Q定的蛋白質(zhì)執(zhí)行著生物體內(nèi)各種重要的功能,如生物化學反應(yīng)的催化、營養(yǎng)物質(zhì)的輸運、生長和分化控制、生物信號的識別和傳遞等?;虼_定了組成蛋白質(zhì)的氨基酸序列。雖然蛋白質(zhì)由氨基酸的線性序列組成,但是它們只有折疊成特定的空間構(gòu)象才能具有相應(yīng)的活性和相應(yīng)的生物學功能。了解蛋白質(zhì)的空間結(jié)構(gòu)不僅有利于認識氨基酸殘基序列與空間結(jié)構(gòu)的關(guān)系,也有利于認識蛋白質(zhì)的結(jié)構(gòu)與其生物學功能的關(guān)系?! 「鶕?jù)近些年來的經(jīng)驗,蛋白質(zhì)序列數(shù)據(jù)庫數(shù)據(jù)積累速度非???,而且還有加快的趨勢。盡管蛋白質(zhì)結(jié)構(gòu)測定技術(shù)有了較為顯著的進展,但是通過實驗方法確定蛋白質(zhì)結(jié)構(gòu)的過程仍然非常復雜,實驗周期很長。另外,隨著DNA測序技術(shù)的發(fā)展,人類基因組及很多的模式生物基因組已經(jīng)或?qū)⒁煌耆珳y序,DNA序列數(shù)量將會劇增,由于DNA序列分析技術(shù)和基因識別方法的進步,人們可以從DNA序列直接推導出大量的蛋白質(zhì)序列。這意味著已知序列的蛋白質(zhì)數(shù)量和已測定結(jié)構(gòu)的蛋白質(zhì)數(shù)量(如蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB中的數(shù)據(jù))的差距將會越來越大。面對這種蛋白質(zhì)結(jié)構(gòu)信息與DNA序列信息發(fā)展速度的不平衡,人們希望找到一些預(yù)測方法,通過這些方法加快蛋白質(zhì)結(jié)構(gòu)產(chǎn)生速度,縮小二者之間的差距?! 榱丝s小這種差距,要么改進現(xiàn)有的蛋白質(zhì)測序技術(shù)和結(jié)構(gòu)預(yù)測方法,要么發(fā)展新的理論分析方法,這是對生物學家的極大挑戰(zhàn)。20世紀60年代后期,Anfinsen首先發(fā)現(xiàn)去折疊蛋白質(zhì)或者說變性蛋白質(zhì)在允許重新折疊的實驗條件下可以重新折疊到原來的結(jié)構(gòu),這種天然結(jié)構(gòu)對于蛋白質(zhì)行使生物功能具有重要作用,蛋白質(zhì)只有在折疊成其天然結(jié)構(gòu)的時候才能具有完全的生物活性。因此Anfinsen提出了蛋白質(zhì)折疊的信息隱含在蛋白質(zhì)的一級結(jié)構(gòu)中的觀點?;谶@種觀點,人們相信通過對蛋白質(zhì)一級結(jié)構(gòu)的研究,發(fā)現(xiàn)其折疊密碼后能夠僅通過一級結(jié)構(gòu)信息就能預(yù)測蛋白質(zhì)空間結(jié)構(gòu)。

圖書封面

評論、評分、閱讀與下載


    蛋白質(zhì)結(jié)構(gòu)預(yù)測 PDF格式下載


用戶評論 (總計2條)

 
 

  •   書本很好,當當網(wǎng)效率很高,謝謝。
  •   交易過程基本滿意
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7