DNA和蛋白質(zhì)序列數(shù)據(jù)分析工具

出版時間:2010-4  出版社:科學  作者:薛慶中  頁數(shù):275  
Tag標簽:無  

前言

  當今生物基因組DNA測序數(shù)據(jù)總量正在以指數(shù)倍的速度增長。如何對數(shù)據(jù)庫的海量數(shù)據(jù)進行科學的搜集、管理、挖掘、注釋已成為基因組學和蛋白組學研究的熱點。為普及和提高我國科學工作者基因組科學知識,學習并掌握序列數(shù)據(jù)分析的實用操作技能,及時了解該領域的最新進展,自2003年以來,浙江大學和中國科學院基因組研究所緊密協(xié)作已舉辦了24期基因組科學培訓班。培訓學員來自全國各地29個省市,人次多達1800余人,每次培訓班中都不僅常見到較多教授和副教授們的身影,年輕的研究生更是踴躍參加。他們的專業(yè)背景雖然各自不同,涵蓋理學、工學、醫(yī)學、農(nóng)學等不同門類和學科,但渴求知識、不斷進取的態(tài)度卻是一樣的?! 』蚪M科學培訓班由楊煥明、于軍、鄭樹、林標揚、胡松年、薛慶中、徐宇虹等教授擔當主講教師。他們不僅對基因組科學的基本概念加以正確詮釋,對當今的最新進展進行全面介紹,并能結合自己的科研工作,分別講解他們在醫(yī)學、農(nóng)學、微生物等領域具體的應用實例。學員們反映,通過這些生動趣味的講座加深了他們對DNA數(shù)據(jù)挖掘的理解,有助于開闊研究視野和工作思路,同時激發(fā)了學習這門前沿科學的興趣和熱情?! ∨嘤柊嘀饕獙W習數(shù)據(jù)庫搜索和實用工具的操作,采用“跟我學”的教學方式,指導教師邊講邊示范,學員們每人備有電腦,跟著大屏幕一步步操作;輔導教員隨時在旁幫助解難,使學員們在較短時間內(nèi)盡快初步掌握基本操作程序。為滿足培訓的需要,我們先后編寫了《基因組數(shù)據(jù)分析手冊》(胡松年和薛慶中,2003)和((EST數(shù)據(jù)分析手冊》(胡松年,2005),得到良好的反映和發(fā)行量。教學內(nèi)容的不斷更新是培訓班久盛不衰的保證。近期培訓內(nèi)容中我們又新增芯片數(shù)據(jù)、蛋白質(zhì)數(shù)據(jù)和系統(tǒng)生物學網(wǎng)絡結構顯示與分析等內(nèi)容。為此,在前兩本書的基礎上,我們新編寫了((DNA和蛋白質(zhì)序列數(shù)據(jù)分析工具》一書。  全書分9章。第1章,闡述序列比較的核心方法,即運用BLST和ClustalX等工具做序列比對。第2章,重點介紹核苷酸序列分析工具,主要包括:基因可讀框的識別,CpG島、轉錄終止信號和啟動子區(qū)域的預測分析,用mRNA序列預測基因等。第3章,介紹電子克隆的概念和具體操作方法。第4章,用MEGA4做分子進化遺傳分析,繪制系統(tǒng)進化樹,為研究基因進化打好基礎。第5章,對蛋白質(zhì)基本理化性質(zhì)、二級結構、結構域和三維空間結構、預測目標蛋白的生物學功能等工具做逐一介紹。第6章,通過GeneOntology和KEGG兩個數(shù)據(jù)庫,挖掘基因和蛋白質(zhì)的功能并做代謝途徑分析。

內(nèi)容概要

  在眾多生物基因組測序項目完成之際,我們面臨的最大挑戰(zhàn)是如何對DNA和蛋白質(zhì)數(shù)掘進行科學的分析和注釋。《DNA和蛋白質(zhì)序列數(shù)據(jù)分析工具(第2版)》分三個層次解讀基因數(shù)據(jù)庫和網(wǎng)絡工具:基因組學層面重點介紹序列比對工具BLAST和ClttstalX的使用、真核生物基因結構的預測、電子克隆及分子進化遺傳分析工具(MEGA4)的使用;蛋白質(zhì)組學層面介紹了蛋白質(zhì)結構與功能預測、序列模體的識別和解析、蛋白質(zhì)譜數(shù)據(jù)分析、基因芯片數(shù)據(jù)處理和分析,以及應用GO注釋基因功能和通過KEGG分析代謝途徑;系統(tǒng)生物學層面從網(wǎng)絡結構分析闡述了蛋白質(zhì)與蛋白質(zhì)的相互作用;此外,還增添了使用Bioperl模塊進行數(shù)據(jù)分析和Windows操作系統(tǒng)下Bioperl程序包的安裝等內(nèi)容。書中提及的各種方法均有充實的例證并附上相關數(shù)據(jù)和圖表,供讀者理解和參考;書后還附有中英文的專業(yè)術語和詞匯。  《DNA和蛋白質(zhì)序列數(shù)據(jù)分析工具(第2版)》可作為對生物信息學專業(yè)感興趣的本科生、研究生和研究人員學習、研究的重要工具手冊。

書籍目錄

第二版前言第一版前言第1章 序列比對工具BLAST和ClustalX的使用1.1 序列比對BLAST1.1.1 Basic BLAST1.1.2 網(wǎng)上blastx比對1.1.3 網(wǎng)上PSl.Blast比對1.1.4 Specialized BLAST1.1.5 網(wǎng)上Blast2比對1.2 本地運行BLAST(Windows系統(tǒng))1.2.1 BLAST程序下載1.2.2 BLAST程序安裝1.2.3 進入DOS命令行提示符狀態(tài)1.2.4 搜索數(shù)據(jù)庫的格式化1.2.5 BLAST搜索程序運行1.2.6 本地化BLAST搜索結果查看1.3 多序列比對(ClustalX)1.3.1 ClustalX的使用1.3.2 數(shù)據(jù)的輸入1.3.3 數(shù)據(jù)的輸出主要參考文獻第2章 真核生物基因結構的預測2.1 基因可讀框的識別2.2 CpG島、轉錄終止信號和啟動子區(qū)域的預測2.2.1 CpG島的預測2.2.2 轉錄終止信號的預測2.2.3 啟動子區(qū)域的預測2.3 基因密碼子偏好性計算:CodonW的使用2.4 采用mRNA序列預測基因:Spidey的使用2.5 ASTD數(shù)據(jù)庫簡介主要參考文獻第3章 電子克隆3.1 利用UniGene數(shù)據(jù)庫進行電子延伸3.1.1 目標序列的檢索3.1.2 UniGene數(shù)據(jù)庫檢索3.2 從數(shù)據(jù)庫中獲取CDNA全長序列3.3 本地序列拼接3.3.1 CAP3序列拼接程序3.3.2 Velvet序列拼接程序3.4 基因的電子表達譜分析3.5 核酸序列的電子基因定位分析主要參考文獻第4章 分子進化遺傳分析工具(MEGA4)的使用4.1 序列數(shù)據(jù)的獲取和比對4.1.1 數(shù)據(jù)庫直接檢索4.1.2 多序列比對4.2 進化距離的估計4.3 分子鐘假說的檢驗4.4 系統(tǒng)進化樹構建4.4.1 系統(tǒng)進化樹構建方法選擇4.4.2 進化樹的樹形選擇4.4.3 進化樹的拓撲結構調(diào)整4.4.4 進化樹樹枝形態(tài)的優(yōu)化4.4.5 進化樹的保存主要參考文獻第5章 蛋白質(zhì)結構與功能預測5.1 蛋白質(zhì)一級結構分析5.1.1 ProtParam:蛋白質(zhì)序列理化參數(shù)檢索5.1.2 ProtScale:蛋白質(zhì)親疏水性分析5.1.3 COILS:卷曲螺旋預測5.2 蛋白質(zhì)二級結構預測5.2.1 PredictProtein:蛋白質(zhì)結構預測5.2.2 PSIPRED:不同蛋白質(zhì)結構預測方法5.3 InterProScan:模式和序列譜研究5.3.1 InterPro’Scan簡介5.3.2 PROSITE:蛋白質(zhì)結構域、家族和功能位點數(shù)據(jù)庫5.3.3 Pfam:蛋白質(zhì)家族比對和HMM數(shù)據(jù)庫5.3.4 BLOCKS:模塊搜索數(shù)據(jù)庫5.3.5 SMART:簡單模塊構架搜索工具5.3.6 TMHMM.跨膜區(qū)結構預測服務器5.4 蛋白質(zhì)三級結構預測5.4.1 Swiss.ModelWorkspace:同源建模的網(wǎng)絡綜合服務器5.4.2 Phyre(Successorof3D.PSSM):線串法預測蛋白質(zhì)折疊5.4.3 HMMSTR/Rosetta:從頭預測蛋白質(zhì)結構5.4.4 Swiss.PdbViewer:分子建模和可視化工具主要參考文獻第6章 序列模體的識別和解析6.1 MEME程序包6.2 通過MEME識別DNA或蛋白質(zhì)序列組中模體6.3 通過MAST搜索序列中的已知模體6.4 通過GLAM2識別有空位的模體6.5 通過GLAM2scAN搜索序列中的已知模體6.6 應用TOMTOM與數(shù)據(jù)庫中的已知模體進行搜索比對6.7 應用GOM0鑒定模體的功能主要參考文獻第7章 蛋白質(zhì)譜數(shù)據(jù)分析7.1 生物質(zhì)譜技術介紹7.1.1 質(zhì)譜技術的基本原理7.1.2 x!Tandem軟件7.1.3 Mascot軟件7.1.4 Sequest軟件7.2 蛋白質(zhì)組學數(shù)據(jù)統(tǒng)計分析軟件7.2.1 TPP簡介7.2.2 TPP的安裝與配置7.2.3 樣本數(shù)據(jù)準備7.2.4 將RAW文件轉換成mzXML文件7.2.5 由out數(shù)據(jù)文件夾生成pepXML文件7.2.6 運行PeptideProphet7.2.7 PeptideProphet處理后的結果分析7.2.8 運行ProteinProphet7.2.9 數(shù)據(jù)的過濾篩選和將結果保存成Excel文件主要參考文獻第8章 基因芯片數(shù)據(jù)處理和分析8.1 芯片數(shù)據(jù)的獲取和處理8.1.1 ExpressCOnVener8.1.2 MIDAS8.2 芯片數(shù)據(jù)聚類分析和差異表達基因篩選8.2.1 MeV8.2.2 Cluster8.2.3 TreeView8.3 芯片數(shù)據(jù)的可視化8.3.1 GenMAPP的概念8.3.2 GenMAPP的安裝8.3.3 GenMAPP的使用8.4 芯片數(shù)據(jù)的檢索和提交8.4.1 GEO檢索8.4.2 Platform信息8.4.3 Series信息_8.4.4 Samples信息8.4.5 芯片數(shù)據(jù)的提交主要參考文獻第9章 應用GO注釋基因功能和通過KEGG分析代謝途徑9.1 GeneOntology數(shù)據(jù)庫9.1.1 簡介9.1.2 用關鍵詞檢索GO數(shù)據(jù)庫9.1.3 用序列檢索GO數(shù)據(jù)庫9.2 KEGG數(shù)據(jù)庫9.2.1 簡介9.2.2 根據(jù)代謝途徑名稱檢索9.2.3 根據(jù)基因名稱檢索9.2.4 根據(jù)序列檢索9.2.5 利用KAAS工具作批量注釋9.2.6 基因芯片數(shù)據(jù)的代謝途徑分析主要參考文獻第10章 系統(tǒng)生物學網(wǎng)絡結構分析10.1 Cytoscape軟件簡介……第11章 使用Bioperl模塊作數(shù)據(jù)分析第12章 Winodws環(huán)境下Bioperl程序包的安裝英漢對照詞匯彩圖

章節(jié)摘錄

  和原核生物相比,真核生物不僅在細胞結構上存在明顯差異,并且在基因結構上也更為復雜。模式生物全基因組測序計劃的完成,使得基因結構和功能的預測已成為可能。本章將重點描述真核生物基因可讀框、CpG島、轉錄終止信號、啟動子、密碼子偏好等結構,選擇介紹一些常用核苷酸序列分析工具,幫助讀者了解基因結構預測的方法。  2.1 基因可讀框的識別  可讀框(open reading frame,ORF)指的是從5’端翻譯起始密碼子(ATG)到終止密碼子(TAA、TAG或TGA)的蛋白質(zhì)編碼堿基序列。真核生物的可讀框除外顯子外,還含有內(nèi)含子,其長度變化范圍非常大,因此真核生物基因預測遠比原核生物困難?! 』蝾A測軟件GENSCAN由斯坦福大學開發(fā)(Burge and Karlin,1998),它是針對基因組DNA序列預測可讀框及基因結構信息的開放式在線資源,尤其適用于脊椎動物、擬南芥和玉米等真核生物?! ∵M入GENSCAN頁面(圖2.1),選擇物種,上傳或直接粘貼序列,運行后便可獲得提交序列中所包含的基因數(shù)目、外顯子數(shù)目和類型,預測單元的長度、方向、位置及相位、編碼區(qū)打分值、可信概率、總得分值等預測結果。例如,提交一個人類cosmid序列(GenBank號:AC002390),預測結果表明該克隆存在兩個基因,其中第1個基因的起始外顯子從532堿基處開始,到657堿基處結束;接著有9個中間外顯子;終止外顯子在51 783堿基處結束,其后還有polyA信號。在第2個基因起始外顯子的前端有啟動子區(qū)域,它始于59 901堿基處(圖2.2)。由于提交的序列長度只有70 311個堿基,所以這里預測的第2個基因的結構并不完整。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    DNA和蛋白質(zhì)序列數(shù)據(jù)分析工具 PDF格式下載


用戶評論 (總計0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7