出版時(shí)間:2010-4 出版社:科學(xué) 作者:薛慶中 頁數(shù):275
Tag標(biāo)簽:無
前言
當(dāng)今生物基因組DNA測序數(shù)據(jù)總量正在以指數(shù)倍的速度增長。如何對數(shù)據(jù)庫的海量數(shù)據(jù)進(jìn)行科學(xué)的搜集、管理、挖掘、注釋已成為基因組學(xué)和蛋白組學(xué)研究的熱點(diǎn)。為普及和提高我國科學(xué)工作者基因組科學(xué)知識,學(xué)習(xí)并掌握序列數(shù)據(jù)分析的實(shí)用操作技能,及時(shí)了解該領(lǐng)域的最新進(jìn)展,自2003年以來,浙江大學(xué)和中國科學(xué)院基因組研究所緊密協(xié)作已舉辦了24期基因組科學(xué)培訓(xùn)班。培訓(xùn)學(xué)員來自全國各地29個(gè)省市,人次多達(dá)1800余人,每次培訓(xùn)班中都不僅常見到較多教授和副教授們的身影,年輕的研究生更是踴躍參加。他們的專業(yè)背景雖然各自不同,涵蓋理學(xué)、工學(xué)、醫(yī)學(xué)、農(nóng)學(xué)等不同門類和學(xué)科,但渴求知識、不斷進(jìn)取的態(tài)度卻是一樣的?! 』蚪M科學(xué)培訓(xùn)班由楊煥明、于軍、鄭樹、林標(biāo)揚(yáng)、胡松年、薛慶中、徐宇虹等教授擔(dān)當(dāng)主講教師。他們不僅對基因組科學(xué)的基本概念加以正確詮釋,對當(dāng)今的最新進(jìn)展進(jìn)行全面介紹,并能結(jié)合自己的科研工作,分別講解他們在醫(yī)學(xué)、農(nóng)學(xué)、微生物等領(lǐng)域具體的應(yīng)用實(shí)例。學(xué)員們反映,通過這些生動(dòng)趣味的講座加深了他們對DNA數(shù)據(jù)挖掘的理解,有助于開闊研究視野和工作思路,同時(shí)激發(fā)了學(xué)習(xí)這門前沿科學(xué)的興趣和熱情?! ∨嘤?xùn)班主要學(xué)習(xí)數(shù)據(jù)庫搜索和實(shí)用工具的操作,采用“跟我學(xué)”的教學(xué)方式,指導(dǎo)教師邊講邊示范,學(xué)員們每人備有電腦,跟著大屏幕一步步操作;輔導(dǎo)教員隨時(shí)在旁幫助解難,使學(xué)員們在較短時(shí)間內(nèi)盡快初步掌握基本操作程序。為滿足培訓(xùn)的需要,我們先后編寫了《基因組數(shù)據(jù)分析手冊》(胡松年和薛慶中,2003)和((EST數(shù)據(jù)分析手冊》(胡松年,2005),得到良好的反映和發(fā)行量。教學(xué)內(nèi)容的不斷更新是培訓(xùn)班久盛不衰的保證。近期培訓(xùn)內(nèi)容中我們又新增芯片數(shù)據(jù)、蛋白質(zhì)數(shù)據(jù)和系統(tǒng)生物學(xué)網(wǎng)絡(luò)結(jié)構(gòu)顯示與分析等內(nèi)容。為此,在前兩本書的基礎(chǔ)上,我們新編寫了((DNA和蛋白質(zhì)序列數(shù)據(jù)分析工具》一書?! ∪珪?章。第1章,闡述序列比較的核心方法,即運(yùn)用BLST和ClustalX等工具做序列比對。第2章,重點(diǎn)介紹核苷酸序列分析工具,主要包括:基因可讀框的識別,CpG島、轉(zhuǎn)錄終止信號和啟動(dòng)子區(qū)域的預(yù)測分析,用mRNA序列預(yù)測基因等。第3章,介紹電子克隆的概念和具體操作方法。第4章,用MEGA4做分子進(jìn)化遺傳分析,繪制系統(tǒng)進(jìn)化樹,為研究基因進(jìn)化打好基礎(chǔ)。第5章,對蛋白質(zhì)基本理化性質(zhì)、二級結(jié)構(gòu)、結(jié)構(gòu)域和三維空間結(jié)構(gòu)、預(yù)測目標(biāo)蛋白的生物學(xué)功能等工具做逐一介紹。第6章,通過GeneOntology和KEGG兩個(gè)數(shù)據(jù)庫,挖掘基因和蛋白質(zhì)的功能并做代謝途徑分析。
內(nèi)容概要
在眾多生物基因組測序項(xiàng)目完成之際,我們面臨的最大挑戰(zhàn)是如何對DNA和蛋白質(zhì)數(shù)掘進(jìn)行科學(xué)的分析和注釋。《DNA和蛋白質(zhì)序列數(shù)據(jù)分析工具(第2版)》分三個(gè)層次解讀基因數(shù)據(jù)庫和網(wǎng)絡(luò)工具:基因組學(xué)層面重點(diǎn)介紹序列比對工具BLAST和ClttstalX的使用、真核生物基因結(jié)構(gòu)的預(yù)測、電子克隆及分子進(jìn)化遺傳分析工具(MEGA4)的使用;蛋白質(zhì)組學(xué)層面介紹了蛋白質(zhì)結(jié)構(gòu)與功能預(yù)測、序列模體的識別和解析、蛋白質(zhì)譜數(shù)據(jù)分析、基因芯片數(shù)據(jù)處理和分析,以及應(yīng)用GO注釋基因功能和通過KEGG分析代謝途徑;系統(tǒng)生物學(xué)層面從網(wǎng)絡(luò)結(jié)構(gòu)分析闡述了蛋白質(zhì)與蛋白質(zhì)的相互作用;此外,還增添了使用Bioperl模塊進(jìn)行數(shù)據(jù)分析和Windows操作系統(tǒng)下Bioperl程序包的安裝等內(nèi)容。書中提及的各種方法均有充實(shí)的例證并附上相關(guān)數(shù)據(jù)和圖表,供讀者理解和參考;書后還附有中英文的專業(yè)術(shù)語和詞匯。 《DNA和蛋白質(zhì)序列數(shù)據(jù)分析工具(第2版)》可作為對生物信息學(xué)專業(yè)感興趣的本科生、研究生和研究人員學(xué)習(xí)、研究的重要工具手冊。
書籍目錄
第二版前言第一版前言第1章 序列比對工具BLAST和ClustalX的使用1.1 序列比對BLAST1.1.1 Basic BLAST1.1.2 網(wǎng)上blastx比對1.1.3 網(wǎng)上PSl.Blast比對1.1.4 Specialized BLAST1.1.5 網(wǎng)上Blast2比對1.2 本地運(yùn)行BLAST(Windows系統(tǒng))1.2.1 BLAST程序下載1.2.2 BLAST程序安裝1.2.3 進(jìn)入DOS命令行提示符狀態(tài)1.2.4 搜索數(shù)據(jù)庫的格式化1.2.5 BLAST搜索程序運(yùn)行1.2.6 本地化BLAST搜索結(jié)果查看1.3 多序列比對(ClustalX)1.3.1 ClustalX的使用1.3.2 數(shù)據(jù)的輸入1.3.3 數(shù)據(jù)的輸出主要參考文獻(xiàn)第2章 真核生物基因結(jié)構(gòu)的預(yù)測2.1 基因可讀框的識別2.2 CpG島、轉(zhuǎn)錄終止信號和啟動(dòng)子區(qū)域的預(yù)測2.2.1 CpG島的預(yù)測2.2.2 轉(zhuǎn)錄終止信號的預(yù)測2.2.3 啟動(dòng)子區(qū)域的預(yù)測2.3 基因密碼子偏好性計(jì)算:CodonW的使用2.4 采用mRNA序列預(yù)測基因:Spidey的使用2.5 ASTD數(shù)據(jù)庫簡介主要參考文獻(xiàn)第3章 電子克隆3.1 利用UniGene數(shù)據(jù)庫進(jìn)行電子延伸3.1.1 目標(biāo)序列的檢索3.1.2 UniGene數(shù)據(jù)庫檢索3.2 從數(shù)據(jù)庫中獲取CDNA全長序列3.3 本地序列拼接3.3.1 CAP3序列拼接程序3.3.2 Velvet序列拼接程序3.4 基因的電子表達(dá)譜分析3.5 核酸序列的電子基因定位分析主要參考文獻(xiàn)第4章 分子進(jìn)化遺傳分析工具(MEGA4)的使用4.1 序列數(shù)據(jù)的獲取和比對4.1.1 數(shù)據(jù)庫直接檢索4.1.2 多序列比對4.2 進(jìn)化距離的估計(jì)4.3 分子鐘假說的檢驗(yàn)4.4 系統(tǒng)進(jìn)化樹構(gòu)建4.4.1 系統(tǒng)進(jìn)化樹構(gòu)建方法選擇4.4.2 進(jìn)化樹的樹形選擇4.4.3 進(jìn)化樹的拓?fù)浣Y(jié)構(gòu)調(diào)整4.4.4 進(jìn)化樹樹枝形態(tài)的優(yōu)化4.4.5 進(jìn)化樹的保存主要參考文獻(xiàn)第5章 蛋白質(zhì)結(jié)構(gòu)與功能預(yù)測5.1 蛋白質(zhì)一級結(jié)構(gòu)分析5.1.1 ProtParam:蛋白質(zhì)序列理化參數(shù)檢索5.1.2 ProtScale:蛋白質(zhì)親疏水性分析5.1.3 COILS:卷曲螺旋預(yù)測5.2 蛋白質(zhì)二級結(jié)構(gòu)預(yù)測5.2.1 PredictProtein:蛋白質(zhì)結(jié)構(gòu)預(yù)測5.2.2 PSIPRED:不同蛋白質(zhì)結(jié)構(gòu)預(yù)測方法5.3 InterProScan:模式和序列譜研究5.3.1 InterPro’Scan簡介5.3.2 PROSITE:蛋白質(zhì)結(jié)構(gòu)域、家族和功能位點(diǎn)數(shù)據(jù)庫5.3.3 Pfam:蛋白質(zhì)家族比對和HMM數(shù)據(jù)庫5.3.4 BLOCKS:模塊搜索數(shù)據(jù)庫5.3.5 SMART:簡單模塊構(gòu)架搜索工具5.3.6 TMHMM.跨膜區(qū)結(jié)構(gòu)預(yù)測服務(wù)器5.4 蛋白質(zhì)三級結(jié)構(gòu)預(yù)測5.4.1 Swiss.ModelWorkspace:同源建模的網(wǎng)絡(luò)綜合服務(wù)器5.4.2 Phyre(Successorof3D.PSSM):線串法預(yù)測蛋白質(zhì)折疊5.4.3 HMMSTR/Rosetta:從頭預(yù)測蛋白質(zhì)結(jié)構(gòu)5.4.4 Swiss.PdbViewer:分子建模和可視化工具主要參考文獻(xiàn)第6章 序列模體的識別和解析6.1 MEME程序包6.2 通過MEME識別DNA或蛋白質(zhì)序列組中模體6.3 通過MAST搜索序列中的已知模體6.4 通過GLAM2識別有空位的模體6.5 通過GLAM2scAN搜索序列中的已知模體6.6 應(yīng)用TOMTOM與數(shù)據(jù)庫中的已知模體進(jìn)行搜索比對6.7 應(yīng)用GOM0鑒定模體的功能主要參考文獻(xiàn)第7章 蛋白質(zhì)譜數(shù)據(jù)分析7.1 生物質(zhì)譜技術(shù)介紹7.1.1 質(zhì)譜技術(shù)的基本原理7.1.2 x!Tandem軟件7.1.3 Mascot軟件7.1.4 Sequest軟件7.2 蛋白質(zhì)組學(xué)數(shù)據(jù)統(tǒng)計(jì)分析軟件7.2.1 TPP簡介7.2.2 TPP的安裝與配置7.2.3 樣本數(shù)據(jù)準(zhǔn)備7.2.4 將RAW文件轉(zhuǎn)換成mzXML文件7.2.5 由out數(shù)據(jù)文件夾生成pepXML文件7.2.6 運(yùn)行PeptideProphet7.2.7 PeptideProphet處理后的結(jié)果分析7.2.8 運(yùn)行ProteinProphet7.2.9 數(shù)據(jù)的過濾篩選和將結(jié)果保存成Excel文件主要參考文獻(xiàn)第8章 基因芯片數(shù)據(jù)處理和分析8.1 芯片數(shù)據(jù)的獲取和處理8.1.1 ExpressCOnVener8.1.2 MIDAS8.2 芯片數(shù)據(jù)聚類分析和差異表達(dá)基因篩選8.2.1 MeV8.2.2 Cluster8.2.3 TreeView8.3 芯片數(shù)據(jù)的可視化8.3.1 GenMAPP的概念8.3.2 GenMAPP的安裝8.3.3 GenMAPP的使用8.4 芯片數(shù)據(jù)的檢索和提交8.4.1 GEO檢索8.4.2 Platform信息8.4.3 Series信息_8.4.4 Samples信息8.4.5 芯片數(shù)據(jù)的提交主要參考文獻(xiàn)第9章 應(yīng)用GO注釋基因功能和通過KEGG分析代謝途徑9.1 GeneOntology數(shù)據(jù)庫9.1.1 簡介9.1.2 用關(guān)鍵詞檢索GO數(shù)據(jù)庫9.1.3 用序列檢索GO數(shù)據(jù)庫9.2 KEGG數(shù)據(jù)庫9.2.1 簡介9.2.2 根據(jù)代謝途徑名稱檢索9.2.3 根據(jù)基因名稱檢索9.2.4 根據(jù)序列檢索9.2.5 利用KAAS工具作批量注釋9.2.6 基因芯片數(shù)據(jù)的代謝途徑分析主要參考文獻(xiàn)第10章 系統(tǒng)生物學(xué)網(wǎng)絡(luò)結(jié)構(gòu)分析10.1 Cytoscape軟件簡介……第11章 使用Bioperl模塊作數(shù)據(jù)分析第12章 Winodws環(huán)境下Bioperl程序包的安裝英漢對照詞匯彩圖
章節(jié)摘錄
和原核生物相比,真核生物不僅在細(xì)胞結(jié)構(gòu)上存在明顯差異,并且在基因結(jié)構(gòu)上也更為復(fù)雜。模式生物全基因組測序計(jì)劃的完成,使得基因結(jié)構(gòu)和功能的預(yù)測已成為可能。本章將重點(diǎn)描述真核生物基因可讀框、CpG島、轉(zhuǎn)錄終止信號、啟動(dòng)子、密碼子偏好等結(jié)構(gòu),選擇介紹一些常用核苷酸序列分析工具,幫助讀者了解基因結(jié)構(gòu)預(yù)測的方法?! ?.1 基因可讀框的識別 可讀框(open reading frame,ORF)指的是從5’端翻譯起始密碼子(ATG)到終止密碼子(TAA、TAG或TGA)的蛋白質(zhì)編碼堿基序列。真核生物的可讀框除外顯子外,還含有內(nèi)含子,其長度變化范圍非常大,因此真核生物基因預(yù)測遠(yuǎn)比原核生物困難?! 』蝾A(yù)測軟件GENSCAN由斯坦福大學(xué)開發(fā)(Burge and Karlin,1998),它是針對基因組DNA序列預(yù)測可讀框及基因結(jié)構(gòu)信息的開放式在線資源,尤其適用于脊椎動(dòng)物、擬南芥和玉米等真核生物?! ∵M(jìn)入GENSCAN頁面(圖2.1),選擇物種,上傳或直接粘貼序列,運(yùn)行后便可獲得提交序列中所包含的基因數(shù)目、外顯子數(shù)目和類型,預(yù)測單元的長度、方向、位置及相位、編碼區(qū)打分值、可信概率、總得分值等預(yù)測結(jié)果。例如,提交一個(gè)人類cosmid序列(GenBank號:AC002390),預(yù)測結(jié)果表明該克隆存在兩個(gè)基因,其中第1個(gè)基因的起始外顯子從532堿基處開始,到657堿基處結(jié)束;接著有9個(gè)中間外顯子;終止外顯子在51 783堿基處結(jié)束,其后還有polyA信號。在第2個(gè)基因起始外顯子的前端有啟動(dòng)子區(qū)域,它始于59 901堿基處(圖2.2)。由于提交的序列長度只有70 311個(gè)堿基,所以這里預(yù)測的第2個(gè)基因的結(jié)構(gòu)并不完整。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載
DNA和蛋白質(zhì)序列數(shù)據(jù)分析工具 PDF格式下載