基因表達譜數(shù)據(jù)挖掘方法研究

出版時間:2009-3  出版社:科學(xué)出版社  作者:黃德雙  頁數(shù):462  字數(shù):685000  
Tag標(biāo)簽:無  

前言

  生物信息學(xué)是一門包含生物學(xué)、計算機科學(xué)、數(shù)學(xué)和人工智能等學(xué)科的交叉科學(xué),也是近年來發(fā)展非常迅速的研究領(lǐng)域,它試圖使用計算和統(tǒng)計的方法來解決生物學(xué)中所涌現(xiàn)出來的海量數(shù)據(jù)分析的問題。隨著基因微陣列技術(shù)的不斷發(fā)展,大量基因表達譜數(shù)據(jù)的獲取變得越來越容易,而且獲得的數(shù)據(jù)也越來越準(zhǔn)確。但面對日益龐大、復(fù)雜的基因表達譜數(shù)據(jù),已有的相關(guān)數(shù)據(jù)分析和數(shù)據(jù)挖掘方法與技術(shù)已經(jīng)不能滿足實際的需要。近年來腫瘤基因表達譜技術(shù)的出現(xiàn),為腫瘤學(xué)的研究提供了一種全新、系統(tǒng)的研究手段,并在腫瘤學(xué)的基礎(chǔ)研究和臨床應(yīng)用等領(lǐng)域備受關(guān)注。通過基因表達譜對肺癌成功診斷的實例表明。利用基因表達譜對腫瘤進行診斷將會成為一種既快速又精確的臨床診斷方法,這種腫瘤診斷方法的發(fā)展必將大大增強臨床治療腫瘤的有效性?;虮磉_譜數(shù)據(jù)挖掘可以幫助人們發(fā)現(xiàn)新的疾病亞型,提高復(fù)雜疾病診斷的正確率。因此,發(fā)展高效實用的基因表達譜數(shù)據(jù)處理方法具有十分重要的實際意義。本書著重研究基因表達譜的各種數(shù)據(jù)挖掘方法,主要是將很多智能計算的方法與技術(shù)應(yīng)用到腫瘤分類中,全書包含了理論、方法、步驟、程序代碼、實驗結(jié)果與分析,以及多種方法的結(jié)果比較,同時以圖形和表格的形式給出了大量的實驗結(jié)果,很多方法具有通用性。本書大部分內(nèi)容是作者和作者所在的實驗室的最新研究成果,凝聚了作者所在實驗室全體工作人員的心血和才智。與同類書相比,本書的特點是絕大部分工作都是作者和作者的學(xué)生近幾年的研究成果,且理論與方法相結(jié)合,循序漸進,圖文并茂,通俗易懂。讀者按照書中的方法步驟和附錄中提供的程序代碼容易進行仿真實驗。因此,本書特別適合生物信息學(xué)領(lǐng)域的高年級本科生、研究生以及科技工作者參考?! ∪珪诰帉戇^程中得到了智能計算實驗室全體同志的大力協(xié)助,其中博士后王樹林、張善文和鄭春厚,博士王紅強、劉昆宏和裴順對書中的部分章節(jié)進行了編寫。此外,李波、李雪玲、史明光、夏俊峰、尤著宏、徐春歸等對全書的章節(jié)進行了校對,王樹林和張善文對全書所涉及的主要程序代碼進行了編寫、調(diào)試、整理和歸類?! ≡诒緯木帉戇^程中,也參考了國內(nèi)外有關(guān)研究成果,在此對所涉及的專家和研究人員表示衷心的感謝。由于工作疏忽,書中所列出的參考文獻可能不夠全面,在此也對那些可能被遺漏的專家和研究人員一并表示衷心的感謝??茖W(xué)出版社的莫結(jié)勝編輯為本書的出版付出了大量的心血,在此也一并表示感謝。此外,本書的出版得到了國家自然科學(xué)基金、國家重點基礎(chǔ)研究發(fā)展計劃(973)和國家高技術(shù)研究發(fā)展計劃(863)項目的支持,在此也一并鳴謝!

內(nèi)容概要

基因表達譜數(shù)據(jù)挖掘可以幫助人們發(fā)現(xiàn)新的疾病亞型,提高復(fù)雜疾病診斷的正確率。因此,發(fā)展高效實用的基因表達譜數(shù)據(jù)處理方法具有十分重要的實際意義。本書首先介紹生物信息學(xué)中基因芯片和基因表達譜等一些基本概念,然后利用Re—lief、Fisher判別、Wilcoxon和Kruskal-Wallis秩和檢驗方法、信噪比方法、主成分分析方法、因子分析方法、獨立分量分析方法、經(jīng)典粗糙集和鄰域粗糙集、人工神經(jīng)網(wǎng)絡(luò)和集成神經(jīng)網(wǎng)絡(luò)、小波包變換和離散余弦變換、遺傳算法和遺傳規(guī)劃、流形學(xué)習(xí)、張量分析等方法,系統(tǒng)研究了基于基因表達譜的腫瘤亞型數(shù)據(jù)挖掘方法(包括特征提取與分類識別等)。設(shè)計多種基因表達譜分類識別算法,并結(jié)合SVM、NSC、FLDA、DLDA等多種分類器及集成分類器,進行大量的基因表達譜分類識別實驗,以圖和表的形式給出大量實驗結(jié)果,同時對各種方法的性能進行比較。系統(tǒng)研究基于基因調(diào)控概率的腫瘤基因表達譜數(shù)據(jù)挖掘方法,結(jié)合Filter和Wrapper兩種特征選擇方法的優(yōu)點,研究基于支持向量機和懲罰策略(SVPS)的腫瘤關(guān)鍵基因選擇算法。設(shè)計基于標(biāo)準(zhǔn)遺傳算法和多目標(biāo)遺傳算法的集成基因表達譜特征選擇方法。    本書適合國內(nèi)高校和科研院所生物和信息領(lǐng)域中從事生物信息學(xué)教學(xué)和研究的教師、高年級本科生、研究生和科技人員,對于其他與生物信息學(xué)研究有關(guān)及有志于從事這一領(lǐng)域研究的計算機科研人員也是必備的參考讀物。

作者簡介

黃德雙,工學(xué)博士,中國科學(xué)技術(shù)大學(xué)博士生導(dǎo)師,中國科學(xué)院合肥智能機械研究所研究員,中國科學(xué)院研究生院教授,2000年度中國科學(xué)院“百人計劃”人選者。Transactions of the Institute of Measurement and Control(TIMC)國際雜志顧問編委,Advances in Artificial Ne

書籍目錄

前言第1章 緒論  1.1 生物信息學(xué)簡介    1.1.1 生物信息學(xué)概念    1.1.2 生物信息學(xué)的研究背景和意義    1.1.3 生物信息學(xué)的研究內(nèi)容與方法    1.1.4 生物信息學(xué)的研究歷史和現(xiàn)狀    1.1.5 應(yīng)用前景  1.2 基因組時代簡介    1.2.1 基因組計劃    1.2.2 基因的基本結(jié)構(gòu)  1.3 基因表達譜數(shù)據(jù)挖掘的研究意義與研究現(xiàn)狀    1.3.1 研究意義    1.3.2 研究現(xiàn)狀  1.4 本章小結(jié)  參考文獻第2章 DNA微陣列技術(shù)與基因表達譜  2.1 基因芯片與DNA微陣列    2.1.1 基因芯片介紹    2.1.2 基因芯片的特點、分類和制作    2.1.3 基因芯片制備方法    2.1.4 DNA微陣列技術(shù)的應(yīng)用和研究方向  2.2 基因表達譜    2.2.1 基因表達譜的獲取與表示    2.2.2 基因表達譜的特點    2.2.3 基因表達譜的數(shù)學(xué)描述    2.2.4 常用的腫瘤基因表達譜數(shù)據(jù)集  2.3 基因表達譜數(shù)據(jù)分析    2.3.1 基因表達譜數(shù)據(jù)的預(yù)處理    2.3.2 基因表達譜數(shù)據(jù)分析的層次    2.3.3 差異基因篩選    2.3.4 基因解讀與注釋    2.3.5 基因表達調(diào)控  2.4 基因表達譜的研究方向  2.5 本章小結(jié)  參考文獻第3章 基因表達譜數(shù)據(jù)挖掘中的模式識別基礎(chǔ)  3.1 模式識別的概念及其研究方向  3.2 特征提取與選擇方法    3.2.1 特征提取中用到的統(tǒng)計量    3.2.2 基因表達譜的特征提取與選擇  3.3 常用的基因表達譜聚類與分類算法    3.3.1 基因表達譜聚類和分類的目的    3.3.2 聚類與分類算法的劃分及評估準(zhǔn)則    3.3.3 基于類間距離的聚類算法    3.3.4 層次聚類    3.3.5 基于密度、網(wǎng)格和模型的聚類算法    3.3.6 K-均值法    3.3.7 仿射傳播聚類    3.3.8 K-近鄰分類方法及其改進方法    3.3.9 決策樹    3.3.10 線性判別分析    3.3.11 基因表達譜可分性判據(jù)  3.4 分類器    3.4.1 貝葉斯分類器    3.4.2 人工神經(jīng)網(wǎng)絡(luò)    3.4.3  自組織映射    3.4.4 支持向量機    3.4.5 多分類器性能比較  3.5 本章小結(jié)  參考文獻第4章 基于因子分量分析的基因表達譜特征提取方法  4.1 基因表達譜特征提取方法簡介  4.2 主分量分析    4.2.1 主分量分析的基本思想    4.2.2 主分量分析算法步驟  4.3 判決主分量分析    4.3.1 判決主分量分析的基本思想    4.3.2 判決主分量分析算法步驟  4.4 因子分析    4.4.1 因子分析的基本思想    4.4.2 因子分析算法的步驟  4.5 獨立分量分析 ……第5章 基于傅里葉與小波包變換的基因表達譜特征提取方法第6章 信息基因的啟發(fā)式搜索算法研究第7章 基于粗糙集的信息基因選擇方法第8章 基于基因調(diào)控概率模型的基因表達譜數(shù)據(jù)挖掘方法第9章 基于神經(jīng)網(wǎng)絡(luò)和支持向量機的基因選擇及腫瘤分類方法第10章 基于集成分類器系統(tǒng)的基因表達譜數(shù)據(jù)挖掘方法研究第11章 基于流形學(xué)習(xí)的基因表達譜特征提取方法第12章 基于張量分析的高階基因表達譜特征提取方法附錄 部分源代碼彩圖

章節(jié)摘錄

  第1章 緒論  生命是一個異常復(fù)雜的巨型系統(tǒng)。雖然科學(xué)家們已針對生命現(xiàn)象的本質(zhì)做了大量的研究工作,但迄今為止人類仍然未解開生命的奧秘,甚至還  不能理解最簡單生命的基本過程。近年來,由于基因組測序技術(shù)的快速發(fā)展,人類基因組和多種模式高等生物及模式微生物的全基因組測序工  作被逐一完成,在GenBank、EMBL和DDBJ等國際公共核苷酸數(shù)據(jù)庫中的DNA序列數(shù)據(jù)變得越來越多。然而,與正在以指數(shù)方式增長的生物學(xué)數(shù)據(jù)  相比,人類相關(guān)知識的增長卻十分緩慢。一方面是巨量的數(shù)據(jù);另一方面是人們在生命、醫(yī)學(xué)、藥物等方面對新知識的渴求,這就構(gòu)成了一個  極大的矛盾。人們正在目睹生物醫(yī)學(xué)研究領(lǐng)域的一個巨大變革,即從傳統(tǒng)的對單個基因、單個蛋白質(zhì)的研究過渡到系統(tǒng)地對整個生物體的基因  組學(xué)、蛋白質(zhì)組學(xué)、轉(zhuǎn)錄組學(xué)進行研究;而研究方法也從傳統(tǒng)的觀察和實驗,過渡到結(jié)合計算機科學(xué)、人工智能、數(shù)學(xué)等學(xué)科的理論和方法來  進行分析。這個變革使得大量的計算機和數(shù)理科學(xué)工作者自然地轉(zhuǎn)入到生命科學(xué)研究的領(lǐng)域,一門新興的交叉學(xué)科——生物信息學(xué) ?。╞ioinformatics)應(yīng)運而生。

編輯推薦

  《基因表達譜數(shù)據(jù)挖掘方法研究》的特點是絕大部分工作都是作者和作者的學(xué)生近幾年的研究成果,且理論與方法相結(jié)合,循序漸進,圖文并茂,通俗易懂。讀者按照書中的方法步驟和附錄中提供的程序代碼容易進行仿真實驗。

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    基因表達譜數(shù)據(jù)挖掘方法研究 PDF格式下載


用戶評論 (總計8條)

 
 

  •   雖然還沒具體看,不過不失為生物信息學(xué)學(xué)習(xí)研究用的一本好書。
  •   很專業(yè)的書籍,適合專業(yè)人士閱讀。
  •   很多內(nèi)容有指導(dǎo)意義,不像一般從國外翻譯過來的讀起來很生硬的書,這本書是國內(nèi)專家寫的,可以有空的時候翻一翻
  •   感覺對自己有些幫助,是瀏覽型的書。沒必要仔細看的。
  •   這本書不錯。值得一讀。收貨頗豐。
  •   just so os
  •   質(zhì)量還好送貨速度快!
  •   一般,不實用有。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7