21世紀計算機化學叢書

出版時間:2012-2  出版社:化學工業(yè)出版社  作者:陸文聰 等著  頁數(shù):244  
Tag標簽:無  

前言

計算機在理論化學和應用化學各個領域的廣泛應用,極大地促進了化學學科的發(fā)展,并產(chǎn)生了一系列交叉學科,如計算(機)化學、化學計量學、化學信息學等。 化學化工領域積累了大量的科學實驗和生產(chǎn)實際數(shù)據(jù),如何總結(jié)這些數(shù)據(jù)中的規(guī)律性,進而用以指導以后的科學實驗和生產(chǎn)操作,這是一項非常有意義的工作,這項工作的實施需要數(shù)據(jù)挖掘技術與化學化工知識和科學實踐的結(jié)合。 所謂化學數(shù)據(jù)挖掘(ChemicalDataMining),就是利用機器學習方法對化學化工(或相關學科)中有關數(shù)據(jù)樣本進行采集、整理、分析、建模等,試圖歸納和總結(jié)數(shù)據(jù)中蘊含的規(guī)律性,進而利用所建定性或定量的數(shù)學模型預報未知樣本的性質(zhì)?;瘜W數(shù)據(jù)挖掘的應用研究內(nèi)容涉及材料設計、分子設計、化工過程優(yōu)化等領域?;瘜W數(shù)據(jù)挖掘方法和技術已成為化學信息學、生物信息學的主要研究工具。 利用化學數(shù)據(jù)挖掘方法和技術,可以總結(jié)藥物分子的構(gòu)效關系,即藥物的生物活性與其結(jié)構(gòu)特征參數(shù)(分子描述符)之間的定量或定性關系,在此基礎上可以設計和預測新的高活性化合物。利用化學數(shù)據(jù)挖掘方法和技術,可以總結(jié)新材料的物理化學性質(zhì)與其組成元素的原子參數(shù)、化學配方、制備工藝等參數(shù)之間的定性或定量關系,在此基礎上可以輔助新材料研制和新產(chǎn)品開發(fā),達到事半功倍的效果。利用化學數(shù)據(jù)挖掘方法和技術,對大型現(xiàn)代化工廠(特別是煉油廠、化工廠和煉鋼廠)的生產(chǎn)操作過程作“工業(yè)診斷”,找出優(yōu)化生產(chǎn)的“瓶頸”問題,建立解決“瓶頸”問題的數(shù)據(jù)挖掘模型,在此基礎上可以實現(xiàn)低成本、高收率、低能耗、高質(zhì)量地生產(chǎn)和制備各種化學產(chǎn)品。因此,利用化學數(shù)據(jù)挖掘所得研究對象的統(tǒng)計規(guī)律,可以指導我們更好地開展下一步的科學實驗和生產(chǎn)實踐,達到“事半功倍”的目的?;瘜W數(shù)據(jù)挖掘方法和技術的應用成本低,卻可能在科學實驗中節(jié)省人力物力,甚至在工業(yè)生產(chǎn)中產(chǎn)生可觀的經(jīng)濟效益,因而化學數(shù)據(jù)挖掘方法和技術有廣泛的應用背景。 筆者長期從事化學數(shù)據(jù)挖掘方法在化學化工領域的應用研究工作,在該研究領域積累了大量成功應用實例,我們開發(fā)的化學數(shù)據(jù)挖掘軟件HyperMiner和基于數(shù)據(jù)挖掘的工業(yè)優(yōu)化控制系統(tǒng)已在國內(nèi)若干大型企業(yè)得到實際應用,達到了增產(chǎn)降耗的目的。本書從化學工作者易于理解的角度介紹常用數(shù)據(jù)挖掘方法的基本原理,并重點介紹作者近年來在材料設計、工業(yè)優(yōu)化、構(gòu)效關系、生物信息學等領域的數(shù)據(jù)挖掘工作。 筆者曾與我國已故著名化學家陳念貽先生長期合作研究,很多工作曾得益于陳念貽先生的指導和幫助。筆者曾作為合作者協(xié)助陳念貽先生出版過兩本學術專著,即《模式識別方法在化學化工中的應用》(科學出版社,2000)和《SupportVectorMachineinChemistry》(WorldScientificPublishingCoPteLtd,2004),本書的出版是筆者對于恩師陳念貽先生的化學數(shù)據(jù)挖掘工作在上海大學的繼承和發(fā)展。本書有關科研工作得到了國家自然科學基金委員會、上海市科學技術委員會、上海寶山鋼鐵集團、云南省科技廳、北京石油化工設計院等單位的資助;有關學術研究和技術開發(fā)工作得到了筆者的研究生們的大力配合,其中劉旭和顧天鴻博士等在算法程序方面做了較多工作,楊善升和鈕冰博士等在化學數(shù)據(jù)挖掘應用方面做了較多的工作;本書的出版得到了化學工業(yè)出版社的支持,在此一并致謝。 為方便讀者學以致用,筆者為讀者提供了化學數(shù)據(jù)挖掘應用軟件HyperMiner,讀者下載后可免費使用30天(附錄1含該軟件簡介和下載方法),希望廣大讀者能通過具體應用案例學習和受益。本書可供化學、化工及相關領域的科研人員和工程技術人員閱讀,亦可作為高等學校的教學參考書。 化學數(shù)據(jù)挖掘涉及的研究領域很廣,本書只是介紹了部分常用方法在筆者涉獵的研究領域中的工作,有關數(shù)據(jù)挖掘方法包括變量相關分析和多元統(tǒng)計、模式識別、人工神經(jīng)網(wǎng)絡、遺傳算法、支持向量機、集成學習、特征篩選等;有關數(shù)據(jù)挖掘方法的綜合應用案例涉及材料設計、工業(yè)優(yōu)化、構(gòu)效關系和生物信息學等領域。由于筆者的學識和工作所限,疏漏和不足之處在所難免,歡迎各位讀者和研究同行提出寶貴意見。 陸文聰 2011年8月于上海大學

內(nèi)容概要

  本書主要介紹了化學常用數(shù)據(jù)挖掘方法和技術的基本原理,并重點介紹了模式識別、支持向量機、集成學習方法在材料設計、工業(yè)優(yōu)化、構(gòu)效關系、生物信息學等領域的應用研究實例。書中所有應用研究實例全部取自作者的應用研究課題,有關算法程序可采用作者開發(fā)的應用軟件HyperMiner(見附錄1)。
  本書可供化學、化工及相關領域的科研人員和工程技術人員閱讀,亦可作為高等學校的教學參考書。

書籍目錄

1化學數(shù)據(jù)挖掘綜述
 1.1化學數(shù)據(jù)挖掘的目的和意義
 1.1.1數(shù)據(jù)挖掘與材料設計
 1.1.2數(shù)據(jù)挖掘與構(gòu)效關系
 1.1.3數(shù)據(jù)挖掘與工業(yè)優(yōu)化
 1.2化學數(shù)據(jù)挖掘方法概要
 1.3化學數(shù)據(jù)挖掘應用進展
 1.3.1機器學習的數(shù)學本質(zhì)
 1.3.2統(tǒng)計模型的“過擬合”問題
 1.3.3模式識別優(yōu)化算法及其改進
 1.3.4支持向量機算法的應用效果
 1.3.5建立綜合運用多種算法的數(shù)據(jù)處理平臺
 參考文獻
2模式識別基本原理和方法
 2.1模式識別方法的基本原理和預備知識
 2.2模式識別經(jīng)典方法
 2.2.1最近鄰方法
 2.2.2主成分分析方法
 2.2.3多重判別矢量和Fisher判別矢量方法
 2.2.4偏最小二乘方法
 2.2.5非線性映照方法
 2.3模式識別應用技術
 2.3.1最佳投影識別方法
 2.3.2超多面體建模
 2.3.3逐級投影建模方法
 2.3.4最佳投影回歸方法
 2.3.5模式識別逆投影方法
 2.4決策樹算法
 2.4.1C4.5算法
 2.4.2隨機決策樹算法
 2.4.3隨機森林算法
 參考文獻
3人工神經(jīng)網(wǎng)絡和遺傳算法
 3.1人工神經(jīng)網(wǎng)絡
 3.1.1反向人工神經(jīng)網(wǎng)絡
 3.1.2Kohonen自組織網(wǎng)絡
 3.2遺傳算法
 參考文獻
4支持向量機方法
 4.1統(tǒng)計學習理論(SLT)簡介
 4.1.1背景
 4.1.2原理
 4.2支持向量分類(SVC)算法
 4.2.1線性可分情形
 4.2.2非線性可分情形
 4.3支持向量機(SVM)的核函數(shù)
 4.4支持向量回歸(SVR)方法
 4.4.1線性回歸情形
 4.4.2非線性回歸情形
 4.5支持向量機分類與回歸算法的實現(xiàn)
 4.6應用前景
 參考文獻
5集成學習方法
 5.1集成學習算法概述
 5.2Boosting算法
 5.3Adaboost算法
 5.4Bagging算法
 參考文獻
6特征選擇方法和應用
 6.1特征選擇研究概述
 6.2基于支持向量分類的特征選擇
 6.2.1后向浮動搜索算法
 6.2.2用SVM?BFS進行特征選擇
 6.3支持向量回歸的特征選擇
 6.3.1PRIFER算法
 6.3.2計算結(jié)果的評價準則
 6.3.3PRIFER方法與常規(guī)計算方法的結(jié)果比較
 6.4集成學習及其特征選擇
 6.4.1個體子集的特征選擇
 6.4.2基于預報風險的特征選擇
 6.4.3PRIFEB算法
 6.4.4UCI數(shù)據(jù)集上的計算結(jié)果
 參考文獻
7鈣鈦礦型離子導體導電性的數(shù)據(jù)挖掘
 7.1鈣鈦礦型離子導體與燃料電池材料
 7.2鈣鈦礦的結(jié)構(gòu)特性
 7.3鈣鈦礦型晶體的原子參數(shù)
 7.3.1鈣鈦礦容忍因子
 7.3.2鈣鈦礦平均離子半徑
 7.3.3鈣鈦礦單位晶格邊值與臨界半徑
 7.3.4鈣鈦礦組成元素的電負性
 7.3.5鈣鈦礦平均離子極化率與所帶電荷
 7.3.6鈣鈦礦原子參數(shù)與量化參數(shù)的組合
 7.4鈣鈦礦離子導體數(shù)據(jù)的收集
 7.5數(shù)據(jù)集的自變量篩選
 7.5.1自變量的經(jīng)典統(tǒng)計相關性分析
 7.5.2貝葉斯網(wǎng)絡進行變量關聯(lián)性分析
 7.5.3前進?后退法進行自變量篩選
 7.6多種數(shù)據(jù)挖掘方法建立原子參數(shù)?鈣鈦礦導電能力模型
 7.6.1PLS,BP?ANN與SVR建立的回歸模型
 7.6.2回歸模型的留一法交叉驗證與獨立測試集驗證
 7.6.3SVR模型的敏感性分析
 參考文獻
8熔鹽相圖數(shù)據(jù)庫的數(shù)據(jù)挖掘
 8.1相圖計算的意義
 8.2原子參數(shù)?模式識別方法概述
 8.3智能數(shù)據(jù)庫技術在材料科學中的應用
 8.4熔鹽相圖智能數(shù)據(jù)庫的研究和開發(fā)
 8.5判別鹵化物體系是否形成中間化合物
 8.6白鎢礦結(jié)構(gòu)物相含稀土異價固溶體的形成規(guī)律
 8.6.1白鎢礦型物相及其異價固溶體的形成規(guī)律
 8.6.2白鎢礦型MⅠM′Ⅲ(XO4)2(X=Mo,W)物
 相及其異價固溶體的形成規(guī)律
 8.7鈣鈦礦及類鈣鈦礦結(jié)構(gòu)的物相的若干規(guī)律性
 8.7.1鈣鈦礦結(jié)構(gòu)的復鹵化物的若干規(guī)律性
 8.7.2含鈣鈦礦結(jié)構(gòu)層的夾層化合物的規(guī)律
 參考文獻
9鍍錫薄鋼板質(zhì)量的數(shù)據(jù)挖掘
 9.1鍍錫薄鋼板的發(fā)展
 9.2鍍錫板生產(chǎn)過程簡介
 9.3鍍錫板耐蝕性能與工業(yè)生產(chǎn)軟熔條件的關系
 9.4鍍錫板耐蝕性能與實驗室模擬軟熔條件的關系
 9.5工業(yè)生產(chǎn)中防止淬水斑產(chǎn)生的數(shù)學模型
 9.6鍍錫板淬水斑的實驗室模擬研究
 參考文獻
10合成氨生產(chǎn)效益的數(shù)據(jù)挖掘
 10.1氨合成裝置簡介
 10.1.1生產(chǎn)原理
 10.1.2生產(chǎn)流程
 10.1.3生產(chǎn)數(shù)據(jù)的復雜性和數(shù)據(jù)挖掘的必要性
 10.2DMOS合成氨優(yōu)化系統(tǒng)的開發(fā)
 10.2.1DMOS合成氨優(yōu)化系統(tǒng)簡介
 10.2.2DMOS合成氨優(yōu)化系統(tǒng)離線版軟件
 10.2.3DMOS合成氨優(yōu)化系統(tǒng)在線版軟件
 10.2.4DMOS合成氨優(yōu)化系統(tǒng)優(yōu)化生產(chǎn)實施步驟
 10.2.5DMOS合成氨優(yōu)化系統(tǒng)主要特點
 10.3氨合成裝置生產(chǎn)優(yōu)化模型的研究
 10.3.1數(shù)據(jù)集
 10.3.21號合成塔生產(chǎn)優(yōu)化數(shù)學模型
 10.4討論和結(jié)論
 參考文獻
11分子結(jié)構(gòu)性質(zhì)關系的數(shù)據(jù)挖掘
 11.1偶氮染料最大吸收波長的支持向量回歸模型
 11.1.1分子結(jié)構(gòu)特征參數(shù)的計算和篩選
 11.1.2支持向量回歸的計算結(jié)果
 11.1.3討論
 11.2胍類化合物Na/H交換抑制活性的支持向量分類模型
 11.2.1特征參數(shù)的計算與篩選
 11.2.2支持向量分類的計算結(jié)果
 11.2.3與其他方法的比較
 11.3抗艾滋病藥物HEPT活性的支持向量分類模型
 11.3.1特征參數(shù)的計算與篩選
 11.3.2支持向量分類的計算結(jié)果
 11.3.3與其他方法的比較
 11.4三唑類化合物分子篩選的最佳投影識別模型
 11.4.1特征參數(shù)的計算和篩選
 11.4.2特征參數(shù)間的共線性檢查
 11.4.3OPR法的計算
 11.4.4OPR法的測試結(jié)果
 11.4.5結(jié)論
 參考文獻
12HIV?1蛋白酶特異性位點的數(shù)據(jù)挖掘
 12.1數(shù)據(jù)集準備
 12.2mRMR方法和特征選取
 12.3不同的特征子集建模預報能力比較
 12.4特征分析和結(jié)論
 參考文獻
13蛋白質(zhì)結(jié)構(gòu)及功能類型預測
 13.1用集成學習方法預測蛋白質(zhì)的亞細胞定位
 13.1.1蛋白質(zhì)亞細胞定位的生物學基礎及研究現(xiàn)狀
 13.1.2蛋白質(zhì)亞細胞定位數(shù)據(jù)集以及特征參數(shù)的提取
 13.1.3亞細胞定位預測中模型參數(shù)的選擇與模型的驗證
 13.1.4分析與討論
 13.2蛋白質(zhì)結(jié)構(gòu)類型的集成學習方法預測
 13.2.1蛋白質(zhì)結(jié)構(gòu)類型簡介及研究現(xiàn)狀
 13.2.2數(shù)據(jù)集以及特征參數(shù)的提取
 13.2.3預測蛋白質(zhì)結(jié)構(gòu)類型時的模型參數(shù)選擇與模型驗證
 13.2.4分析與討論
 13.3膜蛋白類型的集成學習方法預測
 13.3.1膜蛋白簡介及計算預測研究現(xiàn)狀
 13.3.2膜蛋白預測的數(shù)據(jù)集以及特征參數(shù)的提取
 13.3.3預測膜蛋白質(zhì)類型的模型參數(shù)選擇與模型驗證
 13.3.4預測膜蛋白質(zhì)類型的模型變量分析
 13.4蛋白質(zhì)亞細胞定位和膜蛋白類型預報的在線Web服務
 參考文獻
附錄1“HyperMiner數(shù)據(jù)挖掘軟件”下載和應用說明
 一、軟件簡介和下載方法
 二、應用案例:V?PTC材料最佳配方及最佳工藝條件的探索
附錄2第6章所用的數(shù)據(jù)集
 一、大腦膠質(zhì)瘤數(shù)據(jù)集
 二、多元校正數(shù)據(jù)集
 三、基因芯片數(shù)據(jù)集
參考文獻

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    21世紀計算機化學叢書 PDF格式下載


用戶評論 (總計3條)

 
 

  •   書不錯,是自己所需要的
  •   該書詳細介紹了化學化工數(shù)據(jù)挖掘方法,并且將作者自行開發(fā)的專業(yè)軟件試用版供讀者使用,對提高數(shù)據(jù)挖掘能力是有很大幫助的。但該書理論部分寫得較深,學習起來有點吃力。
  •   我導師出的書。 我畢業(yè)2年了。 發(fā)現(xiàn)此書。 書內(nèi)容主要為碩士生和博士生論文的堆徹。 論文本身的水平不具有行業(yè)權(quán)威性,也不夠深入??梢哉f理論和實踐性都不夠強。 作為陸文聰導師的學生, 我建議大家別購買, 性價比相當?shù)汀?如要接觸計算機化學, 建議購買《化學信息學》約翰.加斯泰格爾寫得。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7