科學數(shù)據(jù)庫與信息技術(shù)論文集

出版時間:2012-1  出版社:科學出版社  作者:中國科學院科學數(shù)據(jù)庫辦公室 編  頁數(shù):475  

內(nèi)容概要

  《科學數(shù)據(jù)庫與信息技術(shù)論文集(第11集)》收入論文59篇,主要反映中國科學院近年來在科學數(shù)據(jù)庫的建庫技術(shù)、網(wǎng)絡(luò)技術(shù)、信息服務(wù)技術(shù)等方面所取得的成果及學術(shù)上取得的進展。這些論文也集中體現(xiàn)了近年來國內(nèi)數(shù)據(jù)庫與信息技術(shù)方面的研究和應(yīng)用水平?!  犊茖W數(shù)據(jù)庫與信息技術(shù)論文集(第11集)》可供從事數(shù)據(jù)庫技術(shù)、網(wǎng)絡(luò)技術(shù)和信息系統(tǒng)研究的科技人員、工程技術(shù)人員參考,也可供相關(guān)學科的研究人員、大專院校師生閱讀。

書籍目錄

序總論中國科學院科技數(shù)據(jù)資源現(xiàn)狀及其發(fā)展思考科學數(shù)據(jù)的個體識別和跨學科集成數(shù)據(jù)庫系統(tǒng)及建庫技術(shù)化合物子結(jié)構(gòu)檢索及時響應(yīng)的流程優(yōu)化與分布式優(yōu)化研究植物化學成分數(shù)據(jù)庫建設(shè)中國植物物種信息數(shù)據(jù)庫關(guān)聯(lián)性設(shè)計與查詢服務(wù)數(shù)字化物種編目的三個重要問題植物藥用知識傳承與利用的數(shù)據(jù)庫建設(shè)與應(yīng)用探索毫米波射電天文數(shù)據(jù)庫研究化合物結(jié)構(gòu)的唯一性編碼和化學數(shù)據(jù)庫管理空間數(shù)據(jù)存儲技術(shù)及四大空間數(shù)據(jù)庫發(fā)展淺析NoSQL當前發(fā)展及應(yīng)用狀況系統(tǒng)生物學中多組學綜合數(shù)據(jù)庫的設(shè)計與實現(xiàn)Web數(shù)據(jù)庫安全技術(shù)分析及其應(yīng)用LinkedData在科學數(shù)據(jù)庫中的應(yīng)用探討數(shù)字版權(quán)保護與數(shù)字水印技術(shù)在科學數(shù)據(jù)庫中的應(yīng)用基于網(wǎng)絡(luò)服務(wù)的開放矢量地理空間數(shù)據(jù)管理系統(tǒng)數(shù)據(jù)共享與服務(wù)技術(shù)人地系統(tǒng)科學數(shù)據(jù)網(wǎng)格建設(shè)初探化學主題數(shù)據(jù)庫:數(shù)據(jù)網(wǎng)格技術(shù)的應(yīng)用范例材料科學主題數(shù)據(jù)庫的數(shù)據(jù)整合與共享服務(wù)空間科學數(shù)據(jù)網(wǎng)格模型應(yīng)用服務(wù)框架設(shè)計與實現(xiàn)中國動物主題數(shù)據(jù)庫服務(wù)平臺的設(shè)計與實現(xiàn)衛(wèi)星軌道演示軟件的設(shè)計與實現(xiàn)面向數(shù)據(jù)密集型計算的科學數(shù)據(jù)網(wǎng)格作業(yè)調(diào)度系統(tǒng)一個輕量級分布式計算框架的設(shè)計與實現(xiàn)化合物理化性質(zhì)數(shù)據(jù)的整合和服務(wù)基團貢獻法物性估算模塊的設(shè)計開發(fā)基于專業(yè)日志分析的科學數(shù)據(jù)庫平臺用戶活動研究——以中國數(shù)字植物標本館(CVH)為例基于Flex的基因組可視化工具基因組可視化工具GBrowse及其應(yīng)用古生物學和地層學專業(yè)數(shù)據(jù)庫中地層數(shù)據(jù)的可視化基于MRS工具的海量數(shù)據(jù)檢索L,AS在南海物理海洋數(shù)據(jù)服務(wù)中的應(yīng)用研究PHP常見安全漏洞研究基于HITS的科學數(shù)據(jù)檢索結(jié)果排序的研究RDF在科學數(shù)據(jù)集成檢索中的應(yīng)用LEQL:一種面向科學數(shù)據(jù)實體的級聯(lián)關(guān)聯(lián)查詢語言配置管理數(shù)據(jù)庫(CMDB)的關(guān)鍵技術(shù)研究與實現(xiàn)大規(guī)模遙感圖像高性能集群存儲處理技術(shù)研究與實現(xiàn)科學數(shù)據(jù)管理與共享工具及技術(shù)研究通用數(shù)據(jù)源連接器設(shè)計及實現(xiàn)973計劃資源環(huán)境領(lǐng)域數(shù)據(jù)匯交服務(wù)實踐與成效移動互聯(lián)網(wǎng)環(huán)境下群組日程協(xié)同軟件設(shè)計與實現(xiàn)英漢冰凍圈科學詞匯收錄修訂與共享系統(tǒng)數(shù)據(jù)共享與標準規(guī)范文獻數(shù)據(jù)訓及全文檢索技術(shù)數(shù)據(jù)庫應(yīng)用

章節(jié)摘錄

版權(quán)頁:插圖:理論上,一個有效的QSARJQSPR模型可以預測得到化合物的多種性質(zhì),可以用于對化合物數(shù)據(jù)庫的批量篩選。但在實際建立與應(yīng)用QSAR/QSPR模型時,常常會出現(xiàn)一些錯誤,從而導致預測得到的結(jié)果不合理。文獻總結(jié)了在建立QSA剛QSPR模型過程中可能出現(xiàn)的20類錯誤,大體可分為數(shù)據(jù)集的質(zhì)量、描述符的選擇、模型的驗證、模型應(yīng)用范圍的定義、機理解釋等幾個方面。為使QSAR/QSPR模型盡可能合理,在建立模型時,要盡量保證研究對象數(shù)據(jù)集的完備性、多樣性、合理性、來源一致性。在選擇描述符時,要盡量選擇與作用機理可能相關(guān)、具有明確物理意義的描述符,要保證描述符之間不相關(guān)。模型建立之后,要對模型進行內(nèi)部和外部驗證,以檢驗模型的擬合可優(yōu)度、魯棒性和預測能力。另外,由于QSAR/QSPR模型只對與訓練集相似的化合物可以得到好的預測結(jié)果,模型應(yīng)用范圍會直接影響QSAR/QSPR模型的預測可靠性,因此QSARJQSPR模型應(yīng)用范圍的定義也是非常重要的。目前定義模型應(yīng)用域范圍的方法主要分為以下四類。(1)以片段為基礎(chǔ)的方法。如果訓練集的片段集中不包含待測化合物的組成片段,將定義該待測化合物在應(yīng)用域范圍外。對于該方法,將化合物拆分為片段的算法會影響應(yīng)用域范圍,片段包含化學信息越多,應(yīng)用域范圍越嚴格。(2)化學描述符的值范圍方法。用多個化學描述符組成的Ⅳ維空間定義應(yīng)用域。但是有些描述符不能對應(yīng)用域內(nèi)外的化合物進行很好的區(qū)分,如文獻[19]采用logP對測試集進行區(qū)分,幾乎整個測試集都在應(yīng)用域范圍內(nèi),而對同樣的數(shù)據(jù)集采用其他方法區(qū)分,其中一部分化合物在應(yīng)用域范圍外。(3)結(jié)構(gòu)相似性方法。根據(jù)相似的結(jié)構(gòu)具有相似的化學性質(zhì)這一假設(shè),采用結(jié)構(gòu)相似性方法應(yīng)是更加合理的,但結(jié)構(gòu)相似性是一個主觀概念,判斷結(jié)構(gòu)相似的方法不同,可能應(yīng)用域范圍也不同:另外即使結(jié)構(gòu)相似的化合物,也可能由于其作用機理不一樣,導致性質(zhì)不一樣。(4)組合方法。文獻[19]表明以片段為基礎(chǔ)的方法和結(jié)構(gòu)相似性方法結(jié)合是一種更好的定義應(yīng)用域范圍的方法。模型應(yīng)用范圍的定義是比較困難的,一方面化合物結(jié)構(gòu)相似的判斷具有主觀性;另一方面有些化合物盡管結(jié)構(gòu)相似,由于作用機理不同,導致性質(zhì)產(chǎn)生很大差異;其次是所定義的模型應(yīng)用域的方法要能夠通過編程實現(xiàn)。目前模型應(yīng)用域定義仍然是QSAR/OSPR的研究熱點,人們?nèi)匀辉谔剿髦?。一個合理的QSAR/QSPR模型,應(yīng)該盡可能給出模型中的描述符與預測性質(zhì)之間機理相關(guān)的解釋。需要注意的是,QSAR/QSPR模型包含的描述符只能說明與其預測性質(zhì)相關(guān),它們之間并不一定存在因果關(guān)系,因此模型包含的一些描述符號可能與作用機理是無關(guān)的,這也是導致一部分QSAR/OSPR模型預測能力低的一個原因。如果在建立模型之前,作用機理已經(jīng)明確,根據(jù)作用機理建立的模型,其預測能力應(yīng)該會大大提高。

編輯推薦

《科學數(shù)據(jù)庫與信息技術(shù)論文集(第11集)》由科學出版社出版。

圖書封面

評論、評分、閱讀與下載


    科學數(shù)據(jù)庫與信息技術(shù)論文集 PDF格式下載


用戶評論 (總計0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7