出版時(shí)間:2009-12 出版社:復(fù)旦大學(xué)出版社 作者:朱揚(yáng)勇 頁數(shù):131
Tag標(biāo)簽:無
前言
科學(xué)研究所用的方法是邏輯推理和實(shí)驗(yàn),邏輯推理依靠數(shù)學(xué),實(shí)驗(yàn)依靠觀測。在計(jì)算機(jī)出現(xiàn)后,科學(xué)研究開始使用計(jì)算機(jī)技術(shù),使得科學(xué)研究增加了計(jì)算的方法。在自然科學(xué)的研究過程中,遇到了大量的計(jì)算問題,這些計(jì)算是手工無法完成的,因此計(jì)算機(jī)的大規(guī)模計(jì)算能力在科學(xué)計(jì)算方面獲得了很好的應(yīng)用,并逐漸成為一種科學(xué)研究的新方法,相繼出現(xiàn)了計(jì)算數(shù)學(xué)、計(jì)算物理、計(jì)算化學(xué)、計(jì)算生物學(xué),等等,并且計(jì)算生物學(xué)已經(jīng)成為現(xiàn)代生物學(xué)研究的核心方法之一。后來,科學(xué)研究的對象也信息化了,變成了計(jì)算機(jī)中的數(shù)據(jù),最典型的是生命科學(xué)領(lǐng)域中基因的信息化,形成由ACGT這4個字母組成的DNA序列數(shù)據(jù),研究對象變成了DNA序列數(shù)據(jù),出現(xiàn)了生物信息學(xué)。同樣的狀況也出現(xiàn)在其他研究領(lǐng)域,于是有了腦信息學(xué)、地理信息學(xué)、行為信息學(xué)、社會信息學(xué)、經(jīng)濟(jì)信息學(xué)、歷史信息學(xué),等等。隨著國民經(jīng)濟(jì)和社會的信息化進(jìn)程,自然界中的事物以數(shù)據(jù)的形式存儲到計(jì)算機(jī)系統(tǒng)中,即信息化是一個生產(chǎn)數(shù)據(jù)的過程。這些數(shù)據(jù)是自然和生命的一種表示形式,這記錄了人類的行為,包括工作、生活和社會發(fā)展。數(shù)據(jù)被快速大量地生產(chǎn)并存儲到計(jì)算機(jī)系統(tǒng)中,這種現(xiàn)象稱為數(shù)據(jù)爆炸,數(shù)據(jù)爆炸在計(jì)算機(jī)系統(tǒng)中形成數(shù)據(jù)自然界。目前,數(shù)據(jù)爆炸還在進(jìn)行中,人類還不能清晰地描述數(shù)據(jù)自然界。
內(nèi)容概要
《數(shù)據(jù)學(xué)》介紹了數(shù)據(jù)學(xué)的由來、基本概念和基本原理,包括:數(shù)據(jù)大爆炸、數(shù)據(jù)自然界、數(shù)據(jù)學(xué)基礎(chǔ):介紹了數(shù)據(jù)學(xué)的主要方法,包括:數(shù)據(jù)勘探、數(shù)據(jù)獲取與整合、數(shù)據(jù)挖掘、數(shù)據(jù)實(shí)驗(yàn);還介紹了數(shù)據(jù)學(xué)的應(yīng)用和數(shù)據(jù)學(xué)面臨的挑戰(zhàn)?! 稊?shù)據(jù)學(xué)》主要作為科學(xué)研究工作者的參考書,試圖向科學(xué)工作者展示一種新的科學(xué),并且能夠利用這種新的科學(xué)為當(dāng)前的科學(xué)研究工作服務(wù)?!稊?shù)據(jù)學(xué)》基本以較為通俗化的語言來表達(dá)數(shù)據(jù)學(xué)的基本原理、方法和技術(shù),希望對各領(lǐng)域的科學(xué)家,包括行為科學(xué)家和社會科學(xué)家能夠有所啟迪。
作者簡介
朱揚(yáng)勇,1963年生,浙江武義人。復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授,數(shù)據(jù)科學(xué)研究中心主任;上海市政府信息化專家,上海市計(jì)算機(jī)學(xué)會、生物信息學(xué)會理事等。主持完成國家自然科學(xué)基金、“863計(jì)劃”等10多項(xiàng)科研課題,發(fā)表論文100余篇,出版圖書7本。目前作為主要倡導(dǎo)者,從事數(shù)據(jù)科學(xué)的研究工作。熊赟,1980年生,江西南昌人。復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教師。主要研究領(lǐng)域?yàn)閿?shù)據(jù)科學(xué),發(fā)表論文20余篇。作為項(xiàng)目負(fù)責(zé)人,主持國家自然科學(xué)基金、上海市科委重點(diǎn)發(fā)展基金項(xiàng)目等的研究工作,并參與國家“863計(jì)劃”、“973計(jì)劃”等多項(xiàng)研究課題。
書籍目錄
第1章 緒論1.1 數(shù)據(jù)1.1.1 數(shù)據(jù)的概念1.1.2 數(shù)據(jù)與物質(zhì)1.2 數(shù)據(jù)爆炸1.3 數(shù)據(jù)自然界1.3.1 數(shù)據(jù)不為人類所控制 1.3.2 數(shù)據(jù)的未知性1.3.3 數(shù)據(jù)的多樣性和復(fù)雜性1.4 數(shù)據(jù)學(xué)1.4.1 為什么需要數(shù)據(jù)學(xué) 1.4.2 數(shù)據(jù)學(xué)的概念1.4.3 數(shù)據(jù)學(xué)的框架1.5 與其他科學(xué)的關(guān)系1.6 小結(jié)第2章 數(shù)據(jù)自然界基礎(chǔ)知識2.1 數(shù)據(jù)自然界的發(fā)展2.1.1 3個階段2.1.2 數(shù)據(jù)集2.2 面臨的問題2.3 數(shù)據(jù)簇2.3.1 數(shù)據(jù)的屬性2.3.2 相似性與相似函數(shù)2.3.3 數(shù)據(jù)簇2.4 數(shù)據(jù)分類學(xué)2.4.1 數(shù)據(jù)本體2.4.2 數(shù)據(jù)分類學(xué)2.5 小結(jié)第3章 數(shù)據(jù)勘探3.1 為什么要做數(shù)據(jù)勘探3.2 什么是數(shù)據(jù)勘探3.2.1 數(shù)據(jù)勘探做什么 3.2.2 數(shù)據(jù)勘探步驟3.2.3 數(shù)據(jù)礦床3.3 勘探數(shù)據(jù)集的總體特性3.3.1 通過樣本分析判斷數(shù)據(jù)特征3.3.2 如何抽樣3.3.3 通過查詢判斷數(shù)據(jù)集的特征3.4 勘探數(shù)據(jù)集的結(jié)構(gòu)3.5 數(shù)據(jù)工具的勘探3.6 小結(jié)第4章 數(shù)據(jù)獲取與整合4.1 數(shù)據(jù)源存在的問題4.2 數(shù)據(jù)獲取4.2.1 數(shù)據(jù)獲取的方法4.2.2 數(shù)據(jù)質(zhì)量4.2.3 數(shù)據(jù)清潔4.3 數(shù)據(jù)整合4.3.1 數(shù)據(jù)整合的動因 4.3.2 數(shù)據(jù)整合的概念4.3.3 數(shù)據(jù)整合的主要工作4.3.4 數(shù)據(jù)整合的方式4.4 數(shù)據(jù)倉庫4.4.1 數(shù)據(jù)庫的局限4.4.2 基本概念4.4.3 數(shù)據(jù)組織4.5 小結(jié)第5章 數(shù)據(jù)挖掘5.1 數(shù)據(jù)挖掘的故事5.2 什么是數(shù)據(jù)挖掘5.2.1 數(shù)據(jù)挖掘的定義5.2.2 數(shù)據(jù)挖掘的過程5.3 數(shù)據(jù)挖掘的任務(wù)5.4 數(shù)據(jù)挖掘的類型5.4.1 一般數(shù)據(jù)源的挖掘5.4.2 特殊應(yīng)用數(shù)據(jù)源的挖掘5.5 小結(jié)第6章 數(shù)據(jù)實(shí)驗(yàn)6.1 數(shù)據(jù)觀察6.2 數(shù)據(jù)實(shí)驗(yàn)及其目的6.2.1 什么是數(shù)據(jù)實(shí)驗(yàn)6.2.2 數(shù)據(jù)實(shí)驗(yàn)的目的6.3 數(shù)據(jù)實(shí)驗(yàn)的步驟6.4 小結(jié)第7章 數(shù)據(jù)學(xué)應(yīng)用7.1 科學(xué)研究信息化7.2 生物信息學(xué)7.2.1 生物數(shù)據(jù)管理與整合7.2.2 生物數(shù)據(jù)分析7.3 腦信息學(xué)7.3.1 腦信息學(xué)研究方法7.3.2 腦數(shù)據(jù)管理與整合7.4 其他信息學(xué)7.5 小結(jié)第8章 面臨的挑戰(zhàn)8.1 數(shù)據(jù)學(xué)理論體系8.1.1 觀察與猜想8.1.2 數(shù)據(jù)運(yùn)算8.2 數(shù)據(jù)自然界與人8.2.1 在數(shù)據(jù)自然界中生活8.2.2 數(shù)據(jù)搜索8.2.3 數(shù)據(jù)真實(shí)性8.3 數(shù)據(jù)資源的保護(hù)與開發(fā)8.3.1 數(shù)據(jù)資源 8.3.2 數(shù)據(jù)資源的保護(hù)8.3.3 數(shù)據(jù)資源的開發(fā)8.4 小結(jié)參考文獻(xiàn)
章節(jié)摘錄
插圖:信息化的本質(zhì)是將現(xiàn)實(shí)世界中的事物以數(shù)據(jù)的形式存儲到計(jì)算機(jī)系統(tǒng)中,即信息化是一個生產(chǎn)數(shù)據(jù)的過程。這些數(shù)據(jù)是自然和生命的一種表示形式,這些數(shù)據(jù)還記錄了人類的行為,包括工作、生活和社會發(fā)展。今天,數(shù)據(jù)被快速大量地生產(chǎn)并存儲在計(jì)算機(jī)系統(tǒng)中,這種現(xiàn)象稱為數(shù)據(jù)爆炸(data explosion)。數(shù)據(jù)爆炸在計(jì)算機(jī)系統(tǒng)中形成數(shù)據(jù)自然界(data nature)。研究數(shù)據(jù)自然界是研究自然界(real nature)的一種有效方法,例如:可以通過研究數(shù)據(jù)來研究生命(生物信息學(xué))、研究人類行為(行為信息學(xué))。數(shù)據(jù)學(xué)(dataology)或數(shù)據(jù)科學(xué)(data science)是探索數(shù)據(jù)自然界奧秘的理論、方法和技術(shù)。本章介紹了數(shù)據(jù)爆炸、數(shù)據(jù)自然界和數(shù)據(jù)學(xué)的基本概念,并給出了數(shù)據(jù)學(xué)的定義及其基本框架。計(jì)算機(jī)系統(tǒng)中存放的是數(shù)據(jù),“數(shù)據(jù)”的含義很廣,不僅指工011、8084.這樣一些數(shù)字,還指“dataology”、“小舟揚(yáng)帆出?!薄ⅰ?1/11/11”等符號、字符、日期形式的數(shù)據(jù)。確切地說,本書討論的數(shù)據(jù)是指能夠輸入到計(jì)算機(jī)中的任何東西,如:數(shù)字、字符、聲音、圖像、照片,等等,并且處理數(shù)據(jù)的計(jì)算機(jī)程序本身也是“數(shù)據(jù)”。
編輯推薦
《數(shù)據(jù)學(xué)》主要內(nèi)容簡介:復(fù)旦大學(xué)出版社
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載