出版時間:2009-12 出版社:復旦大學出版社 作者:朱揚勇 頁數(shù):131
Tag標簽:無
前言
科學研究所用的方法是邏輯推理和實驗,邏輯推理依靠數(shù)學,實驗依靠觀測。在計算機出現(xiàn)后,科學研究開始使用計算機技術,使得科學研究增加了計算的方法。在自然科學的研究過程中,遇到了大量的計算問題,這些計算是手工無法完成的,因此計算機的大規(guī)模計算能力在科學計算方面獲得了很好的應用,并逐漸成為一種科學研究的新方法,相繼出現(xiàn)了計算數(shù)學、計算物理、計算化學、計算生物學,等等,并且計算生物學已經(jīng)成為現(xiàn)代生物學研究的核心方法之一。后來,科學研究的對象也信息化了,變成了計算機中的數(shù)據(jù),最典型的是生命科學領域中基因的信息化,形成由ACGT這4個字母組成的DNA序列數(shù)據(jù),研究對象變成了DNA序列數(shù)據(jù),出現(xiàn)了生物信息學。同樣的狀況也出現(xiàn)在其他研究領域,于是有了腦信息學、地理信息學、行為信息學、社會信息學、經(jīng)濟信息學、歷史信息學,等等。隨著國民經(jīng)濟和社會的信息化進程,自然界中的事物以數(shù)據(jù)的形式存儲到計算機系統(tǒng)中,即信息化是一個生產(chǎn)數(shù)據(jù)的過程。這些數(shù)據(jù)是自然和生命的一種表示形式,這記錄了人類的行為,包括工作、生活和社會發(fā)展。數(shù)據(jù)被快速大量地生產(chǎn)并存儲到計算機系統(tǒng)中,這種現(xiàn)象稱為數(shù)據(jù)爆炸,數(shù)據(jù)爆炸在計算機系統(tǒng)中形成數(shù)據(jù)自然界。目前,數(shù)據(jù)爆炸還在進行中,人類還不能清晰地描述數(shù)據(jù)自然界。
內(nèi)容概要
《數(shù)據(jù)學》介紹了數(shù)據(jù)學的由來、基本概念和基本原理,包括:數(shù)據(jù)大爆炸、數(shù)據(jù)自然界、數(shù)據(jù)學基礎:介紹了數(shù)據(jù)學的主要方法,包括:數(shù)據(jù)勘探、數(shù)據(jù)獲取與整合、數(shù)據(jù)挖掘、數(shù)據(jù)實驗;還介紹了數(shù)據(jù)學的應用和數(shù)據(jù)學面臨的挑戰(zhàn)。 《數(shù)據(jù)學》主要作為科學研究工作者的參考書,試圖向科學工作者展示一種新的科學,并且能夠利用這種新的科學為當前的科學研究工作服務?!稊?shù)據(jù)學》基本以較為通俗化的語言來表達數(shù)據(jù)學的基本原理、方法和技術,希望對各領域的科學家,包括行為科學家和社會科學家能夠有所啟迪。
作者簡介
朱揚勇,1963年生,浙江武義人。復旦大學計算機科學技術學院教授,數(shù)據(jù)科學研究中心主任;上海市政府信息化專家,上海市計算機學會、生物信息學會理事等。主持完成國家自然科學基金、“863計劃”等10多項科研課題,發(fā)表論文100余篇,出版圖書7本。目前作為主要倡導者,從事數(shù)據(jù)科學的研究工作。熊赟,1980年生,江西南昌人。復旦大學計算機科學技術學院教師。主要研究領域為數(shù)據(jù)科學,發(fā)表論文20余篇。作為項目負責人,主持國家自然科學基金、上海市科委重點發(fā)展基金項目等的研究工作,并參與國家“863計劃”、“973計劃”等多項研究課題。
書籍目錄
第1章 緒論1.1 數(shù)據(jù)1.1.1 數(shù)據(jù)的概念1.1.2 數(shù)據(jù)與物質(zhì)1.2 數(shù)據(jù)爆炸1.3 數(shù)據(jù)自然界1.3.1 數(shù)據(jù)不為人類所控制 1.3.2 數(shù)據(jù)的未知性1.3.3 數(shù)據(jù)的多樣性和復雜性1.4 數(shù)據(jù)學1.4.1 為什么需要數(shù)據(jù)學 1.4.2 數(shù)據(jù)學的概念1.4.3 數(shù)據(jù)學的框架1.5 與其他科學的關系1.6 小結第2章 數(shù)據(jù)自然界基礎知識2.1 數(shù)據(jù)自然界的發(fā)展2.1.1 3個階段2.1.2 數(shù)據(jù)集2.2 面臨的問題2.3 數(shù)據(jù)簇2.3.1 數(shù)據(jù)的屬性2.3.2 相似性與相似函數(shù)2.3.3 數(shù)據(jù)簇2.4 數(shù)據(jù)分類學2.4.1 數(shù)據(jù)本體2.4.2 數(shù)據(jù)分類學2.5 小結第3章 數(shù)據(jù)勘探3.1 為什么要做數(shù)據(jù)勘探3.2 什么是數(shù)據(jù)勘探3.2.1 數(shù)據(jù)勘探做什么 3.2.2 數(shù)據(jù)勘探步驟3.2.3 數(shù)據(jù)礦床3.3 勘探數(shù)據(jù)集的總體特性3.3.1 通過樣本分析判斷數(shù)據(jù)特征3.3.2 如何抽樣3.3.3 通過查詢判斷數(shù)據(jù)集的特征3.4 勘探數(shù)據(jù)集的結構3.5 數(shù)據(jù)工具的勘探3.6 小結第4章 數(shù)據(jù)獲取與整合4.1 數(shù)據(jù)源存在的問題4.2 數(shù)據(jù)獲取4.2.1 數(shù)據(jù)獲取的方法4.2.2 數(shù)據(jù)質(zhì)量4.2.3 數(shù)據(jù)清潔4.3 數(shù)據(jù)整合4.3.1 數(shù)據(jù)整合的動因 4.3.2 數(shù)據(jù)整合的概念4.3.3 數(shù)據(jù)整合的主要工作4.3.4 數(shù)據(jù)整合的方式4.4 數(shù)據(jù)倉庫4.4.1 數(shù)據(jù)庫的局限4.4.2 基本概念4.4.3 數(shù)據(jù)組織4.5 小結第5章 數(shù)據(jù)挖掘5.1 數(shù)據(jù)挖掘的故事5.2 什么是數(shù)據(jù)挖掘5.2.1 數(shù)據(jù)挖掘的定義5.2.2 數(shù)據(jù)挖掘的過程5.3 數(shù)據(jù)挖掘的任務5.4 數(shù)據(jù)挖掘的類型5.4.1 一般數(shù)據(jù)源的挖掘5.4.2 特殊應用數(shù)據(jù)源的挖掘5.5 小結第6章 數(shù)據(jù)實驗6.1 數(shù)據(jù)觀察6.2 數(shù)據(jù)實驗及其目的6.2.1 什么是數(shù)據(jù)實驗6.2.2 數(shù)據(jù)實驗的目的6.3 數(shù)據(jù)實驗的步驟6.4 小結第7章 數(shù)據(jù)學應用7.1 科學研究信息化7.2 生物信息學7.2.1 生物數(shù)據(jù)管理與整合7.2.2 生物數(shù)據(jù)分析7.3 腦信息學7.3.1 腦信息學研究方法7.3.2 腦數(shù)據(jù)管理與整合7.4 其他信息學7.5 小結第8章 面臨的挑戰(zhàn)8.1 數(shù)據(jù)學理論體系8.1.1 觀察與猜想8.1.2 數(shù)據(jù)運算8.2 數(shù)據(jù)自然界與人8.2.1 在數(shù)據(jù)自然界中生活8.2.2 數(shù)據(jù)搜索8.2.3 數(shù)據(jù)真實性8.3 數(shù)據(jù)資源的保護與開發(fā)8.3.1 數(shù)據(jù)資源 8.3.2 數(shù)據(jù)資源的保護8.3.3 數(shù)據(jù)資源的開發(fā)8.4 小結參考文獻
章節(jié)摘錄
插圖:信息化的本質(zhì)是將現(xiàn)實世界中的事物以數(shù)據(jù)的形式存儲到計算機系統(tǒng)中,即信息化是一個生產(chǎn)數(shù)據(jù)的過程。這些數(shù)據(jù)是自然和生命的一種表示形式,這些數(shù)據(jù)還記錄了人類的行為,包括工作、生活和社會發(fā)展。今天,數(shù)據(jù)被快速大量地生產(chǎn)并存儲在計算機系統(tǒng)中,這種現(xiàn)象稱為數(shù)據(jù)爆炸(data explosion)。數(shù)據(jù)爆炸在計算機系統(tǒng)中形成數(shù)據(jù)自然界(data nature)。研究數(shù)據(jù)自然界是研究自然界(real nature)的一種有效方法,例如:可以通過研究數(shù)據(jù)來研究生命(生物信息學)、研究人類行為(行為信息學)。數(shù)據(jù)學(dataology)或數(shù)據(jù)科學(data science)是探索數(shù)據(jù)自然界奧秘的理論、方法和技術。本章介紹了數(shù)據(jù)爆炸、數(shù)據(jù)自然界和數(shù)據(jù)學的基本概念,并給出了數(shù)據(jù)學的定義及其基本框架。計算機系統(tǒng)中存放的是數(shù)據(jù),“數(shù)據(jù)”的含義很廣,不僅指工011、8084.這樣一些數(shù)字,還指“dataology”、“小舟揚帆出?!?、“11/11/11”等符號、字符、日期形式的數(shù)據(jù)。確切地說,本書討論的數(shù)據(jù)是指能夠輸入到計算機中的任何東西,如:數(shù)字、字符、聲音、圖像、照片,等等,并且處理數(shù)據(jù)的計算機程序本身也是“數(shù)據(jù)”。
編輯推薦
《數(shù)據(jù)學》主要內(nèi)容簡介:復旦大學出版社
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載