出版時間:2004-1 出版社:電子工業(yè)出版社 作者:Robert Tibshirani,Trevor Hastie,Jerome Friedman 頁數(shù):381
Tag標簽:無
前言
我們的書被范明教授、柴玉梅副教授和咎紅英講師翻譯成中文,我們感到非常高興。這意味我們的工作將有機會被更多人所了解——對于任何科學家,這都是令人期待和興奮的。在斯坦福大學統(tǒng)計學系,我們有許多講中文的研究生,他們使我們確信幾位譯者的翻譯非.常出色。借此機會,我們向所有的中國同仁問好,并希望他們喜歡本書。熱切期待我們的書在東方也能像在西方一樣受到熱烈歡迎。致以良好祝愿!
內(nèi)容概要
計算和信息技術的飛速發(fā)展帶來了醫(yī)學、生物學、財經(jīng)和營銷等諸多領域的海量數(shù)據(jù)。理解這些數(shù)據(jù)是一種挑戰(zhàn),這導致了統(tǒng)計學領域新工具的發(fā)展,并延伸到諸如數(shù)據(jù)挖掘、機器學習和生物信息學等新領域。許多工具都具有共同的基礎,但常常用不同的術語來表達。本書介紹了這些領域的一些重要概念。盡管應用的是統(tǒng)計學方法,但強調(diào)的是概念,而不是數(shù)學。許多例子附以彩圖。本書內(nèi)容廣泛,從有指導的學習(預測)到無指導的學習,應有盡有。包括神經(jīng)網(wǎng)絡、支持向量機、分類樹和提升等主題,是同類書籍中介紹得最全面的?! ”緯勺鳛楦叩仍盒O嚓P專業(yè)本科生和研究生的教材,對于統(tǒng)計學相關人員、科學界和業(yè)界關注數(shù)據(jù)挖掘的人,本書值得一讀。
書籍目錄
第1章 緒論第2章 有指導學習概述2.1 引言2.2 變量類型和術語2.3 兩種簡單預測方法:最小二乘方和最近鄰法2.4 統(tǒng)計判決理論2.5 高維空間的局部方法2.6 統(tǒng)計模型、有指導學習和函數(shù)逼近2.7 結(jié)構化回歸模型2.8 受限的估計方法類2.9 模型選擇和偏倚-方差權衡文獻注釋習題第3章 回歸的線性方法3.1 引言3.2 線性回歸模型和最小二乘方3.3 從簡單的一元回歸到多元回歸3.4 子集選擇和系數(shù)收縮3.5 計算考慮文獻注釋習題第4章 分類的線性方法4.1 引言4.2 指示矩陣的線性回歸4.3 線性判別分析4.4 邏輯斯締回歸4.5 分離超平面文獻注釋習題第5章 基展開與正則化5.1 引言5.2 分段多項式和樣條5.3 過濾和特征提取5.4 光滑樣條5.5 光滑參數(shù)的自動選擇5.6 無參邏輯斯締回歸5.7 多維樣條函數(shù)5.8 正則化和再生核希爾伯特空間5.9 小波光滑文獻注釋習題第6章 核方法6.1 一維核光滑方法6.2 選擇核的寬度6.3 IRp上的局部回歸6.4 IRp上結(jié)構化局部回歸模型6.5 局部似然和其他模型6.6 核密度估計和分類6.7 徑向基函數(shù)和核6.8 密度估計和分類的混合模型6.9 計算考慮文獻注釋習題第7章 模型評估與選擇7.1 引言7.2 偏倚、方差和模型復雜性7.3 偏倚-方差分解7.4 訓練誤差率的樂觀性7.5 樣本內(nèi)預測誤差的估計7.6 有效的參數(shù)個數(shù)7.7 貝葉斯方法和BIC7.8 最小描述長度7.9 Vapnik-Chernovenkis維7.10 交叉驗證7.11 自助法文獻注釋習題第8章 模型推理和平均8.1 引言8.2 自助法和極大似然法8.3 貝葉斯方法8.4 自助法和貝葉斯推理之間的聯(lián)系8.5 EM算法8.6 從后驗中抽樣的MCMC8.7 裝袋8.8 模型平均和堆棧8.9 隨機搜索:沖擊文獻注釋習題第9章 加法模型、樹和相關方法9.1 廣義加法模型9.2 基于樹的方法9.3 PRIM——凸點搜索9.4 MARS:多元自適應回歸樣條9.5 分層專家混合9.6 遺漏數(shù)據(jù)9.7 計算考慮文獻注釋習題第10章 提升和加法樹10.1 提升方法10.2 提升擬合加法模型10.3 前向分步加法建模10.4 指數(shù)損失函數(shù)和AdaBoost10.5 為什么使用指數(shù)損失10.6 損失函數(shù)和健壯性10.7 數(shù)據(jù)挖掘的“現(xiàn)貨”過程10.8 例:垃圾郵件數(shù)據(jù)10.9 提升樹10.10 數(shù)值優(yōu)化10.11 提升適當大小的樹10.12 正則化10.13 可解釋性10.14 實例文獻注釋習題第11章 神經(jīng)網(wǎng)絡11.1 引言11.2 投影尋蹤回歸11.3 神經(jīng)網(wǎng)絡11.4 擬合神經(jīng)網(wǎng)絡11.5 訓練神經(jīng)網(wǎng)絡的一些問題11.6 例:模擬數(shù)據(jù)11.7 例:ZIP編碼數(shù)據(jù)11.8 討論11.9 計算考慮文獻注釋習題第12章 支持向量機和柔性判別12.1 引言12.2 支持向量分類器12.3 支持向量機12.4 線性判別分析的推廣12.5 柔性判別分析12.6 罰判別分析12.7 混合判別分析12.8 計算考慮文獻注釋習題第13章 原型方法和最近鄰13.1 引言13.2 原型方法13.3 K-最近鄰分類器13.4 自適應的最近鄰方法13.5 計算考慮文獻注釋習題第14章 無指導學習14.1 引言14.2 關聯(lián)規(guī)則14.3 聚類分析14.4 自組織映射14.5 主成分、曲線和曲面14.6 獨立成分分析和探測性投影尋蹤14.7 多維定標文獻注釋習題術語表參考文獻
編輯推薦
隨著計算機和信息時代的到來,統(tǒng)計問題的規(guī)模和復雜性都有了急劇增加。數(shù)據(jù)存儲、組織和檢索領域的挑戰(zhàn)導致一個新領域“數(shù)據(jù)挖掘”的產(chǎn)生。數(shù)據(jù)挖掘是一個多學科交叉領域,涉及數(shù)據(jù)庫技術、機器學習、統(tǒng)計學、神經(jīng)網(wǎng)絡、模式識別、知識庫、信息提取、高性能計算等諸多領域,并在工業(yè)、商務、財經(jīng)、通信、醫(yī)療衛(wèi)生、生物工程、科學等眾多行業(yè)得到了廣泛的應用。 本書試圖將學習領域中許多重要的新思想?yún)R集在一起,并且在統(tǒng)計學的框架下解釋它們。盡管有些數(shù)學細節(jié)是必要的,但本書強調(diào)的是方法和它們的概念基礎,而不是理論性質(zhì)。本書內(nèi)容廣泛,從有指導的學習(預測)到無指導的學習,應有盡有。包括神經(jīng)網(wǎng)絡、支持向量機、分類樹和提升等主題,是同類書籍中介紹得最全面的,適合從事數(shù)據(jù)挖掘和機器學習研究的讀者閱讀。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載