出版時間:2011-9 出版社:人民郵電 作者:杜強//賈麗艷 頁數(shù):523
Tag標簽:無
內容概要
《SPSS統(tǒng)計分析從入門到精通》使用IBM SPSS Statistics
19.0進行講解和操作,致力于使讀者全面了解SPSS,了解和學習如何使用SPSS進行數(shù)據(jù)融合、數(shù)據(jù)分析、結果展示等工作。《SPSS統(tǒng)計分析從入門到精通》介紹的是SPSS的窗口和對話框操作方式,著重于介紹SPSS分析軟件的實際應用。
全書25章,第1~3章重點講解了數(shù)據(jù)和文件的管理操作,以及SPSS系統(tǒng)環(huán)境的設置。第4~18章主要介紹各種統(tǒng)計分析方法及對應的操作方式,包括描述性統(tǒng)計、均值比較、一般線性模型、相關分析、回歸分析、對數(shù)線性模型、聚類分析、生存分析、時間序列分析、多重響應分析等幾大類。第19章介紹各種統(tǒng)計圖形的生成和編輯。第20~25章列舉了用SPSS處理多種行業(yè)數(shù)據(jù)的案例,包括上市公司財務數(shù)據(jù)分析、影響匯率的因素分析、多因素試驗設計等多方面的應用。
《SPSS統(tǒng)計分析從入門到精通》適應自然科學和社會科學各領域、各專業(yè)研究人員的多層次需要,可供相關專業(yè)本科生、研究生、專業(yè)統(tǒng)計分析人士以及管理人員和決策者等學習與參考。
書籍目錄
第1章 SPSS 19.0概述
1.1 SPSS簡介
1.2 SPSS的安裝、啟動和退出
1.2.1 SPSS 19.0的安裝
1.2.2 SPSS 19.0的啟動
1.2.3 SPSS 19.0的退出
1.3 SPSS 19.0的界面及設置
1.3.1 常用界面
1.3.2 常規(guī)選項參數(shù)
1.3.3 查看器選項參數(shù)
1.3.4 文件位置選項參數(shù)
1.3.5 輸出選項參數(shù)
1.3.6 圖表選項參數(shù)
1.3.7 多重歸因選項參數(shù)
1.3.8 樞紐表選項參數(shù)
1.3.9 數(shù)據(jù)選項參數(shù)
1.3.10 貨幣選項參數(shù)
1.3.11 腳本選項參數(shù)
1.3.12 語法編輯器選項參數(shù)
第2章 數(shù)據(jù)文件的建立與操作
2.1 數(shù)據(jù)編輯器與數(shù)據(jù)文件
2.1.1 數(shù)據(jù)編輯器
2.1.2 數(shù)據(jù)文件
2.2 常量、變量、操作符和表達式
2.2.1 常量與變量
2.2.2 操作符與表達式
2.2.3 如何定義一個變量
2.2.4 概率事件
2.3 輸入數(shù)據(jù)
2.3.1 輸入數(shù)據(jù)的方法
2.3.2 查看文件信息和變量信息
2.4 編輯數(shù)據(jù)文件
2.4.1 在單元格中編輯數(shù)據(jù)
2.4.2 插入變量與刪除變量
2.4.3 插入觀測量與刪除觀測量
2.4.4 數(shù)據(jù)的剪切、復制和粘貼
2.4.5 撤銷操作
2.5 對數(shù)據(jù)文件的操作
2.5.1 數(shù)據(jù)文件的打開與保存
2.5.2 數(shù)據(jù)庫文件的轉換
習題2
第3章 數(shù)據(jù)文件的操作
3.1 數(shù)據(jù)文件的一般操作
3.1.1 數(shù)據(jù)排序
3.1.2 數(shù)據(jù)文件的拆分
3.1.3 數(shù)據(jù)文件的合并
3.1.4 數(shù)據(jù)文件的轉置
3.1.5 變量取值的求秩
3.1.6 變量值的重新編碼
3.1.7 計算新變量
3.2 分類匯總
3.2.1 數(shù)據(jù)描述
3.2.2 分類匯總的參數(shù)設置
3.2.3 分類匯總的結果
3.3 觀測量的加權
3.4 數(shù)據(jù)文件的結構重組
3.4.1 選擇數(shù)據(jù)重組方式
3.4.2 變量組到觀測量組的重組
3.4.3 觀測量組到變量組的重組
3.4.4 轉置重組
習題3
第4章 基本統(tǒng)計分析功能
4.1 OLAP在線分析過程
4.1.1 數(shù)據(jù)描述
4.1.2 OLAP過程的操作和設置
4.2 個案匯總分析
4.2.1 個案匯總分析的參數(shù)設置
4.2.2 輸出結果
4.3 按行和列的匯總分析
4.3.1 按行匯總過程
4.3.2 按列匯總過程
4.4 頻數(shù)分析
4.4.1 數(shù)據(jù)描述
4.4.2 對分類變量的頻數(shù)分析
4.4.3 對連續(xù)變量的頻數(shù)分析
4.5 描述性統(tǒng)計分析
4.5.1 數(shù)據(jù)描述
4.5.2 描述分析過程
4.6 探索分析過程
4.6.1 數(shù)據(jù)描述
4.6.2 探索分析實例
4.7 列聯(lián)表分析過程
4.7.1 數(shù)據(jù)描述
4.7.2 列聯(lián)表分析的參數(shù)設置
4.7.3 列聯(lián)表分析的輸出結果
4.8 Bootstrap簡介與設置
4.8.1 Bootstrap簡介
4.8.2 Bootstrap參數(shù)設置
習題4
第5章 均值比較和T檢驗
5.1 均值分析過程
5.1.1 原理與方法
5.1.2 SPSS實例分析
5.2 單樣本T檢驗
5.2.1 原理與方法
5.2.2 SPSS實例分析
5.3 獨立樣本T檢驗
5.3.1 原理與方法
5.3.2 SPSS實例分析
5.4 配對樣本T檢驗
5.4.1 原理與方法
5.4.2 SPSS實例分析
習題5
第6章 非參數(shù)檢驗
6.1 非參數(shù)檢驗的簡介
6.1.1 非參數(shù)檢驗與參數(shù)檢驗
6.1.2 非參數(shù)檢驗的優(yōu)點
6.1.3 非參數(shù)檢驗的缺點
6.2 卡方檢驗
6.2.1 原理與方法
6.2.2 數(shù)據(jù)和問題描述
6.2.3 卡方檢驗實例分析
6.3 二項式檢驗
6.3.1 原理與方法
6.3.2 數(shù)據(jù)和問題描述
6.3.3 二項檢驗實例分析
6.4 游程檢驗
6.4.1 原理與方法
6.4.2 數(shù)據(jù)和問題描述
6.4.3 游程檢驗實例分析
6.5 Kolmogorov-Smirnov單樣本檢驗
6.5.1 原理與方法
6.5.2 數(shù)據(jù)和問題描述
6.5.3 K-S單樣本檢驗實例分析
6.6 兩獨立樣本檢驗
6.6.1 原理與方法
6.6.2 數(shù)據(jù)和問題描述
6.6.3 兩獨立樣本檢驗實例分析
6.7 k個獨立樣本的檢驗
6.7.1 原理與方法
6.7.2 數(shù)據(jù)和問題描述
6.7.3 k個獨立樣本檢驗實例分析
6.8 兩個相關樣本的檢驗
6.8.1 原理與方法
6.8.2 數(shù)據(jù)和問題描述
6.8.3 兩個相關樣本檢驗的實例分析
6.9 k個相關樣本的檢驗
6.9.1 原理與方法
6.9.2 數(shù)據(jù)和問題描述
6.9.3 k個相關樣本檢驗的實例分析
習題6
第7章 多重響應分析
7.1 多重響應概述
7.2 多重響應變量集的定義
定義多重響應變量集的實例
7.3 多重響應變量集的頻率分析
多重響應變量頻數(shù)分析的實例
7.4 多重響應變量集的交叉表分析
多重響應變量交叉表分析的實例
7.5 用表過程研究多重響應變量集
7.5.1 多重響應變量集的定義
7.5.2 建立包含多重響應變量集的表格
習題7
第8章 回歸分析
8.1 線性回歸
8.1.1 一元線性回歸的基本原理
8.1.2 多元線性回歸的基本原理
8.1.3 模型假設的其他檢驗
8.1.4 問題描述和數(shù)據(jù)準備
8.1.5 線性回歸分析的設置和操作
8.1.6 案例的結果分析
8.2 曲線回歸
8.2.1 曲線回歸的基本原理
8.2.2 問題描述和數(shù)據(jù)準備
8.2.3 曲線回歸分析的設置和操作
8.2.4 案例的結果分析
8.3 非線性回歸
8.3.1 非線性回歸簡介
8.3.2 問題描述和數(shù)據(jù)準備
8.3.3 非線性回歸的參數(shù)設置
8.3.4 案例的結果分析
8.4 二元Logistic回歸
8.4.1 二元Logistic回歸的數(shù)學原理
8.4.2 問題描述和數(shù)據(jù)準備
8.4.3 二元Logistic回歸的參數(shù)設置
8.4.4 案例的結果分析
8.5 多元Logistic回歸分析
8.5.1 多元Logistic回歸的原理簡介
8.5.2 問題描述和數(shù)據(jù)準備
8.5.3 多元Logistic回歸參數(shù)設置
8.5.4 案例的結果分析
8.6 有序回歸
8.6.1 問題描述和數(shù)據(jù)準備
8.6.2 有序回歸的參數(shù)設置
8.6.3 案例的結果分析
8.7 概率單位回歸分析
8.7.1 概率單位回歸分析簡介
8.7.2 問題描述和數(shù)據(jù)準備
8.7.3 概率單位回歸的參數(shù)設置
8.7.4 案例的結果分析
8.8 加權回歸分析
8.8.1 加權回歸分析簡介
8.8.2 問題描述和數(shù)據(jù)準備
8.8.3 加權回歸的參數(shù)設置
8.8.4 案例結果分析
8.9 二階段最小二乘回歸
8.9.1 二階段最小二乘回歸的基本原理
8.9.2 問題描述和數(shù)據(jù)準備
8.9.3 二階段最小二乘回歸的參數(shù)設置
8.9.4 案例的結果分析
8.10 最佳尺度回歸
8.10.1 最佳尺度回歸原理
8.10.2 問題描述和數(shù)據(jù)準備
8.10.3 最佳尺度回歸的參數(shù)設置
8.10.4 案例的結果分析
習題8
第9章 方差分析
9.1 方差分析簡介
9.1.1 t檢驗與方差分析的比較
9.1.2 方差分析的基本原理
9.2 單因素方差分析
9.2.1 原理與方法
9.2.2 單因素方差分析實例
9.3 多因素方差分析過程
9.3.1 原理與方法
9.3.2 二因素方差分析實例
9.3.3 協(xié)方差分析實例
9.3.4 交互效應中隨機因素的分析
9.4 多元方差分析
9.4.1 原理與方法
9.4.2 多元方差分析實例
9.5 重復測量設計的方差分析
9.5.1 原理與方法
9.5.2 SPSS實例分析
9.6 方差成分分析
9.6.1 原理簡介
9.6.2 SPSS實例分析
9.7 正交實驗設計
9.7.1 正交實驗設計簡述
9.7.2 SPSS實例分析
9.7.3 正交實驗設計的方差分析
習題9
第10章 相關分析
10.1 相關分析的基本概念
10.1.1 相關分析的特點和應用
10.1.2 相關系數(shù)的計算
10.1.3 SPSS提供的相關分析功能
10.2 兩變量相關分析
10.2.1 問題描述和數(shù)據(jù)準備
10.2.2 相關分析的參數(shù)設置
10.2.3 案例的結果分析
10.3 偏相關分析
10.3.1 偏相關分析的基本原理
10.3.2 偏相關分析實例
10.4 距離分析
10.4.1 距離分析的基本概念
10.4.2 距離分析的參數(shù)設置
10.4.3 距離分析實例
習題10
第11章 因子分析
11.1 因子分析的原理簡介
11.1.1 因子分析的基本思想
11.1.2 因子分析和主成分分析的聯(lián)系
11.1.3 因子分析的基本步驟
11.2 SPSS因子分析的應用實例
11.2.1 數(shù)據(jù)描述
11.2.2 SPSS因子分析過程的設置
11.2.3 結果分析
習題11
第12章 分類分析
12.1 聚類分析的原理簡介
12.1.1 聚類分析的基本概念
12.1.2 聚類分析的一般原理
12.2 快速樣本聚類過程
12.2.1 快速聚類簡介
12.2.2 問題描述和數(shù)據(jù)準備
12.2.3 SPSS快速聚類的設置
12.2.4 案例的結果分析
12.3 系統(tǒng)聚類
12.3.1 系統(tǒng)聚類簡介
12.3.2 問題描述和數(shù)據(jù)準備
12.3.3 SPSS系統(tǒng)聚類的設置
12.3.4 案例的結果分析
12.3.5 對聚類結果的進一步分析
12.4 兩步聚類分析
12.4.1 兩步聚類簡介
12.4.2 問題描述和數(shù)據(jù)準備
12.4.3 SPSS兩步聚類的設置
12.4.4 案例的結果分析
12.5 一般判別分析
12.5.1 判別分析的基本原理
12.5.2 問題描述和數(shù)據(jù)準備
12.5.3 判別分析的參數(shù)設置
12.5.4 案例的結果分析
12.6 逐步判別分析實例
12.6.1 問題描述和數(shù)據(jù)準備
12.6.2 逐步判別的參數(shù)設置
12.6.3 案例的結果分析
12.7 決策樹分析
12.7.1 決策樹分類的基本原理
12.7.2 決策樹過程的參數(shù)設置
12.7.3 問題描述和數(shù)據(jù)準備
12.7.4 案例分析
習題12
第13章 生存分析
13.1 生存分析簡介
13.1.1 生存分析的基本概念
13.1.2 生存分析的數(shù)據(jù)特點
13.1.3 生存分析的常用方法
13.1.4 SPSS中的生存分析過程
13.2 壽命表分析
13.2.1 壽命表分析簡介
13.2.2 壽命表分析的基本步驟
13.2.3 壽命表實例分析
13.3 Kaplan-Meier分析
13.3.1 Kaplan-Meier分析的步驟
13.3.2 生存曲線的比較和檢驗
13.3.3 Kaplan-Meier分析的實例
13.4 Cox回歸模型
13.4.1 Cox回歸模型的原理簡介
13.4.2 Cox回歸實例分析
習題13
第14章 信度分析
14.1 信度分析
14.1.1 信度分析的基本原理
14.1.2 問題描述和數(shù)據(jù)準備
14.1.3 信度分析的參數(shù)設置
14.1.4 案例的結果分析
14.2 多維尺度分析
14.2.1 多維尺度分析簡介
14.2.2 問題描述和數(shù)據(jù)準備
14.2.3 ALSCAL過程的參數(shù)設置
14.2.4 案例的結果分析
習題14
第15章 時間序列分析
15.1 SPSS的時間序列分析概覽
15.1.1 創(chuàng)建模型的通用設置選項
15.1.2 應用模型的通用設置選項
15.2 時間序列數(shù)據(jù)的預分析
15.2.1 缺失值替換
15.2.2 定義日期變量
15.2.3 時間序列的平穩(wěn)化
15.3 指數(shù)平滑模型
15.3.1 指數(shù)平滑的基本原理
15.3.2 指數(shù)平滑模型的參數(shù)設置
15.3.3 指數(shù)平滑模型實例分析
15.4 ARIMA模型
15.4.1 ARIMA模型的基本原理
15.4.2 ARIMA模型的參數(shù)設置
15.4.3 ARIMA模型實例分析
15.5 季節(jié)分解模型
15.5.1 季節(jié)分解法概述
15.5.2 季節(jié)分解模型實例分析
習題15
第16章 對數(shù)線性模型
16.1 對數(shù)線性模型概述
16.1.1 簡單列聯(lián)表分析的不足
16.1.2 對數(shù)線性模型的基本形式
16.2 常規(guī)對數(shù)線性模型過程
16.2.1 常規(guī)過程概述
16.2.2 問題描述和數(shù)據(jù)準備
16.2.3 常規(guī)過程的參數(shù)設置
16.2.4 案例的結果分析
16.3 Logit過程
16.3.1 Logit過程概述
16.3.2 問題描述和數(shù)據(jù)準備
16.3.3 Logit過程的參數(shù)設置
16.3.4 案例的結果分析
16.4 模型選擇過程
16.4.1 模型選擇過程概述
16.4.2 問題描述和數(shù)據(jù)準備
16.4.3 層次對數(shù)線性模型的操作過程
16.4.4 案例的結果分析
習題16
第17章 對應分析
17.1 對應分析的基本原理
17.1.1 對應分析與因子分析
17.1.2 SPSS中的對應分析
17.1.3 使用對應分析的注意事項
17.2 簡單對應分析
17.2.1 簡單對應分析的數(shù)學原理
17.2.2 SPSS簡單對應分析實例
17.3 多元對應分析
17.3.1 多元對應分析基本概念及其特點
17.3.2 多元對應分析的參數(shù)設置
17.3.3 實例的結果分析
習題17
第18章 缺失值分析
18.1 缺失值分析的概念
18.1.1 缺失值的表現(xiàn)方式
18.1.2 SPSS中的缺失值處理方法
18.2 缺失值分析的參數(shù)設置
18.3 缺失值分析的實例
習題18
第19章 統(tǒng)計圖形
19.1 概述
19.1.1 數(shù)據(jù)和變量的準備
19.1.2 圖表構建程序的基本操作
19.1.3 舊對話框作圖
19.1.4 圖形的編輯
19.2 條形圖
19.2.1 數(shù)據(jù)和問題描述
19.2.2 用圖表構建程序作條形圖
19.2.3 用對話框創(chuàng)建條形圖
19.3 線形圖
19.3.1 數(shù)據(jù)和問題描述
19.3.2 用圖表構建程序作線形圖
19.3.3 用對話框創(chuàng)建線形圖
19.4 面積圖
19.4.1 數(shù)據(jù)和問題描述
19.4.2 用圖表構建程序作面積圖
19.4.3 用對話框創(chuàng)建面積圖
19.5 餅圖
19.5.1 數(shù)據(jù)和問題描述
19.5.2 用圖表構建程序作餅圖
19.5.3 用對話框創(chuàng)建餅圖
19.6 高低圖
19.6.1 數(shù)據(jù)和問題描述
19.6.2 用圖表構建程序作高低圖
19.6.3 用對話框創(chuàng)建高低圖
19.7 帕累托圖
19.7.1 數(shù)據(jù)和問題描述
19.7.2 用對話框創(chuàng)建帕累托圖
19.8 控制圖
19.8.1 數(shù)據(jù)和問題描述
19.8.2 用對話框創(chuàng)建控制圖
19.9 箱圖
19.9.1 數(shù)據(jù)和問題描述
19.9.2 用圖表構建程序作箱圖
19.9.3 用對話框創(chuàng)建箱圖
19.10 誤差條圖
19.10.1 數(shù)據(jù)和問題描述
19.10.2 用對話框創(chuàng)建誤差條圖
19.11 散點圖
19.11.1 數(shù)據(jù)和問題描述
19.11.2 用圖表構建程序作散點圖
19.11.3 用對話框創(chuàng)建散點圖
19.12 直方圖
19.12.1 數(shù)據(jù)和問題描述
19.12.2 用圖表構建程序作直方圖
19.13 P-P概率圖
19.13.1 數(shù)據(jù)和問題描述
19.13.2 用對話框創(chuàng)建P-P概率圖
19.14 Q-Q概率圖
19.14.1 數(shù)據(jù)和問題描述
19.14.2 用對話框創(chuàng)建Q-Q概率圖
19.15 時間序列圖
19.15.1 普通序列圖
19.15.2 自相關序列圖
19.15.3 互相關序列圖
19.16 雙軸線圖
19.16.1 數(shù)據(jù)和問題描述
19.16.2 用圖表構建程序作雙軸線圖
習題19
第20章 上市公司財務危機預警分析
20.1 財務危機預警的應用簡介
20.1.1 財務危機的定量定義方法
20.1.2 財務危機預警的模型選擇
20.2 數(shù)據(jù)描述
20.2.1 數(shù)據(jù)說明
20.2.2 指標選擇
20.2.3 補充說明
20.3 分析方法概述
20.3.1 判別分析
20.3.2 logistic回歸方法
20.4 SPSS建模過程和結論分析
20.4.1 SPSS數(shù)據(jù)篩選操作
20.4.2 SPSS判別分析建模與分析
20.4.3 logistic回歸建模與分析
20.5 進一步的分析與應用
20.5.1 分類結果的應用分析
20.5.2 建模方法的改進
20.6 建議和推廣
20.6.1 時間序列研究
20.6.2 數(shù)據(jù)的有效預警期
20.6.3 指標的簡化方法
第21章 影響匯率的因素分析
21.1 匯率影響因素的簡介
21.2 數(shù)據(jù)描述
21.3 分析方法概述
21.3.1 探索性分析
21.3.2 多元回歸分析
21.4 SPSS建模過程和結論分析
21.4.1 數(shù)據(jù)準備
21.4.2 探索性分析
21.4.3 多元回歸分析
21.5 進一步的分析與應用
21.5.1 剔除存在共線性的外匯儲備變量
21.5.2 回歸模型的進一步改進
21.5.3 兩個回歸模型的比較
21.6 建議和推廣
21.6.1 時間序列研究
21.6.2 匯率影響因素的定性分析
第22章 因子分析在成績綜合評價中的應用
22.1 學生成績的綜合評價簡介
22.2 數(shù)據(jù)描述
22.3 分析方法概述
22.3.1 應用因子分析進行成績綜合評價的步驟
22.3.2 應用因子分析法進行成績綜合評價的注意事項
22.4 SPSS建模過程和結論分析
22.4.1 數(shù)據(jù)準備
22.4.2 SPSS因子分析建模與分析
22.5 進一步的分析與應用
22.6 建議和推廣
22.6.1 高中生的成績綜合評價
22.6.2 對缺失數(shù)據(jù)的處理
22.6.3 多種方法結合的綜合評價模型
第23章 高等教育辦學條件的聚類分析
23.1 數(shù)據(jù)描述
23.1.1 關于基本辦學條件指標合格與否的判定
23.1.2 指標選取
23.1.3 數(shù)據(jù)格式
23.2 聚類分析法簡述
23.3 SPSS建模過程和結論分析
23.3.1 對??圃盒_M行聚類的設置操作
23.3.2 對本科院校的分析
23.4 建議和推廣
第24章 試卷信度的檢驗與分析
24.1 試卷信度檢驗的背景簡介
24.1.1 測驗內容的自身方面
24.1.2 施測過程
24.1.3 被測試者的自身因素
24.2 數(shù)據(jù)描述
24.3 分析方法概述
24.3.1 試卷信度的基本計算公式
24.3.2 試卷信度的估計方法
24.4 SPSS建模過程和結論分析
24.4.1 SPSS信度分析的參數(shù)設置
24.4.2 結果分析
24.5 建議和推廣
第25章 多因素試驗的設計與分析
25.1 試驗設計簡介
25.1.1 試驗設計的應用
25.1.2 試驗設計問題的解決步驟
25.2 數(shù)據(jù)描述
25.3 分析方法概述
25.3.1 正交設計方法
25.3.2 綜合評分方法
25.4 SPSS建模過程和結論分析
25.4.1 數(shù)據(jù)標準化
25.4.2 性能指標權重的確定
25.4.3 利用權重求綜合指標
25.4.4 對綜合得分的進一步分析
25.5 建議和推廣
習題提示
參考文獻
章節(jié)摘錄
版權頁:插圖:決策樹一般分為兩大類型。分類決策樹主要用于對離散因變量的分類;回歸決策樹主要用于對連續(xù)因變量的預測??梢姏Q策樹主要應用于分類和預測分析中,例如判斷某些顧客是否為理想的潛在客戶;預測具有某種特征的客戶在未來的消費金額等。用決策樹對一個新的觀測作預測時,它自動根據(jù)輸入變量的取值決定穿越?jīng)Q策樹并達到最終葉節(jié)點的路徑;如果是分類樹,就根據(jù)最終節(jié)點的因變量取值確定對新觀測的分類,并給出相應的可信度;如果是回歸樹,就計算最終節(jié)點里的因變量均值作為對新觀測的預測值。決策樹模型有各種各樣的算法,但各自都有一些優(yōu)勢和不足。一般地,決策樹算法主要圍繞兩大核心問題展開。第一,決策樹的生長問題,即利用訓練樣本集建立決策樹的過程;第二,決策樹的剪枝問題,即如何對建立的初始決策樹進行節(jié)點合并及優(yōu)化處理。下面就對這兩個方面加以簡要介紹。2.決策樹的生長決策樹生長的本質是一個對訓練樣本集不斷分組的過程,樹上的分枝正是在這個過程中逐漸生長出來的。當所有分枝的數(shù)據(jù)均無法繼續(xù)細分時,一棵完整的決策樹就形成了。決策樹生長的核心算法就是確定它的分枝準則,這涉及兩方面的問題。第一,如何從眾多的輸入變量中選擇一個最佳的分枝變量;第二,如何從指定分枝變量的眾多取值中找到一個最佳的分枝閾值?,F(xiàn)已有很多算法實現(xiàn)決策樹的生長,例如ID3、C4.5/C5、CHAID、CRT等,它們大都能夠在常用的數(shù)據(jù)挖掘軟件中找到,用戶在使用時,只需要設置或調整幾個簡單的參數(shù),就能方便地建立決策樹模型,同時完成對決策樹的優(yōu)化處理。3.決策樹的修剪隨著決策樹的生長,葉節(jié)點含有的樣本量不斷減少,它們對總體的代表性也不斷降低,越深處的節(jié)點所體現(xiàn)的特征就越具體,一般性也越差,甚至可能出現(xiàn)如此的結論:只有年收入大于50000元、年齡大于50歲,且姓名是張三的人,才是企業(yè)的理想客戶。
編輯推薦
《SPSS統(tǒng)計分析從入門到精通》上海軟件行業(yè)協(xié)會秘書長楊根興,江蘇省軟件行業(yè)協(xié)會副會長徐雷鼎力推薦全面展示新版本SPSS的功能應用。包括各種數(shù)據(jù)分析應用的實例,從基本的描述統(tǒng)計、相關分析、回歸分析等,到高級的生存分析、時序分析、決策樹分析等。6個完整的案例,幫助讀者盡快融入實戰(zhàn)。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載