出版時間:2010-6 出版社:人民郵電出版社 作者:杜強,賈麗艷 編著 頁數(shù):330
Tag標簽:無
前言
商業(yè)分析正在逐步地取代傳統(tǒng)意義上的商業(yè)智能概念,在傳統(tǒng)的商業(yè)智能技術(shù)之上增加了高等分析部分,就是預(yù)測和優(yōu)化部分。在過去的幾年間,國際軟件巨頭不斷地吞噬BI和分析軟件廠商,真正地表明了將來商業(yè)應(yīng)用軟件的發(fā)展趨勢,也應(yīng)了中國那句通俗的說法,吃啥補啥。從被廣大業(yè)務(wù)人員普遍使用的Excel到為高層管理人員提供服務(wù)的優(yōu)化軟件SAS/OR.,這才真正覆蓋了從普通業(yè)務(wù)人員到高級決策管理人員對業(yè)務(wù)分析的需求。隨著業(yè)務(wù)復(fù)雜性的增加,預(yù)測和決策變得越來越困難,很大程度上要依賴于商業(yè)分析的手段。全球的數(shù)據(jù)存儲量每年正在以60%的速度增長,目前已經(jīng)達到了1021的量級,即將進入到1024的量級。很多企業(yè)的數(shù)據(jù)也達到了1012以上的級別。大量數(shù)據(jù)的存儲已經(jīng)成為企業(yè)的一種負擔,不將其轉(zhuǎn)變成有價值的財產(chǎn),就是一種浪費。通過正確的分析手段,這些數(shù)據(jù)就可以變成企業(yè)有用的信息和競爭優(yōu)勢。SAS將軟件的分析能力分成了8個級別。他們分別是:標準化的報告、專用報告、查詢鉆取、警示、統(tǒng)計分析、預(yù)測(prediction)、時間序列預(yù)測模型(forecasting)、優(yōu)化。目前,市場上大部分分析軟件可以提供前4級功能,即可以提供過去發(fā)生的歷史數(shù)據(jù),但不是對將要發(fā)生事件的洞察力。對于簡單的業(yè)務(wù)問題,這些軟件就能滿足需要。但是,如果更復(fù)雜的問題,要求有預(yù)見性的洞察力時,你就需要有后4級功能的軟件。更好一點,如果你能夠?qū)W會所有這些技術(shù),能夠辨別不同情況下使用什么分析工具,你就能體會到什么是商業(yè)上的真正智能。在數(shù)據(jù)處理和統(tǒng)計分析領(lǐng)域,SAS軟件被公認為是標準軟件,是分析軟件的高端產(chǎn)品。SAS軟件是美國食品藥品管理局的認定產(chǎn)品,在國內(nèi)外有廣泛的崇拜者,它極大地滿足了人們對數(shù)據(jù)神秘性認知的興趣。在過去30幾年的實踐應(yīng)用中,SAS軟件被廣泛地應(yīng)用在政府的經(jīng)濟決策和企業(yè)的經(jīng)營決策中。目前,SAS已經(jīng)遍布全球113個國家。SAS產(chǎn)品被廣泛地使用在金融、醫(yī)藥、通訊、科學(xué)研究、物流、零售業(yè)、政府和教育等領(lǐng)域。AS軟件通常被認為是難學(xué)的。首先,SAS軟件是一個龐大的體系,讓人不知道從何入手;其次,要想掌握好SAS,必須學(xué)習SAS編程語言,這讓許多沒有接觸過SAS的人產(chǎn)生某種畏懼感;最后,由于SAS產(chǎn)品較高的價格,使得很多企業(yè)和機構(gòu)都沒有這種軟件,這就更增加了它的神秘感。雖然,SAS軟件在市場上有較高的認知度,但由于上面的因素,很多人只好忍痛割愛,選擇一種易用的軟件。本書作者根據(jù)自己使用SAS的經(jīng)驗編寫了這本《SAS統(tǒng)計分析標準教程》,它非常適合初學(xué)者,教你如何從數(shù)據(jù)入手,通過SAS的圖形界面導(dǎo)出所需要的分析結(jié)果。同時,作者還給出了SAS程序,這有利于讀者在學(xué)習SAS軟件的同時學(xué)習SAS編程語言。初學(xué)者只要按照書上給出的步驟,就可以學(xué)習統(tǒng)計分析的過程,獲得分析結(jié)果。從本書的易用性上就可以看出SAS軟件其實并不難學(xué)。根據(jù)我們的實踐統(tǒng)計,新加入SAS公司的員工,通常通過一個月的學(xué)習就可以通過SAS基礎(chǔ)編程認證考試。現(xiàn)在,SAS系統(tǒng)已經(jīng)做到了非常好用,簡潔。
內(nèi)容概要
本書系統(tǒng)地介紹了如何使用SAS/Analyst模塊、SAS/EM模塊以及SAS編程執(zhí)行常用的統(tǒng)計分析功能,用可視化的圖形操作和靈活的編程兩種方式向讀者展示了SAS的強大功能。書中涉及的統(tǒng)計方法包括探索性分析、假設(shè)檢驗、方差分析、非參數(shù)檢驗、回歸分析、聚類分析、判別分析、因子分析、時間序列分析等,且每種方法都配有經(jīng)典的案例分析,讀者可在具體的操作過程中掌握用SAS解決實際問題的方法。每章最后都給出一些例題,供讀者練習與提高。最后幾章還給出了SAS在數(shù)據(jù)預(yù)測、市場與銷售研究、分類分析這3個方面的多個實用案例,供讀者參考和研究。 本書光盤中提供了書中案例使用的數(shù)據(jù)文件,以及大多數(shù)案例的操作視頻,以方便讀者學(xué)習和使用?! ⊥ㄟ^本書,讀者可以學(xué)會如何用SAS軟件進行數(shù)據(jù)管理和統(tǒng)計分析。本書既可作為一般統(tǒng)計課程的參考用書,也可供大中專院校的老師和學(xué)生、數(shù)據(jù)分析人員以及希望通過數(shù)據(jù)輔助科學(xué)決策的有關(guān)人士閱讀參考。
書籍目錄
第1章 SAS基本操作 1.1 SAS的常用界面 1.2 菜單功能簡介 1.2.1 Assist模塊 1.2.2 Desktop模塊 1.2.3 Analyst模塊 1.3 SAS編程基礎(chǔ) 1.3.1 SAS語句的基本結(jié)構(gòu) 1.3.2 SAS語句的數(shù)據(jù)步驟 1.3.3 SAS語句的過程步驟 1.3.4 SAS語句的運行與調(diào)試 1.3.5 SAS編程的控制語句 1.3.6 SAS/IML語言簡介 習題 第2章 建立數(shù)據(jù)文件 2.1 圖形界面建立數(shù)據(jù)集 2.1.1 邏輯庫與數(shù)據(jù)集概述 2.1.2 Analyst建立數(shù)據(jù)集 2.2 DATA步驟建立數(shù)據(jù)集 2.2.1 直接輸入數(shù)據(jù) 2.2.2 格式化輸入 2.2.3 從文件讀入數(shù)據(jù) 2.3 導(dǎo)入外部數(shù)據(jù) 2.3.1 使用向?qū)?dǎo)入 2.3.2 使用IMPORT語句 習題 第3章 常用的數(shù)據(jù)文件操作 3.1 數(shù)據(jù)集的編輯與整理 3.1.1 復(fù)制數(shù)據(jù)集 3.1.2 增加變量 3.1.3 篩選變量 3.1.4 更改變量屬性 3.2 數(shù)據(jù)集排序 3.3 數(shù)據(jù)集的拆分與合并 3.3.1 數(shù)據(jù)集的拆分 3.3.2 數(shù)據(jù)集的縱向合并 3.3.3 數(shù)據(jù)集的橫向合并 3.4 數(shù)據(jù)集的篩選 3.4.1 Analyst篩選數(shù)據(jù)集 3.4.2 DATA步驟篩選數(shù)據(jù)集 3.5 數(shù)據(jù)轉(zhuǎn)置 3.6 使用Datasets步驟管理數(shù)據(jù)集 習題 第4章 描述性統(tǒng)計分析 4.1 描述性統(tǒng)計分析簡介 4.1.1 描述性統(tǒng)計分析概述 4.1.2 SAS中的描述性過程 4.2 案例描述——考試成績分析 4.3 SAS/Analyst描述性統(tǒng)計分析 4.3.1 頻率分析 4.3.2 變量分布分析 4.3.3 圖形分析 4.4 編程分析過程 4.4.1 MEANS過程 4.4.2 FREQ過程 4.4.3 UNIVARIATE過程 4.4.4 TABULATE過程 4.4.5 GCHART過程 4.4.6 GPLOT過程 習題 第5章 均值比較和假設(shè)檢驗 5.1 假設(shè)檢驗問題簡介 5.2 單樣本的均值Z檢驗 5.2.1 基本原理 5.2.2 案例描述——袋裝食品的重量檢驗1 5.2.3 SAS/Analyst單樣本均值Z檢驗 5.3 單樣本的均值t檢驗 5.3.1 案例描述——袋裝食品的重量檢驗2 5.3.2 SAS/Analyst單樣本均值t檢驗 5.3.3 TTEST過程分析 5.4 單樣本的比例檢驗 5.4.1 基本原理 5.4.2 案例描述——購車價格的比例分析1 5.4.3 SAS/Analyst變量編碼 5.4.4 SAS/Analyst單樣本比例檢驗 5.5 單樣本的方差檢驗 5.5.1 案例描述——考試成績的變異分析 5.5.2 SAS/Analyst單樣本方差檢驗 5.6 兩樣本的均值t檢驗 5.6.1 案例描述——男女減肥的效果對比 5.6.2 SAS/Analyst兩樣本均值t檢驗 5.6.3 TTEST過程分析 5.7 配對樣本的均值t檢驗 5.7.1 案例描述——裝配時間的差異分析 5.7.2 SAS/Analyst配對樣本均值t檢驗 5.7.3 TTEST過程分析 5.8 兩樣本的比例檢驗 5.8.1 案例描述——購車價格的比例分析2 5.8.2 SAS/Analyst兩樣本比例檢驗 5.9 兩樣本的方差檢驗 5.9.1 案例描述——股票價格的波動比較 5.9.2 SAS/Analyst兩樣本方差檢驗 習題 第6章 方差分析 6.1 方差分析簡述 6.1.1 方差分析的基本原理 6.1.2 方差分析實例講解 6.2 單因素方差分析 6.2.1 單因素方差分析原理 6.2.2 案例描述——施肥量對產(chǎn)量的影響分析 6.2.3 SAS/Analyst單因素方差分析 6.2.4 ANOVA和GLM過程分析 6.3 多因素方差分析 6.3.1 多因素方差分析原理 6.3.2 案例描述——影響銷售額的因素分析 6.3.3 SAS/Analyst多因素方差分析 6.3.4 ANOVA和GLM過程分析 6.4 重復(fù)測量的方差分析 6.4.1 重復(fù)測量方差分析原理 6.4.2 案例描述——轉(zhuǎn)移基因的抑制分析 6.4.3 SAS/Analyst重復(fù)設(shè)計方差分析 6.4.4 SAS編程分析 習題 第7章 列聯(lián)表分析 7.1 列聯(lián)表的基本原理 7.2 案例描述——產(chǎn)品質(zhì)量的檢驗分析 7.3 SAS/Analyst列聯(lián)表分析 7.4 FREQ過程分析 習題 第8章 非參數(shù)檢驗方法 8.1 非參數(shù)檢驗概述 8.1.1 非參數(shù)檢驗的特點 8.1.2 SAS中的NPAR1WAY過程 8.2 單樣本非參數(shù)檢驗 8.2.1 x2擬合優(yōu)度檢驗 8.2.2 單樣本K-S檢驗 8.2.3 符號檢驗 8.3 兩樣本非參數(shù)檢驗 8.3.1 兩獨立樣本W(wǎng)ilcoxon秩和檢驗 8.3.2 兩獨立樣本Kolmogorov-Smirnov檢驗 8.3.3 成對樣本W(wǎng)ilcoxon符號秩檢驗 8.4 多樣本非參數(shù)檢驗 8.4.1 多獨立樣本Kruskal-Wallis檢驗 8.4.2 多獨立樣本Brown-Mood檢驗 8.5 等級相關(guān)分析 8.5.1 Spearman等級相關(guān)系數(shù) 8.5.2 Kendall等級相關(guān)系數(shù) 8.5.3 案例研究——財務(wù)指標的相關(guān)性分析 習題 第9章 相關(guān)分析與回歸分析 9.1 相關(guān)分析 9.1.1 相關(guān)分析簡述 9.1.2 案例描述——身體特征的相關(guān)性分析 9.1.3 SAS/Analyst相關(guān)分析 9.1.4 CORR過程分析 9.2 線性回歸分析 9.2.1 線性回歸原理 9.2.2 案例描述——環(huán)境對植物生長的影響分析 9.2.3 SAS/Analyst線性回歸分析 9.2.4 REG過程分析 9.3 曲線回歸分析 9.3.1 曲線回歸的基本原理 9.3.2 案例描述——不同光學(xué)密度的關(guān)系研究 9.3.3 SAS/Analyst曲線回歸分析 9.4 Logistic回歸分析 9.4.1 Logistic回歸的基本原理 9.4.2 案例描述——個人信譽的評估分析 9.4.3 SAS/Analyst Logistic回歸分析 9.4.4 LOGISTIC過程分析 習題 第10章 聚類分析 10.1 聚類分析簡介 10.1.1 聚類分析的基本原理 10.1.2 系統(tǒng)聚類原理 10.1.3 最佳聚類數(shù)的確定 10.2 SAS編程分析 10.2.1 CLUSTER過程 10.2.2 TREE過程 10.2.3 FASTCLUS過程 10.2.4 ACECLUS過程 10.2.5 VARCLUS過程 習題 第11章 判別分析 11.1 判別分析簡介 11.2 案例描述——鳶尾花的類型判別 11.3 SAS編程分析 11.3.1 STEPDISC過程 11.3.2 DISCRIM過程 11.3.3 CANDISC過程 習題 第12章 主成分分析 12.1 主成分分析簡介 12.2 案例描述——國民生產(chǎn)狀況的評價分析 12.3 SAS/Analyst主成分分析 12.4 PRINCOMP過程分析 習題 第13章 因子分析 13.1 因子分析簡介 13.2 FACTOR和SCORE過程語法 13.3 案例分析——不同地區(qū)的經(jīng)濟狀況比較 習題 第14章 時間序列分析 14.1 時間序列的基本原理 14.1.1 時間序列的數(shù)學(xué)模型 14.1.2 時間序列模型的識別 14.1.3 時間序列模型的估計 14.1.4 時間序列分析的步驟 14.2 Forecasting System模塊及應(yīng)用 14.2.1 Forecasting System模塊概述 14.2.2 案例研究——GNP的時間序列分析 14.2.3 用ARMA模型做進一步分析 14.3 ARIMA過程及應(yīng)用 14.3.1 ARIMA過程的語法 14.3.2 案例研究——抽查次品數(shù)量的序列分析 習題 第15章 SAS在數(shù)據(jù)預(yù)測中的應(yīng)用 15.1 數(shù)據(jù)預(yù)測的基本方法 15.2 案例研究——GDP增長率預(yù)測 15.3 案例研究——上證指數(shù)日線預(yù)測 15.4 案例研究——汽車市場的需求預(yù)測 習題 第16章 SAS在市場研究中的應(yīng)用 16.1 聯(lián)合分析 16.1.1 聯(lián)合分析簡介 16.1.2 案例描述——汽車輪胎的評價分析 16.1.3 SAS聯(lián)合分析過程 16.2 對應(yīng)分析 16.2.1 對應(yīng)分析概述 16.2.2 案例描述——汽車銷售市場分析 16.2.3 SAS對應(yīng)分析過程 16.3 多維偏好分析 16.3.1 多維偏好分析的基本概念 16.3.2 案例描述——消費者對汽車的偏好分析 16.3.3 SAS多維偏好分析過程 習題 第17章 SAS在分類分析中的應(yīng)用 17.1 聚類分析應(yīng)用 17.1.1 系統(tǒng)聚類——居民消費支出分析 17.1.2 快速聚類——噪聲監(jiān)測分析 17.1.3 變量聚類——經(jīng)濟發(fā)展指標分析 17.2 判別分析應(yīng)用 17.2.1 一般判別——農(nóng)民家庭收支分析 17.2.2 典則判別——農(nóng)民家庭收支分析 17.2.3 逐步判別——農(nóng)民家庭收支分析 習題 第18章 SAS/Enterprise Miner概述 18.1 Enterprise Miner簡介 18.1.1 EM主界面 18.1.2 新建EM項目 18.2 SAS/EM節(jié)點 18.2.1 Sample數(shù)據(jù)環(huán)節(jié) 18.2.2 Explore探索環(huán)節(jié) 18.2.3 Modify調(diào)整環(huán)節(jié) 18.2.4 Model建模環(huán)節(jié) 18.2.5 Assess評估環(huán)節(jié) 18.2.6 報告和預(yù)測環(huán)節(jié) 18.3 EM案例——棒球球員的聚類分析 18.3.1 數(shù)據(jù)輸入 18.3.2 缺失值處理 18.3.3 聚類分析的參數(shù)設(shè)置 18.3.4 查看聚類分析的結(jié)果 18.3.5 用Insight做進一步分析 習題
章節(jié)摘錄
插圖:描述性數(shù)據(jù)分析是人們認識數(shù)據(jù)和發(fā)現(xiàn)問題的有力工具,同時也是正式建立統(tǒng)計分析模型之前的鋪墊,是科學(xué)的統(tǒng)計分析的一個重要環(huán)節(jié)。許多研究者往往一開始就應(yīng)用經(jīng)驗對數(shù)據(jù)進行建模分析,而忽略了對統(tǒng)計數(shù)據(jù)的探索、研究這一初步過程,這樣容易使其分析只停留在問題的表面而不能夠深入。在對數(shù)據(jù)進行分析的時候,首先要對數(shù)據(jù)進行描述性統(tǒng)計分析(Descriptive Analysis),以發(fā)現(xiàn)其內(nèi)在的規(guī)律,再選擇進一步分析的方法。4.1描述性統(tǒng)計分析簡介描述性數(shù)據(jù)分析直接從原始數(shù)據(jù)入手,讓數(shù)據(jù)說話。許多統(tǒng)計方法都假定數(shù)據(jù)服從某種分布,然后用滿足該種分布的模型進行擬合、分析和預(yù)測,但客觀實際的數(shù)據(jù)并不總是滿足理論上的分布,因而這些方法具有極大的局限性。描述性分析從客觀數(shù)據(jù)出發(fā),而不是從某種假定出發(fā),從而能在實際數(shù)據(jù)中探索內(nèi)在的規(guī)律。多數(shù)統(tǒng)計模型都是以概率論為理論基礎(chǔ)的,并能夠給出精確度的度量方法和度量值。探索性數(shù)據(jù)分析在研究數(shù)據(jù)的內(nèi)在特征、數(shù)量間的關(guān)系和變化時,所用方法盡可能服從于數(shù)據(jù)特點和研究目的,并且更重視數(shù)據(jù)特征的穩(wěn)健性,而相對放松對概率論理論和精確度的刻意追求。描述性數(shù)據(jù)分析使用的工具簡單直觀,更易于普及。專業(yè)的統(tǒng)計方法運用的數(shù)學(xué)理論越來越深,使想應(yīng)用它的人們越來越害怕統(tǒng)計。探索性數(shù)據(jù)分析運用簡單直觀的莖葉圖、箱線圖、殘差圖和字母值、數(shù)據(jù)變換、中位數(shù)平滑等方法,使具有初等數(shù)學(xué)知識的人也可以進行分析。
媒體關(guān)注與評論
本書通過豐富的實例詳細講解了世界統(tǒng)計分析全才——SAS系統(tǒng)。書中不僅全面包括了SAS的功能、實現(xiàn)方法以及實例應(yīng)用,還展示了如何用時下最為熱門的數(shù)據(jù)挖掘工具——SAS/EM進行完整的數(shù)據(jù)挖掘工作?!禨AS統(tǒng)計分析標準教程》是一本快速、有效、實用的使用SAS系統(tǒng)進行統(tǒng)計分析的中文教材。 ——SAS全球華人俱樂部發(fā)起人兼聯(lián)合主席 周宏森博士本教程針對SAS系統(tǒng)的基本操作和基本的統(tǒng)計分析應(yīng)用進行了由淺及深的介紹,內(nèi)容涵蓋了實際工作中有關(guān)統(tǒng)計分析的大部分SAS操作和編程技術(shù),結(jié)構(gòu)合理,文字清晰易懂,同時配有視頻教學(xué)光盤,非常適合統(tǒng)計應(yīng)用專業(yè)的師生以及相關(guān)從業(yè)人員學(xué)習?! 靼矖钌扑幱邢薰踞t(yī)學(xué)事務(wù)部生物統(tǒng)計經(jīng)理 薛富波博士本書是一本實用的統(tǒng)計分析參考用書,內(nèi)容涵蓋多元統(tǒng)計分析、時間序列分析、EM數(shù)據(jù)挖掘等諸多方面,且每種方法都用實際的案例分析加以闡述。書中還舉例介紹了SAS在數(shù)據(jù)預(yù)測、市場研究、分類分析中的應(yīng)用,便于讀者將理論知識轉(zhuǎn)化為解決實際問題的能力。隨書光盤輔以視頻指導(dǎo),初學(xué)者能夠快速學(xué)會SAS并掌握其使用技巧?! 祥_大學(xué)數(shù)學(xué)科學(xué)學(xué)院副教授 吳忠華本書各章節(jié)貫穿了“算法原理-案例描述-可視化分析-編程分析”的基本思路,向讀者展示了如何使用SAS9.2進行數(shù)據(jù)管理、統(tǒng)計分析、數(shù)據(jù)挖掘等工作。同時書中還給出了SAS在市場研究等專題中的多個應(yīng)用,是一本使用SAS進行統(tǒng)計分析的不錯的參考用書?! 袊膊☆A(yù)防控制中心 汪海波博士
編輯推薦
《SAS統(tǒng)計分析標準教程》:挖掘數(shù)據(jù)寶藏,助力支持,200分析全程視頻講解。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載