出版時間:2010-7 出版社:清華大學出版社 作者:(美)邁克倫南,(美)唐朝暉,(美)克里沃茨 著,董艷,程文俊 譯 頁數(shù):492
Tag標簽:無
前言
數(shù)據(jù)挖掘,作為商業(yè)智能(Business Intelligence)實現(xiàn)的最深層次,在商業(yè)智能解決方案的體系中占據(jù)著重要的位置。數(shù)據(jù)庫中存在的是數(shù)據(jù),對于業(yè)務(wù)人員來說,只是一些無法看懂的天書,他們需要的是可以更容易理解的信息。那么,我們以前如何解決這個矛盾的呢?一般的答案是報表系統(tǒng)。簡單地說,業(yè)務(wù)人員看到的是美觀的界面,便捷的操作,鼠標點擊后,報表系統(tǒng)生成SQL語句,數(shù)據(jù)庫服務(wù)器收到以后,返回所需要的信息。不錯,報表系統(tǒng)已經(jīng)可以稱作是BI了,它是BI的低端實現(xiàn)?,F(xiàn)在國外的企業(yè),大部分已經(jīng)進入了更深層次的商業(yè)智能,叫做數(shù)據(jù)分析,即基于多維數(shù)據(jù)庫的在線分析系統(tǒng)(OLAP)。還有一些企業(yè)已經(jīng)開始進入更深層次的商業(yè)智能,叫做數(shù)據(jù)挖掘。從廣義上說,任何從數(shù)據(jù)庫中挖掘信息的過程都叫做數(shù)據(jù)挖掘。從這點看來,報表、多維分析和深度的挖掘都是挖掘數(shù)據(jù)的手段。但是,從技術(shù)術(shù)語上說,數(shù)據(jù)挖掘(Data Mining)特指的是:源數(shù)據(jù)經(jīng)過清洗和轉(zhuǎn)換等成為適合于挖掘的數(shù)據(jù)集,然后建立特定的挖掘模型,利用這些數(shù)據(jù)集訓(xùn)練模型,最后利用模型找出的知識模式進行預(yù)測,從而輔助決策工作。過去,談起數(shù)據(jù)挖掘,大家想到的往往是那些專業(yè)數(shù)學家、統(tǒng)計學家,一般的技術(shù)人員和業(yè)務(wù)人員望而卻步?,F(xiàn)在,隨著IT技術(shù)的發(fā)展和工業(yè)化,SQL server2008提煉了上述的各種復(fù)雜知識,加工成友好的視窗工具,嵌入到分析服務(wù)(Aaaalysis Services)中,使得數(shù)據(jù)挖掘的用戶擴展到了大量的開發(fā)者人群,甚至是經(jīng)過培訓(xùn)的業(yè)務(wù)人員。它使我們的員工和程序變得更聰明了。我在國外學習、工作了多年之后,深感商業(yè)智能即將成為未來幾年IT領(lǐng)域的核心價值,因此從2003開始創(chuàng)建了北京邁思奇科技有限公司,致力于將國外的先進BI技術(shù)和工具引進國內(nèi),幫助國內(nèi)的企業(yè)提高數(shù)據(jù)分析效率、增強競爭實力。公司成立六年來,與微軟密切合作,通過數(shù)百次講座和培訓(xùn),為企業(yè)培養(yǎng)BI專業(yè)人員;同時,在承擔BI項目開發(fā)的過程中,公司也積累了優(yōu)秀的團隊和豐富的項目案例,創(chuàng)立了國內(nèi)一流的數(shù)據(jù)挖掘品牌。
內(nèi)容概要
SQL Server數(shù)據(jù)挖掘是業(yè)界使用最廣泛的數(shù)據(jù)挖掘服務(wù)器。企業(yè)用戶(甚至學術(shù)專家和科學家)都采用SQL Server數(shù)據(jù)挖掘技術(shù),因為這種技術(shù)的可伸縮性很強,容易獲得,功能廣泛,并且易于使用。 SQL Server的2008版本在數(shù)據(jù)挖掘方面有了令人興奮的新改進,本書是SQL Server數(shù)據(jù)挖掘方面的經(jīng)典之作,介紹了如何掌握最新功能,是部署和使用SQL Server數(shù)據(jù)挖掘技術(shù)的實用指南。 本書的作者團隊首先介紹了使用SQL Server 2008數(shù)據(jù)挖掘所需的工具、技術(shù)和概念,然后全面討論了SQL Server 2008數(shù)據(jù)挖掘算法的細節(jié),以及如何把SQL Server數(shù)據(jù)挖掘技術(shù)與SQL Server Business Intelligence(BI)套件的其他部分集成起來,擴展SQL Server數(shù)據(jù)挖掘技術(shù),以滿足自己的需要。本書中詳盡而實用的示例清晰地解釋了如何利用SQL Server 2008構(gòu)建成功的數(shù)據(jù)挖掘解決方案。
作者簡介
作者:(美國)邁克倫南(Jamie MacLennan) (美國)唐朝暉(ZhaoHui Tang) (美國)克里沃茨(Bogdan Crivat) 譯者:董艷 程文俊 合著者:楊大川Jamie Mac Lennan,Microsoft公司SQL Server Analysis Services事業(yè)部的。位開發(fā)主管。他在SQL Server數(shù)據(jù)挖掘方面有超過25項專利,并且編寫了大量關(guān)于SQL Server數(shù)據(jù)挖掘技術(shù)的著作。唐朝暉(ZhaoHui Tang),Microsoft ad Center實驗室的團隊項目經(jīng)理,Microsoft Keyword Services Platform的發(fā)明人。Bogdan Crivat,Microsoft公司SQL Server Analysis Services的資深軟件設(shè)計工程師,主要研究方向是數(shù)據(jù)挖掘平臺。審校者簡介:楊大川,中國科學院軟件學院兼職教授,畢業(yè)于美國紐約州立大學布法羅分校計算機系,曾擔任美國硅谷Annuncio Software等公司的首席工程帥。歸國后,2003年創(chuàng)辦了北京邁思奇科技有限公司并擔任技術(shù)總監(jiān),為國內(nèi)外多家人中型企業(yè)提供商業(yè)智能咨詢和項目實施服務(wù),并逐漸從高新技術(shù)外包開發(fā)走向了自主知識產(chǎn)權(quán)產(chǎn)品的研發(fā)道路。曾榮獲微軟全球最有價值專家(MVP)稱號,并于2008年榮獲“中關(guān)村年度優(yōu)秀創(chuàng)業(yè)留學人員”稱號。
書籍目錄
第一章 SQL Server 2008數(shù)據(jù)挖掘介紹第二章 用Microsoft Excel 2007進行數(shù)據(jù)挖掘第三章 數(shù)據(jù)挖掘概念與DMX第四章 使用SQL Server進行數(shù)據(jù)挖掘第五章 使用Office 2007執(zhí)行數(shù)據(jù)挖掘過程第六章 Microsoft貝葉斯算法第七章 Microsoft決策樹算法第八章 Microsoft時序算法第九章 Microsoft聚類算法第十章 Microsoft序列聚類算法第十一章 Microsoft關(guān)聯(lián)規(guī)則算法第十二章 Microsoft神經(jīng)網(wǎng)絡(luò)算法和邏輯回歸算法第十三章 挖掘OLAP立方體第十四章 SQL Server集成服務(wù)數(shù)據(jù)挖掘第十五章 SQL Server數(shù)據(jù)挖掘的體系結(jié)構(gòu)第十六章 SQL Server數(shù)據(jù)挖掘編程第十七章 擴展SQL Server數(shù)據(jù)挖掘第十八章 實現(xiàn)Web交叉銷售應(yīng)用程序第十九章 總結(jié)與其他資源附錄A 數(shù)據(jù)集附錄B 支持的函數(shù)附錄C 學習資源
章節(jié)摘錄
插圖:
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載
數(shù)據(jù)挖掘原理與應(yīng)用 PDF格式下載