出版時(shí)間:2010-7 出版社:清華大學(xué)出版社 作者:(美)邁克倫南,(美)唐朝暉,(美)克里沃茨 著,董艷,程文俊 譯 頁(yè)數(shù):492
Tag標(biāo)簽:無(wú)
前言
數(shù)據(jù)挖掘,作為商業(yè)智能(Business Intelligence)實(shí)現(xiàn)的最深層次,在商業(yè)智能解決方案的體系中占據(jù)著重要的位置。數(shù)據(jù)庫(kù)中存在的是數(shù)據(jù),對(duì)于業(yè)務(wù)人員來(lái)說(shuō),只是一些無(wú)法看懂的天書,他們需要的是可以更容易理解的信息。那么,我們以前如何解決這個(gè)矛盾的呢?一般的答案是報(bào)表系統(tǒng)。簡(jiǎn)單地說(shuō),業(yè)務(wù)人員看到的是美觀的界面,便捷的操作,鼠標(biāo)點(diǎn)擊后,報(bào)表系統(tǒng)生成SQL語(yǔ)句,數(shù)據(jù)庫(kù)服務(wù)器收到以后,返回所需要的信息。不錯(cuò),報(bào)表系統(tǒng)已經(jīng)可以稱作是BI了,它是BI的低端實(shí)現(xiàn)。現(xiàn)在國(guó)外的企業(yè),大部分已經(jīng)進(jìn)入了更深層次的商業(yè)智能,叫做數(shù)據(jù)分析,即基于多維數(shù)據(jù)庫(kù)的在線分析系統(tǒng)(OLAP)。還有一些企業(yè)已經(jīng)開始進(jìn)入更深層次的商業(yè)智能,叫做數(shù)據(jù)挖掘。從廣義上說(shuō),任何從數(shù)據(jù)庫(kù)中挖掘信息的過(guò)程都叫做數(shù)據(jù)挖掘。從這點(diǎn)看來(lái),報(bào)表、多維分析和深度的挖掘都是挖掘數(shù)據(jù)的手段。但是,從技術(shù)術(shù)語(yǔ)上說(shuō),數(shù)據(jù)挖掘(Data Mining)特指的是:源數(shù)據(jù)經(jīng)過(guò)清洗和轉(zhuǎn)換等成為適合于挖掘的數(shù)據(jù)集,然后建立特定的挖掘模型,利用這些數(shù)據(jù)集訓(xùn)練模型,最后利用模型找出的知識(shí)模式進(jìn)行預(yù)測(cè),從而輔助決策工作。過(guò)去,談起數(shù)據(jù)挖掘,大家想到的往往是那些專業(yè)數(shù)學(xué)家、統(tǒng)計(jì)學(xué)家,一般的技術(shù)人員和業(yè)務(wù)人員望而卻步?,F(xiàn)在,隨著IT技術(shù)的發(fā)展和工業(yè)化,SQL server2008提煉了上述的各種復(fù)雜知識(shí),加工成友好的視窗工具,嵌入到分析服務(wù)(Aaaalysis Services)中,使得數(shù)據(jù)挖掘的用戶擴(kuò)展到了大量的開發(fā)者人群,甚至是經(jīng)過(guò)培訓(xùn)的業(yè)務(wù)人員。它使我們的員工和程序變得更聰明了。我在國(guó)外學(xué)習(xí)、工作了多年之后,深感商業(yè)智能即將成為未來(lái)幾年IT領(lǐng)域的核心價(jià)值,因此從2003開始創(chuàng)建了北京邁思奇科技有限公司,致力于將國(guó)外的先進(jìn)BI技術(shù)和工具引進(jìn)國(guó)內(nèi),幫助國(guó)內(nèi)的企業(yè)提高數(shù)據(jù)分析效率、增強(qiáng)競(jìng)爭(zhēng)實(shí)力。公司成立六年來(lái),與微軟密切合作,通過(guò)數(shù)百次講座和培訓(xùn),為企業(yè)培養(yǎng)BI專業(yè)人員;同時(shí),在承擔(dān)BI項(xiàng)目開發(fā)的過(guò)程中,公司也積累了優(yōu)秀的團(tuán)隊(duì)和豐富的項(xiàng)目案例,創(chuàng)立了國(guó)內(nèi)一流的數(shù)據(jù)挖掘品牌。
內(nèi)容概要
SQL Server數(shù)據(jù)挖掘是業(yè)界使用最廣泛的數(shù)據(jù)挖掘服務(wù)器。企業(yè)用戶(甚至學(xué)術(shù)專家和科學(xué)家)都采用SQL Server數(shù)據(jù)挖掘技術(shù),因?yàn)檫@種技術(shù)的可伸縮性很強(qiáng),容易獲得,功能廣泛,并且易于使用。 SQL Server的2008版本在數(shù)據(jù)挖掘方面有了令人興奮的新改進(jìn),本書是SQL Server數(shù)據(jù)挖掘方面的經(jīng)典之作,介紹了如何掌握最新功能,是部署和使用SQL Server數(shù)據(jù)挖掘技術(shù)的實(shí)用指南。 本書的作者團(tuán)隊(duì)首先介紹了使用SQL Server 2008數(shù)據(jù)挖掘所需的工具、技術(shù)和概念,然后全面討論了SQL Server 2008數(shù)據(jù)挖掘算法的細(xì)節(jié),以及如何把SQL Server數(shù)據(jù)挖掘技術(shù)與SQL Server Business Intelligence(BI)套件的其他部分集成起來(lái),擴(kuò)展SQL Server數(shù)據(jù)挖掘技術(shù),以滿足自己的需要。本書中詳盡而實(shí)用的示例清晰地解釋了如何利用SQL Server 2008構(gòu)建成功的數(shù)據(jù)挖掘解決方案。
作者簡(jiǎn)介
作者:(美國(guó))邁克倫南(Jamie MacLennan) (美國(guó))唐朝暉(ZhaoHui Tang) (美國(guó))克里沃茨(Bogdan Crivat) 譯者:董艷 程文俊 合著者:楊大川Jamie Mac Lennan,Microsoft公司SQL Server Analysis Services事業(yè)部的。位開發(fā)主管。他在SQL Server數(shù)據(jù)挖掘方面有超過(guò)25項(xiàng)專利,并且編寫了大量關(guān)于SQL Server數(shù)據(jù)挖掘技術(shù)的著作。唐朝暉(ZhaoHui Tang),Microsoft ad Center實(shí)驗(yàn)室的團(tuán)隊(duì)項(xiàng)目經(jīng)理,Microsoft Keyword Services Platform的發(fā)明人。Bogdan Crivat,Microsoft公司SQL Server Analysis Services的資深軟件設(shè)計(jì)工程師,主要研究方向是數(shù)據(jù)挖掘平臺(tái)。審校者簡(jiǎn)介:楊大川,中國(guó)科學(xué)院軟件學(xué)院兼職教授,畢業(yè)于美國(guó)紐約州立大學(xué)布法羅分校計(jì)算機(jī)系,曾擔(dān)任美國(guó)硅谷Annuncio Software等公司的首席工程帥。歸國(guó)后,2003年創(chuàng)辦了北京邁思奇科技有限公司并擔(dān)任技術(shù)總監(jiān),為國(guó)內(nèi)外多家人中型企業(yè)提供商業(yè)智能咨詢和項(xiàng)目實(shí)施服務(wù),并逐漸從高新技術(shù)外包開發(fā)走向了自主知識(shí)產(chǎn)權(quán)產(chǎn)品的研發(fā)道路。曾榮獲微軟全球最有價(jià)值專家(MVP)稱號(hào),并于2008年榮獲“中關(guān)村年度優(yōu)秀創(chuàng)業(yè)留學(xué)人員”稱號(hào)。
書籍目錄
第一章 SQL Server 2008數(shù)據(jù)挖掘介紹第二章 用Microsoft Excel 2007進(jìn)行數(shù)據(jù)挖掘第三章 數(shù)據(jù)挖掘概念與DMX第四章 使用SQL Server進(jìn)行數(shù)據(jù)挖掘第五章 使用Office 2007執(zhí)行數(shù)據(jù)挖掘過(guò)程第六章 Microsoft貝葉斯算法第七章 Microsoft決策樹算法第八章 Microsoft時(shí)序算法第九章 Microsoft聚類算法第十章 Microsoft序列聚類算法第十一章 Microsoft關(guān)聯(lián)規(guī)則算法第十二章 Microsoft神經(jīng)網(wǎng)絡(luò)算法和邏輯回歸算法第十三章 挖掘OLAP立方體第十四章 SQL Server集成服務(wù)數(shù)據(jù)挖掘第十五章 SQL Server數(shù)據(jù)挖掘的體系結(jié)構(gòu)第十六章 SQL Server數(shù)據(jù)挖掘編程第十七章 擴(kuò)展SQL Server數(shù)據(jù)挖掘第十八章 實(shí)現(xiàn)Web交叉銷售應(yīng)用程序第十九章 總結(jié)與其他資源附錄A 數(shù)據(jù)集附錄B 支持的函數(shù)附錄C 學(xué)習(xí)資源
章節(jié)摘錄
插圖:
圖書封面
圖書標(biāo)簽Tags
無(wú)
評(píng)論、評(píng)分、閱讀與下載
數(shù)據(jù)挖掘原理與應(yīng)用 PDF格式下載