數(shù)據(jù)挖掘原理與應(yīng)用

出版時間:2010-7  出版社:清華大學出版社  作者:(美)邁克倫南,(美)唐朝暉,(美)克里沃茨 著,董艷,程文俊 譯  頁數(shù):492  
Tag標簽:無  

前言

數(shù)據(jù)挖掘,作為商業(yè)智能(Business Intelligence)實現(xiàn)的最深層次,在商業(yè)智能解決方案的體系中占據(jù)著重要的位置。數(shù)據(jù)庫中存在的是數(shù)據(jù),對于業(yè)務(wù)人員來說,只是一些無法看懂的天書,他們需要的是可以更容易理解的信息。那么,我們以前如何解決這個矛盾的呢?一般的答案是報表系統(tǒng)。簡單地說,業(yè)務(wù)人員看到的是美觀的界面,便捷的操作,鼠標點擊后,報表系統(tǒng)生成SQL語句,數(shù)據(jù)庫服務(wù)器收到以后,返回所需要的信息。不錯,報表系統(tǒng)已經(jīng)可以稱作是BI了,它是BI的低端實現(xiàn)?,F(xiàn)在國外的企業(yè),大部分已經(jīng)進入了更深層次的商業(yè)智能,叫做數(shù)據(jù)分析,即基于多維數(shù)據(jù)庫的在線分析系統(tǒng)(OLAP)。還有一些企業(yè)已經(jīng)開始進入更深層次的商業(yè)智能,叫做數(shù)據(jù)挖掘。從廣義上說,任何從數(shù)據(jù)庫中挖掘信息的過程都叫做數(shù)據(jù)挖掘。從這點看來,報表、多維分析和深度的挖掘都是挖掘數(shù)據(jù)的手段。但是,從技術(shù)術(shù)語上說,數(shù)據(jù)挖掘(Data Mining)特指的是:源數(shù)據(jù)經(jīng)過清洗和轉(zhuǎn)換等成為適合于挖掘的數(shù)據(jù)集,然后建立特定的挖掘模型,利用這些數(shù)據(jù)集訓(xùn)練模型,最后利用模型找出的知識模式進行預(yù)測,從而輔助決策工作。過去,談起數(shù)據(jù)挖掘,大家想到的往往是那些專業(yè)數(shù)學家、統(tǒng)計學家,一般的技術(shù)人員和業(yè)務(wù)人員望而卻步?,F(xiàn)在,隨著IT技術(shù)的發(fā)展和工業(yè)化,SQL server2008提煉了上述的各種復(fù)雜知識,加工成友好的視窗工具,嵌入到分析服務(wù)(Aaaalysis Services)中,使得數(shù)據(jù)挖掘的用戶擴展到了大量的開發(fā)者人群,甚至是經(jīng)過培訓(xùn)的業(yè)務(wù)人員。它使我們的員工和程序變得更聰明了。我在國外學習、工作了多年之后,深感商業(yè)智能即將成為未來幾年IT領(lǐng)域的核心價值,因此從2003開始創(chuàng)建了北京邁思奇科技有限公司,致力于將國外的先進BI技術(shù)和工具引進國內(nèi),幫助國內(nèi)的企業(yè)提高數(shù)據(jù)分析效率、增強競爭實力。公司成立六年來,與微軟密切合作,通過數(shù)百次講座和培訓(xùn),為企業(yè)培養(yǎng)BI專業(yè)人員;同時,在承擔BI項目開發(fā)的過程中,公司也積累了優(yōu)秀的團隊和豐富的項目案例,創(chuàng)立了國內(nèi)一流的數(shù)據(jù)挖掘品牌。

內(nèi)容概要

SQL Server數(shù)據(jù)挖掘是業(yè)界使用最廣泛的數(shù)據(jù)挖掘服務(wù)器。企業(yè)用戶(甚至學術(shù)專家和科學家)都采用SQL Server數(shù)據(jù)挖掘技術(shù),因為這種技術(shù)的可伸縮性很強,容易獲得,功能廣泛,并且易于使用。    SQL Server的2008版本在數(shù)據(jù)挖掘方面有了令人興奮的新改進,本書是SQL Server數(shù)據(jù)挖掘方面的經(jīng)典之作,介紹了如何掌握最新功能,是部署和使用SQL Server數(shù)據(jù)挖掘技術(shù)的實用指南。    本書的作者團隊首先介紹了使用SQL Server 2008數(shù)據(jù)挖掘所需的工具、技術(shù)和概念,然后全面討論了SQL Server 2008數(shù)據(jù)挖掘算法的細節(jié),以及如何把SQL Server數(shù)據(jù)挖掘技術(shù)與SQL Server Business Intelligence(BI)套件的其他部分集成起來,擴展SQL Server數(shù)據(jù)挖掘技術(shù),以滿足自己的需要。本書中詳盡而實用的示例清晰地解釋了如何利用SQL Server 2008構(gòu)建成功的數(shù)據(jù)挖掘解決方案。

作者簡介

作者:(美國)邁克倫南(Jamie MacLennan) (美國)唐朝暉(ZhaoHui Tang) (美國)克里沃茨(Bogdan Crivat) 譯者:董艷 程文俊 合著者:楊大川Jamie Mac Lennan,Microsoft公司SQL Server Analysis Services事業(yè)部的。位開發(fā)主管。他在SQL Server數(shù)據(jù)挖掘方面有超過25項專利,并且編寫了大量關(guān)于SQL Server數(shù)據(jù)挖掘技術(shù)的著作。唐朝暉(ZhaoHui Tang),Microsoft ad Center實驗室的團隊項目經(jīng)理,Microsoft Keyword Services Platform的發(fā)明人。Bogdan Crivat,Microsoft公司SQL Server Analysis Services的資深軟件設(shè)計工程師,主要研究方向是數(shù)據(jù)挖掘平臺。審校者簡介:楊大川,中國科學院軟件學院兼職教授,畢業(yè)于美國紐約州立大學布法羅分校計算機系,曾擔任美國硅谷Annuncio Software等公司的首席工程帥。歸國后,2003年創(chuàng)辦了北京邁思奇科技有限公司并擔任技術(shù)總監(jiān),為國內(nèi)外多家人中型企業(yè)提供商業(yè)智能咨詢和項目實施服務(wù),并逐漸從高新技術(shù)外包開發(fā)走向了自主知識產(chǎn)權(quán)產(chǎn)品的研發(fā)道路。曾榮獲微軟全球最有價值專家(MVP)稱號,并于2008年榮獲“中關(guān)村年度優(yōu)秀創(chuàng)業(yè)留學人員”稱號。

書籍目錄

第一章  SQL Server 2008數(shù)據(jù)挖掘介紹第二章  用Microsoft Excel 2007進行數(shù)據(jù)挖掘第三章  數(shù)據(jù)挖掘概念與DMX第四章  使用SQL Server進行數(shù)據(jù)挖掘第五章  使用Office 2007執(zhí)行數(shù)據(jù)挖掘過程第六章  Microsoft貝葉斯算法第七章  Microsoft決策樹算法第八章  Microsoft時序算法第九章  Microsoft聚類算法第十章  Microsoft序列聚類算法第十一章  Microsoft關(guān)聯(lián)規(guī)則算法第十二章  Microsoft神經(jīng)網(wǎng)絡(luò)算法和邏輯回歸算法第十三章  挖掘OLAP立方體第十四章  SQL Server集成服務(wù)數(shù)據(jù)挖掘第十五章  SQL Server數(shù)據(jù)挖掘的體系結(jié)構(gòu)第十六章  SQL Server數(shù)據(jù)挖掘編程第十七章  擴展SQL Server數(shù)據(jù)挖掘第十八章  實現(xiàn)Web交叉銷售應(yīng)用程序第十九章  總結(jié)與其他資源附錄A  數(shù)據(jù)集附錄B  支持的函數(shù)附錄C  學習資源

章節(jié)摘錄

插圖:

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)挖掘原理與應(yīng)用 PDF格式下載


用戶評論 (總計53條)

 
 

  •   本書首先介紹了使用SQL Server 2008數(shù)據(jù)挖掘所需的工具、技術(shù)和概念,然后全面討論了SQL Server 2008數(shù)據(jù)挖掘算法的細節(jié),以及如何把SQL Server數(shù)據(jù)挖掘技術(shù)與SQL Server Business Intelligence(BI)套件的其他部分集成起來,擴展SQL Server數(shù)據(jù)挖掘技術(shù),以滿足自己的需要。
  •   SQL Serer2008(R2)數(shù)據(jù)挖掘中文著作中最好的一本。
  •   數(shù)據(jù)挖掘方面的經(jīng)典教材。值得一看。
  •   數(shù)據(jù)挖掘原理與應(yīng)用 很好
  •   最近公司產(chǎn)品需要寫數(shù)據(jù)挖掘的知識。拿著本基于sqlserver 2008的數(shù)據(jù)挖掘的應(yīng)用。希望對自己有幫助
  •   強烈推薦,是一本理解理論的很好的入門級教材,同時也是一本SQLServer數(shù)據(jù)挖掘的深入教材
  •   不錯的一本書,對學到了很多excel挖掘的知識
  •   很經(jīng)典的書,可惜裝箱的時候壓壞了幾頁,希望當當注意操作時候的規(guī)范性
  •   可惜版本太老了
  •   書很好,紙質(zhì)不錯,字跡清晰,就是運送過程有點折
  •   特價期間買的書,書不錯,看著很好,快的也挺快的!
  •   好書,值得看看。理論實踐結(jié)合的書不多。
  •   一本很棒的書,值得你讀一讀!~
  •   學了一段時間,基本上入門了。
  •   還沒看 好像不錯的樣子
  •   感覺還不錯,可能沒有達到我的要求,送貨太慢了
  •   看了這么多覺得挺好
  •   書挺好的,就是翻譯的一般,可以和英文版的對照著看。
  •   是一本SQL Server 2008數(shù)據(jù)挖掘入門的好書,
    有哪位在工作上也用到里面的內(nèi)容嗎?求了解。
  •   內(nèi)容挺多,基本上有深入談到數(shù)據(jù)挖掘的原理和一些技術(shù)。
  •   我畢業(yè)論文就是用的這本書,挺好的,講的挺好,還有源代碼可以下載,唯一的就是講的例子有點少啊,貪心了,哈哈,比SQL 2005多了很多內(nèi)容
  •   還是適合有一定基礎(chǔ)的人來用,里面的很多算法介紹的還算清楚,不過軟件配套說明個人覺得不是很清楚,要經(jīng)過嘗試安裝環(huán)境才能進一步了解??傊緯Ч€好。
  •   好書,目前根據(jù)這個學習工具。。
  •   書不錯,是我需要的圖書,這類書在國內(nèi)比較少,找了好久,很不錯的!
  •   內(nèi)容挺多的,講解感覺還不錯
  •   要是多些實例就更好了
  •   工具入門,非常適合參考
  •   講理論的地方特別多,概念多
  •   買完就后悔了,為了考試用來著,結(jié)果沒用上。
  •   真懷疑是不是直接用google翻譯的,看的快要崩潰了
  •   這書挺好,詳細介紹了Sql Server 2008的數(shù)據(jù)挖掘的幾個算法
  •   如果你想有所提高 建議你看看這本書 比較不錯
  •   書中基本沒有廢話,邏輯清晰。針對性強。
  •   書是正版的,很好,很有用,服務(wù)一流。
  •   可能由于本人理論太差,有些看不懂的說
  •   說翻譯的好的人,我真佩服他們的中文水平。我覺得比GOOGLE翻譯的好不了多少。很多英文中的長句也不斷句,完全照譯,說實話,晦澀難懂。
  •   本書講的也是理論偏多,對于想進行數(shù)據(jù)挖掘?qū)崙?zhàn)的意義感覺不大
  •   還不錯 用起來感覺還可以
  •   書已經(jīng)看完,又購買了一本送給了大姨,此書真的很不錯。翻譯的也很好,作者本身出身于微軟專業(yè)度毋庸置疑呀。此書個人感覺非常適合初學者,適合用來入門。
  •   希望翻譯的再好點,個別地方有錯別字。這本書很有實用價值
  •   翻譯的實在是不敢恭維。
  •   大概翻閱了一下,感覺還不錯,慢慢學習。
  •   講得挺詳細的,但就是第二章的示例沒找著~~
  •   最近幾天看完了,感覺寫的很系統(tǒng),深入淺出,翻譯得也很好。適合入門級,算是MS SQLserver BI書中最好的一本了。
  •   深入介紹了數(shù)據(jù)挖掘技術(shù),學習了
  •   還沒看。封面挺臟的,感覺被放在地上。。很多劃痕
  •   關(guān)于SQL的數(shù)據(jù)挖掘
  •   數(shù)據(jù)挖掘原理與應(yīng)用…………
  •   數(shù)據(jù)挖掘原理與應(yīng)用
  •   很不錯,經(jīng)典教材
  •   一般很不錯的書
  •   數(shù)據(jù)挖掘類書籍
  •   內(nèi)容豐富,很多實踐性的知識,喜歡
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7