出版時間:2004-1-1 出版社:中國財政經(jīng)濟(jì)出版社 作者:邁克爾?J?A?貝里,戈登?S?利諾夫 頁數(shù):373 字?jǐn)?shù):500000 譯者:袁衛(wèi)
Tag標(biāo)簽:無
內(nèi)容概要
數(shù)據(jù)挖掘是信息領(lǐng)域發(fā)展最快的技術(shù),很多不同領(lǐng)域的專家,比如統(tǒng)計學(xué)家、數(shù)據(jù)庫專家等,都從中獲得了發(fā)展的空間,使得數(shù)據(jù)挖掘日益成為企業(yè)界討論的熱門話題。隨著信息技術(shù)的發(fā)展,人們采集數(shù)據(jù)的手段日益豐富與高明,由此積累的數(shù)據(jù)日益膨脹,數(shù)據(jù)量達(dá)到GB甚至TB級,而且高維數(shù)據(jù)也日益成為主流。這些海量數(shù)據(jù)及其高維特征使得傳統(tǒng)的數(shù)據(jù)分析手段相形見絀。計算機(jī)性能的日益更新,使得人們能夠期望計算機(jī)幫助我們分析與理解數(shù)據(jù),幫助我們以豐富的數(shù)據(jù)為基礎(chǔ)做出正確決策。
作者簡介
邁克爾·貝里和戈登·利諾夫是數(shù)據(jù)挖掘公司的創(chuàng)始人,這是美國一家很受歡迎的數(shù)據(jù)挖掘顧問公司。在從事數(shù)據(jù)挖掘項(xiàng)目之余,他們在世界各地講課、演講,所到之處均大受歡迎。
公司站點(diǎn):www.data-miners.com,該站點(diǎn)內(nèi)容包括:最新的數(shù)據(jù)挖掘產(chǎn)品和服務(wù)提供商的信息
書籍目錄
第1部分 本書焦點(diǎn) 第1章 數(shù)據(jù)挖掘概述 第2章 為什么要精通數(shù)據(jù)挖掘這門藝術(shù) 第3章 數(shù)據(jù)挖掘方法論:互動循環(huán)系統(tǒng) 第4章 客戶和他們的生命周期第2部分 數(shù)據(jù)挖掘的三大支柱 第5章 數(shù)據(jù)挖掘技術(shù)與算法 第6章 無所不在的數(shù)據(jù) 第7章 建立有效的預(yù)測模型 第8章 實(shí)施控制:建立數(shù)據(jù)挖掘環(huán)境第3部分 案例研究 第9章 數(shù)據(jù)挖掘在目錄直銷業(yè)中的應(yīng)用 第10章 數(shù)據(jù)挖掘在在線銀行業(yè)中的應(yīng)用 第11章 數(shù)據(jù)挖掘在無線通信業(yè)中的應(yīng)用 第12章 數(shù)據(jù)挖掘在電信業(yè)中的應(yīng)用 第13章 誰正在買什么? 第14章 不浪費(fèi)、不短缺:改善生產(chǎn)流程 第15章 社會議題:數(shù)據(jù)挖掘與隱私權(quán) 索引
章節(jié)摘錄
第1部分 本書焦點(diǎn) 第1章 數(shù)據(jù)挖掘概述 要準(zhǔn)確地回顧并概括過去一個世紀(jì)的巨變是很難的事情。盡管我們可以直接感受到各個領(lǐng)域 中的變化,但我們很難發(fā)現(xiàn)哪個領(lǐng)域的變化能超越信息數(shù)量的增加。信息爆炸為各行各業(yè)提供了新的機(jī)遇,同時也引致了一些新的問題,從制造業(yè)到醫(yī)藥行業(yè)再到市場營銷無不如此。若要評價過去若干年世界信息儲量的增加,就有必要回顧20世紀(jì)中具有歷史意義的事件?! ?900年,世界人口是16億(除信息之外另一個可稱為“爆炸”的領(lǐng)域)。而100年后,世界人口達(dá)到了60億。人口爆炸導(dǎo)致在20世紀(jì)結(jié)束時人口達(dá)到該世紀(jì)初的3.75倍?! ?906年,斯坦利孿生兄弟——弗朗西斯和弗里蘭(Stanley Francis和Stanley Freelan)用斯坦利蒸汽機(jī)車創(chuàng)造了每小時l22英里的地速世界記錄。在當(dāng)時,船在水中每小時行駛15英里已經(jīng)是相當(dāng)快的了;而飛機(jī)能夠上天也才僅有3年的歷史。因而,當(dāng)時地速的這一記錄沒有挑戰(zhàn)者。而在63年以后,阿波羅號宇宙飛船飛往月球時的速度達(dá)到了每小時25000英里,是蒸汽機(jī)車創(chuàng)造的記錄的205倍?! 〉窃嘛w行是另一個新的里程碑。1900年,人們所能抵達(dá)的最遠(yuǎn)的旅程大約為25000英里,也就是環(huán)繞地球一圈的距離。到達(dá)月亮的往返路程大約是環(huán)球旅行的19倍。以上這些數(shù)字給人的印象是深刻的,但所有這些都無法與公司數(shù)據(jù)的增長相比。在20世紀(jì)初,或者即使到了20世紀(jì)中葉,沒有一個公司的賬目、訂貨記錄和文件柜的數(shù)據(jù)總和能超過幾十個百萬字節(jié)(megabytes)。今天,最大的公司數(shù)據(jù)庫的容量是用萬億字節(jié)(terabytes)來計量的。對于這些公司來說,數(shù)據(jù)的增長是以10萬倍來計量的。這些比較主要是用文字和數(shù)字的形式進(jìn)行(本書都采用相似的比較)。影像和錄音也可儲存大量數(shù)據(jù)和信息,同樣是我們所關(guān)注的,但本書所介紹的數(shù)據(jù)挖掘技術(shù)還不能適用于視頻和音頻數(shù)據(jù)的挖掘工作中。
媒體關(guān)注與評論
“在21世紀(jì),公司的生存取決于海量商務(wù)數(shù)據(jù)是否被有效利用。貝里和利諾夫帶領(lǐng)讀者穿越了一條(數(shù)據(jù)挖掘)最佳實(shí)踐的啟迪之路?!薄 贰す诺履翁?,SAS研究所主席和聯(lián)合發(fā)起人 “數(shù)據(jù)挖掘是理解網(wǎng)上客戶行為,并幫助互聯(lián)網(wǎng)企業(yè)創(chuàng)建個性化客戶服務(wù)的重要工具,是電子商務(wù)時代的重要工具。這是一本偉大的書,它是我專業(yè)工作中四、五本必備手冊之一?!薄 瓲柗颉そ鸩?,《數(shù)據(jù)倉庫生命周期工具箱》作者 “本書解決了二個重要問題:從實(shí)際操作層面闡述數(shù)據(jù)挖掘并將它與商業(yè)世界聯(lián)系起來,太多數(shù)據(jù)挖掘者忘記了他們最終是為商業(yè)服務(wù)的,但本書的作者沒有犯這個低級錯誤。如果你對數(shù)據(jù)挖掘有興趣,本書是必讀書?!薄 葼枴ひ蛎?,《創(chuàng)建數(shù)據(jù)倉庫》作者
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載