證析

出版時(shí)間:2012-5  出版社:華夏出版社  作者:鄭毅  頁數(shù):392  字?jǐn)?shù):400000  
Tag標(biāo)簽:無  

前言

序言:探索知識新邊疆拿到鄭毅這本《證析》,便愛不釋手,一氣呵成地讀了下來。一方面因?yàn)樗挠^點(diǎn)正是我所想證實(shí)與了解的,同時(shí)也為他證據(jù)充分、文采飛揚(yáng)的內(nèi)容所感動。前一段到英國參加萬事達(dá)董事會,參觀戰(zhàn)爭博物館時(shí),看到了時(shí)任海軍大臣的丘吉爾在1912年1月的一張關(guān)于英國艦隊(duì)未來的動力是用本土的煤還是新科技進(jìn)口的石油為原料的便條,丘吉爾力排眾議,有遠(yuǎn)見的確定石油為動力。這個(gè)決策使英國海上力量又稱霸了幾十年。當(dāng)時(shí)我在想,如果今天的海洋是數(shù)據(jù)信息,那什么是征服這個(gè)數(shù)據(jù)海洋的“油動力”?人類文明的歷史也是知識發(fā)現(xiàn)、地域邊疆拓展的歷史。科技創(chuàng)新在地域疆土的擴(kuò)張過程中扮演著重要的角色。從西班牙人的三桅船,到英國的蒸汽機(jī)動力,地理的擴(kuò)張隨之帶來財(cái)富的積累,生活質(zhì)量的提高。人們的世界觀也因此發(fā)生巨大的變化。大航海使我們知道地球是圓的,天文望遠(yuǎn)鏡、顯微鏡的發(fā)明及一系列理論的創(chuàng)新,使我們認(rèn)識到了宇宙與微生物,前者使人類感到自己的渺小與“僅有一個(gè)地球”的珍貴,后者讓我們發(fā)現(xiàn)的抗菌素等醫(yī)藥使我們的生命質(zhì)量得以提高。二十世紀(jì),尤其是二戰(zhàn)之后,野蠻殖民,依靠征疆拓土的方式獲得財(cái)富早已發(fā)生變化。五十年代的計(jì)算機(jī)技術(shù),使人類對數(shù)據(jù)、信息的存儲、處理與理解發(fā)生了質(zhì)的飛躍。從IBM主機(jī)的產(chǎn)生,到七十年代個(gè)人計(jì)算機(jī)的出現(xiàn),社會、企業(yè)、個(gè)人的生活已經(jīng)離不開“計(jì)算”技術(shù),正如同工業(yè)的革命“動力”使人們的體力得以擴(kuò)張,“計(jì)算機(jī)”使人們“智力”得以提高。但我們所有過去的“計(jì)算”構(gòu)架,基本上是處理、存儲“結(jié)構(gòu)化”的數(shù)據(jù)(某人、某時(shí)完成了某一事件)。這種結(jié)構(gòu)型數(shù)據(jù)為提高企業(yè)的效率起到革命性的作用。同時(shí)歷史上,這些結(jié)構(gòu)數(shù)據(jù)的大量積累、沉淀,如同遠(yuǎn)古的礦藏能源一樣,存儲了大量的“數(shù)據(jù)原礦”。九十年代之后,互聯(lián)網(wǎng)的出現(xiàn),數(shù)據(jù)的產(chǎn)生與積累又如火山爆發(fā)般的擴(kuò)大,而文字?jǐn)?shù)據(jù)開始變?yōu)閳D片、視頻、互動、三維等更大量的形態(tài)各異的數(shù)據(jù),這些數(shù)據(jù)的特征是“非結(jié)構(gòu)”,它與事件、社會情緒、天氣等諸多不可預(yù)測的因素有關(guān)?!敖Y(jié)構(gòu)數(shù)據(jù)”很像牛頓力學(xué),而互聯(lián)網(wǎng)“非結(jié)構(gòu)數(shù)據(jù)”則像量子力學(xué)。從生物學(xué)角度來看,“結(jié)構(gòu)數(shù)據(jù)”很像人的理性左腦,而“非結(jié)構(gòu)數(shù)據(jù)”則如同控制我們情緒的右腦。而對世界的認(rèn)識需要對兩種數(shù)據(jù)的分析。近十年來,計(jì)算領(lǐng)域正向從對數(shù)據(jù)的交易、記錄到對數(shù)據(jù)的分析、比較、提煉、再分析以產(chǎn)生正確認(rèn)識的過程發(fā)展。這個(gè)領(lǐng)域正是“證析”。正如此,“大數(shù)據(jù)”成為近兩年計(jì)算、投資領(lǐng)域最熱門的話題。迅速發(fā)展的“云計(jì)算”,則為“大數(shù)據(jù)”提供了規(guī)模、便宜的計(jì)算平臺。對“大數(shù)據(jù)”分析意義重大。如果個(gè)人的智慧以智商為衡量標(biāo)準(zhǔn),“大數(shù)據(jù)”的理解與運(yùn)用是關(guān)于企業(yè)的“智商”,它的目的是提高企業(yè)的決策質(zhì)量。它的技術(shù)基礎(chǔ)是通過各種統(tǒng)計(jì)、算法,加上前所未有的“云計(jì)算”能力。我們對大規(guī)模的各種數(shù)據(jù)進(jìn)行“冶煉”,從數(shù)據(jù)中發(fā)現(xiàn)關(guān)聯(lián),發(fā)現(xiàn)知識,成為我們對未來判斷決策的依據(jù)。它的數(shù)據(jù)基礎(chǔ)在于企業(yè)、社會的大量積累,它的計(jì)算方法則是這些年運(yùn)用、實(shí)踐的各種算法,尤其是互聯(lián)網(wǎng)企業(yè)的算法與軟件模型,此書都有詳細(xì)的描述?!按髷?shù)據(jù)”在中國的研究與實(shí)踐對現(xiàn)代化進(jìn)程有著重大意義。這個(gè)領(lǐng)域在理論與實(shí)踐均是剛剛起步。如果我們下大力氣,從實(shí)踐到理論,從理論到實(shí)踐來抓起,有可能在此領(lǐng)域參與、推動甚至領(lǐng)導(dǎo)世界上此行業(yè)的發(fā)展。我相信數(shù)十年后,人類對數(shù)據(jù)-信息-知識過程的創(chuàng)新,會如同蒸汽機(jī)、計(jì)算機(jī)的誕生一樣將是一個(gè)重大領(lǐng)域的創(chuàng)新。對建設(shè)創(chuàng)新性國家的中國無疑是歷史性的機(jī)遇。其次,中國現(xiàn)代化中城市化的很多問題,如交通、教育、醫(yī)療、社會管理等用傳統(tǒng)的方法走不通,或者成本太高,而基于數(shù)據(jù)的證析可能是解決此類問題的選擇。最后,這個(gè)領(lǐng)域的發(fā)展孕育著巨大的產(chǎn)業(yè)機(jī)會,隨著人類對數(shù)據(jù)的依賴性不斷增加,我們每個(gè)人生下來的數(shù)據(jù)(生理與心理數(shù)據(jù))均會被記錄下來,我們將有一個(gè)“數(shù)據(jù)銀行”,因此,數(shù)據(jù)加工業(yè),數(shù)據(jù)工廠等新產(chǎn)業(yè)形式將層出不窮。它將帶來幾十萬、上百萬新型軟件工程師、數(shù)據(jù)分析師等新的工作與就業(yè)機(jī)會,中國應(yīng)有可能在過去幾十年成為世界工廠后,在未來幾十年成為世界的“數(shù)據(jù)工廠”。鄭毅寫這本書的經(jīng)歷是值得尊敬的歷程。他曾服務(wù)于多家公司。在公司的商業(yè)環(huán)境不具備合適的研究條件的情況下,他肯于為自己喜歡的證析領(lǐng)域研究付出巨大代價(jià)創(chuàng)造條件,長期潛心學(xué)習(xí)、理解、著學(xué)立說。這樣的精神在當(dāng)今商品化、短視與功利化的氛圍中尤顯可貴。他大量廣泛的閱讀,認(rèn)真嚴(yán)謹(jǐn)?shù)乃饕?,并且把技術(shù)放在人文、社會的背景下闡述,此書可起到范例作用。多少也印證了他的名字“明心正義”,“士不可以不弘毅”的中國優(yōu)秀治學(xué)傳統(tǒng)與理想主義精神。此書不足之處,是對“云計(jì)算”與“大數(shù)據(jù)”這對孿生姐妹的關(guān)系剖析未能深入,我期待他下一部書在這方面進(jìn)一步的探索。中國寬帶資本基金董事長 田溯寧博士2012年3月

內(nèi)容概要

  在前言部分之外,分為上下兩編。上編對證析所處的時(shí)代背景、證析對傳統(tǒng)決策方式的挑戰(zhàn)、證析在企業(yè)中的應(yīng)用案例進(jìn)行介紹;下篇主要從證析對企業(yè)的價(jià)值,為了發(fā)揮證析的價(jià)值而在企業(yè)組織架構(gòu)、考核體系、決策流程等方面應(yīng)有的考慮。

作者簡介

鄭毅,本科畢業(yè)中國科學(xué)技術(shù)大學(xué),于計(jì)算機(jī)科學(xué)與技術(shù)系獲理學(xué)學(xué)士學(xué)位,于信息科學(xué)與電子工程系獲工學(xué)學(xué)士學(xué)位。于中國科學(xué)院計(jì)算技術(shù)研究所獲計(jì)算機(jī)專業(yè)工學(xué)碩士學(xué)位。專業(yè)領(lǐng)域?yàn)槿斯ぶ悄堋?shù)據(jù)挖掘,并對復(fù)雜系統(tǒng)方向也有長期的興趣與關(guān)注。曾供職于多家軟件公司從事商務(wù)智能、數(shù)據(jù)挖掘等方面工作,長期為大型企業(yè)提供數(shù)據(jù)分析、商業(yè)咨詢等方面服務(wù),具有豐富的接觸與分析海量數(shù)據(jù)的經(jīng)驗(yàn),并有豐富的商業(yè)領(lǐng)域業(yè)務(wù)實(shí)踐經(jīng)驗(yàn)。作者的教育背景、從業(yè)經(jīng)歷以及興趣范圍是本書誕生的基礎(chǔ)。本書是作者獨(dú)立研究的成果。作者申請國家發(fā)明專利兩項(xiàng),并有譯著出版。

書籍目錄

序言
前言
上 編
 第一章 決策的誤區(qū)
第一節(jié) “理論”和“專家”的誤區(qū)
第二節(jié) 方法的誤區(qū)
第三節(jié) 人的誤區(qū)
 第二章 實(shí)驗(yàn)及其應(yīng)用
第一節(jié) 實(shí)驗(yàn)與循證醫(yī)學(xué)
第二節(jié) 實(shí)驗(yàn)與政策制定
第三節(jié) 營銷與商業(yè)實(shí)驗(yàn)
第四節(jié) 實(shí)驗(yàn)的障礙
第五節(jié) 附:實(shí)驗(yàn)以及對消費(fèi)者行為的理解
 第三章 數(shù)據(jù)及其影響
第一節(jié) 數(shù)據(jù)搜集
第二節(jié) 信息流動
第三節(jié) 計(jì)算及其影響
 ……
下編

章節(jié)摘錄

版權(quán)頁:   插圖:   什么是證析?“證析”是英文單詞“analytics”的中文翻譯。Analytics是一個(gè)看起來很熟悉的“新詞”。它和analysis(分析)很像,從字面上可以推測這個(gè)詞和數(shù)據(jù)及分析相關(guān)。但我遍查包括《牛津高階英漢雙解詞典》、《朗文高階英漢雙解詞典》在內(nèi)的幾本流行的英文詞典,里面只收錄了analysis、analyze、analytical等詞條,而沒有發(fā)現(xiàn)analytics。如果按照英語的構(gòu)詞法,-ics這個(gè)詞根的意思是“關(guān)于……”,中文譯成“……學(xué)”,例如economics譯成經(jīng)濟(jì)學(xué),physics譯成物理學(xué),mathematics譯成數(shù)學(xué)。以此類推,analytics應(yīng)譯為分析學(xué)。然而,analytics不是一門象牙塔里的學(xué)問,從一開始analytics就有現(xiàn)實(shí)世界的意義,analytics的目的是提升現(xiàn)實(shí)世界中決策的質(zhì)量。簡單地說,analytics就是基于證據(jù)尤其是數(shù)字化證據(jù)進(jìn)行決策的實(shí)踐,它區(qū)別于那些基于經(jīng)驗(yàn)、直覺、甚至膽識進(jìn)行的決策。Analytics更多應(yīng)用于商業(yè)領(lǐng)域的決策,和business一道構(gòu)成business analytics。Thomas Davenport等人對analytics定義“Analytics指的是廣泛應(yīng)用數(shù)據(jù)、使用統(tǒng)計(jì)與量化分析方法、使用描述性與預(yù)測性模型以及基于事實(shí)的管理方法影響決策和行動的實(shí)踐Thomas HDavenport,Jeanne GHarris,Competing On Analytics:The New Science of Winning,Harvard Business School Publishing Corporation,2007,p7.中譯本:康蓉 吳越譯:《數(shù)據(jù)分析競爭法——企業(yè)贏之道》,商務(wù)印書館,2009年?!??!禔nalytics》雜志給出的analytics定義是“用數(shù)學(xué)、運(yùn)籌學(xué)、統(tǒng)計(jì)學(xué)影響商業(yè)決策Analytics Magazine網(wǎng)站首頁。”。在其產(chǎn)生與發(fā)展過程中,大學(xué)、研究院所絕不是其唯一的驅(qū)動力,其驅(qū)動力更多來自業(yè)界通過搜集和分析數(shù)據(jù)以從中獲取最大化的價(jià)值的努力,業(yè)界利用數(shù)據(jù)指導(dǎo)從產(chǎn)品設(shè)計(jì)、物流規(guī)劃到推廣營銷的一系列決策。如果像經(jīng)濟(jì)學(xué)簡稱經(jīng)濟(jì)、物理學(xué)簡稱物理一樣,analytics應(yīng)該譯成分析。SAS、IBM、Google等跨國企業(yè)所提供的產(chǎn)品與服務(wù)中也都將analytics譯成“分析”。然而,這很難不產(chǎn)生混淆,analytics經(jīng)常應(yīng)用于商業(yè)領(lǐng)域,將analytics譯成“分析”會將business analysis和business analytics兩個(gè)差別很大的領(lǐng)域都稱為“業(yè)務(wù)分析”。Business analysis是“分析業(yè)務(wù)領(lǐng)域的結(jié)構(gòu)、過程和問題,并向解決方案提供者呈現(xiàn)業(yè)務(wù)需求Howard Podeswa,The Business Analyst's Handbook,Course Technology PTR,2009,p297.”。在IT領(lǐng)域,business analysis的目的主要是分析與獲取IT系統(tǒng)的需求,其結(jié)果可能是獲取諸如“所有使用者都能遠(yuǎn)程無線登錄客戶關(guān)系管理系統(tǒng)”這樣的需求。雖然定量數(shù)據(jù)對于獲取這樣需求有所幫助,但它不是必要條件。這樣的需求不一定是以數(shù)據(jù)為基礎(chǔ)的,要得到這樣的需求不一定會用到數(shù)學(xué)或統(tǒng)計(jì)學(xué)的分析手段。同時(shí),“分析”已經(jīng)變成一個(gè)意義很寬泛的常用詞,例如時(shí)政分析、電影人物分析、精神分析中的分析都符合“把一件事物、一種現(xiàn)象、一個(gè)概念分成較簡單的組成部分,找出這些部分的本質(zhì)屬性和彼此之間的關(guān)系(跟‘綜合’相對)現(xiàn)代漢語詞典?!钡亩x,但都不是以數(shù)據(jù)為基礎(chǔ)、不是以數(shù)學(xué)、統(tǒng)計(jì)學(xué)為主要手段進(jìn)行的分析。雖然用數(shù)據(jù)支持決策已經(jīng)有很長的歷史,但數(shù)據(jù)介入決策所能達(dá)到的深度、廣度以及所具備的潛力卻是前所未有的。技術(shù)的發(fā)展使得計(jì)算資源變得更加豐富、便利和便宜,從而使得數(shù)據(jù)搜集的能力、數(shù)據(jù)存儲的能力以及數(shù)據(jù)處理的能力極大地豐富,為analytics的普及提供了技術(shù)的基礎(chǔ)。數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)的發(fā)展使得人們能夠運(yùn)用更加復(fù)雜的數(shù)學(xué)模型與算法分析數(shù)據(jù),豐富了analytics分析數(shù)據(jù)的手段。而哲學(xué)、經(jīng)濟(jì)學(xué)、管理學(xué)、社會學(xué)、心理學(xué)的發(fā)展使得理性在決策中占據(jù)越來越重要的地位,這些學(xué)科的發(fā)展為analytics提供了思想與理論的準(zhǔn)備。商業(yè)與貿(mào)易的全球化使得大型企業(yè)生產(chǎn)、運(yùn)營、物流等流程的復(fù)雜程度超出了人類直覺所能掌控的范圍,通信手段的發(fā)達(dá)使得一對一的溝通與個(gè)性化生產(chǎn)成為可能這也要求企業(yè)能夠利用自動化的機(jī)器決策在大量低價(jià)值交易中獲利,商業(yè)需求為analytics的成長提供了土壤。2008年起IBM等跨國公司開始在analytics的名義下重新組織或完善自己的產(chǎn)品線。以Analytics為名的雜志也于2008年開始發(fā)行,大學(xué)也開始授予analytics的理學(xué)碩士學(xué)位。Analytics是本書的主題,是學(xué)科和時(shí)代發(fā)展到現(xiàn)階段的新產(chǎn)物,正如英語中使用一個(gè)偏僻的單詞analytics以和analysis區(qū)分一樣,本書為了行文方便也自創(chuàng)就我目前所掌握的信息,analytics在漢語中沒有統(tǒng)一的譯名。它經(jīng)常被直接翻譯成“分析”,例如IBM公司新成立了一條服務(wù)產(chǎn)品線叫做Business Analytics and Optimization,中文名字是“業(yè)務(wù)分析及優(yōu)化”;SAS公司的analytics解決方案的中文網(wǎng)站上的名字是“分析挖掘技術(shù)”;Google的產(chǎn)品Google Analytics的中文網(wǎng)站將該產(chǎn)品稱為“Google Analytics(分析)”。本人暫時(shí)還未看到有關(guān)analytics的中文原創(chuàng)圖書出版,也許本書將是一個(gè)首創(chuàng)。而引進(jìn)的有關(guān)analytics的英文圖書中anlytics也沒有一個(gè)合適的翻譯,以Competing on Analytics一書為例,中國大陸出版的簡體中文版《數(shù)據(jù)分析競爭法:企業(yè)贏之道》由吳越翻譯,商務(wù)印書館2009年出版,書中將analytics根據(jù)行文方便譯成“數(shù)據(jù)分析法”、“數(shù)據(jù)分析”和“分析”。該書在中國臺北出版的繁體中文版書名為《魔鬼都在數(shù)據(jù)里》由胡瑋珊譯,書中將analytics根據(jù)不同語境譯成“分析”、“分析競爭力”以及“檢視分析法”。該書的日文版書名為《分析力を武器とする企業(yè)強(qiáng)さを支える新しい戦略の科學(xué)》,將analytics翻譯成“分析力”。如前所述,“分析”這個(gè)譯法無法和其他語境下analysis的翻譯相區(qū)分,而其他翻譯方法要么顯得太學(xué)術(shù)化、要么顯得太累贅。因?yàn)閍nalytics一詞是本書的核心,所以這里花一定篇幅討論這個(gè)詞應(yīng)該怎么翻譯。本文行文過程中,在不引起混淆的地方仍然沿用“分析”一詞,例如“數(shù)據(jù)分析”,而用“證析”一詞特指以對數(shù)字的分析為主要特點(diǎn)的方法、項(xiàng)目以及思想。并且,將從事證析工作的人也稱作“分析師”而不是“證析師”。一個(gè)漢語詞匯“證析”特別指代最近興起的analytics實(shí)踐。證,是證據(jù)的證,這個(gè)證據(jù)更多強(qiáng)調(diào)的是定量的證據(jù),也就是數(shù)據(jù);析,仍然是分析的析,“析萬物之理”,分析數(shù)據(jù)以產(chǎn)生新的洞察,據(jù)此影響決策,從而提升績效。證析就是指代對量化證據(jù)進(jìn)行分析以影響決策的實(shí)踐。當(dāng)人們想到使用數(shù)據(jù)指導(dǎo)商業(yè)決策時(shí),往往過于強(qiáng)調(diào)證析中“析”的一面,強(qiáng)調(diào)使用數(shù)理統(tǒng)計(jì)模型、數(shù)據(jù)挖掘工具等數(shù)學(xué)手段分析數(shù)據(jù),這是一個(gè)相對被動的過程。在證析中“證”的一面同樣重要,也就是需要主動地搜集數(shù)據(jù)、搜集證據(jù)以指導(dǎo)決策。并且,“分析”一詞中的“分”字強(qiáng)調(diào)分解的手段,強(qiáng)調(diào)還原論的方法論。而在證析的具體實(shí)踐中,采用還原論還是整體論的方法論并不重要,重要的是尋找到能夠指導(dǎo)決策的、證明什么樣的做法是有效的證據(jù)。如就其技術(shù)與實(shí)踐的淵源而論,業(yè)務(wù)證析(Business Analytics)和商業(yè)智能(Business Intelligence)之間存在著密切的聯(lián)系,很多從事業(yè)務(wù)證析工作的團(tuán)隊(duì)目前仍隸屬于公司的商業(yè)智能團(tuán)隊(duì)。根據(jù)《數(shù)據(jù)庫系統(tǒng)百科全書》的商業(yè)智能詞條給出的定義“確切地說,它(商業(yè)智能)指的是一組工具和技術(shù),這組工具和技術(shù)使得企業(yè)能夠?qū)⑵錁I(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換成決策流程中所需的及時(shí)、準(zhǔn)確的信息,它將信息以合適的形式傳遞給合適的人。……從體系架構(gòu)的觀點(diǎn)看,商業(yè)智能系統(tǒng)的核心是以一致的、整合的形式儲存企業(yè)歷史數(shù)據(jù)的數(shù)據(jù)倉庫Ling Liu,M.Tamer zsu (Eds.),Encyclopedia of Database Systems,Springer,2009,p288。另外,Business Intelligence仿照Artificial Intelligence譯成“人工智能”而約定俗成的譯為商業(yè)智能或者商務(wù)智能。Business Intelligence一詞首次于出現(xiàn)在1958年H.P.Luhn題為“A Business Intelligence System” (H.P.Luhn,A Business Intelligence System,IBM Journal,October,1958,p314-319)的文章中。文中Luhn給Intelligence更為寬泛的定義,“理解現(xiàn)有事實(shí)之間的關(guān)系從而指導(dǎo)行動以達(dá)成特定目標(biāo)的能力”。可以看出,在Luhn的定義中并沒有一味強(qiáng)調(diào)技術(shù)手段的重要性,與剛剛誕生兩年的Artificial Intelligence之間沒有必然的聯(lián)系。在此定義下的intelligence中“智能”的含義并不那么突出,其含義更接近intelligence的另外一種翻譯“情報(bào)”。然而,與商業(yè)智能的強(qiáng)調(diào)技術(shù)手段和工具不同,業(yè)務(wù)證析強(qiáng)調(diào)的不是技術(shù)手段而是強(qiáng)調(diào)用技術(shù)手段解決業(yè)務(wù)問題。傳統(tǒng)的商業(yè)智能包括諸如從業(yè)務(wù)系統(tǒng)中抽取數(shù)據(jù)、將數(shù)據(jù)以合理的方式組織與存儲在數(shù)據(jù)倉庫、及制作報(bào)表等工作。雖然這些工作為業(yè)務(wù)證析提供了重要數(shù)據(jù)支撐,但這些工作絕不是業(yè)務(wù)證析的全部,業(yè)務(wù)證析需要利用商業(yè)智能系統(tǒng)中所搜集的數(shù)據(jù)進(jìn)行數(shù)學(xué)建模與分析以支撐業(yè)務(wù)決策。并且,業(yè)務(wù)證析的數(shù)據(jù)來源也不限于數(shù)據(jù)倉庫。例如為測試店面中不同的貨品擺放方式對營業(yè)額的影響,一家連鎖超市開展了一次實(shí)驗(yàn),并用實(shí)驗(yàn)的數(shù)據(jù)設(shè)計(jì)出最佳的貨品擺放方式。這是一個(gè)業(yè)務(wù)證析的過程,但這個(gè)業(yè)務(wù)證析過程中數(shù)據(jù)的產(chǎn)生、搜集以及分析都不必經(jīng)過數(shù)據(jù)倉庫。證析和數(shù)據(jù)挖掘之間也存在區(qū)別。首先,數(shù)據(jù)挖掘是“從大量數(shù)據(jù)中抽取或挖掘知識的過程”Jiawei Han,Micheline Kamber,Data Mining:Concepts and Techniques,second edition,Elsevier Inc.,2006,p5.。數(shù)據(jù)挖掘是業(yè)務(wù)證析的重要技術(shù)手段,但并不是唯一的技術(shù)手段。例如上面例子提到的這次實(shí)驗(yàn),用到的技術(shù)手段就是統(tǒng)計(jì)學(xué)中的實(shí)驗(yàn)設(shè)計(jì)與分析,它處理的數(shù)據(jù)點(diǎn)只有幾十個(gè)而不是數(shù)據(jù)挖掘的定義中所提到的大量數(shù)據(jù)。除數(shù)據(jù)挖掘之外,模擬仿真、數(shù)學(xué)優(yōu)化等工具也是加工數(shù)據(jù)、產(chǎn)生洞察的重要技術(shù)手段。其次,數(shù)據(jù)挖掘是一種二手?jǐn)?shù)據(jù)分析(secondary data analysis)的手段,它對已有的數(shù)據(jù)進(jìn)行分析,通常從事數(shù)據(jù)挖掘的人不會直接參與到數(shù)據(jù)搜集的過程中David Hand,Heikki Mannila,Padhraic Smyth,Principles of Data Mining,MIT,2001,p132.。而這個(gè)例子中,業(yè)務(wù)證析的工作也包括設(shè)計(jì)數(shù)據(jù)采集方案并采集數(shù)據(jù)等工作。有時(shí)業(yè)務(wù)證析在為決策提供支撐時(shí)遇到的最大困難是如何設(shè)計(jì)有效的度量方法,例如,如何度量廣告對銷售的刺激效果、如何度量服務(wù)改善對客戶滿意度的提升等,一旦設(shè)計(jì)了合適的數(shù)據(jù)采集方式,業(yè)務(wù)證析的工作也完成了一半。所以,從這個(gè)角度講,業(yè)務(wù)證析的工作比數(shù)據(jù)挖掘的工作更加主動,它會主動參與數(shù)據(jù)搜集方案的設(shè)計(jì)以及分析結(jié)果應(yīng)用等工作。最后,數(shù)據(jù)挖掘可能會探索復(fù)雜的分析技術(shù),但業(yè)務(wù)證析不是以技術(shù)復(fù)雜性為目的,業(yè)務(wù)證析的目的是提升決策質(zhì)量。無論技術(shù)是否復(fù)雜,只要能分析數(shù)據(jù)、提升決策質(zhì)量就是對業(yè)務(wù)證析有用的技術(shù)手段。數(shù)據(jù)挖掘是一項(xiàng)應(yīng)用技術(shù),隨著業(yè)務(wù)證析應(yīng)用于新的業(yè)務(wù)領(lǐng)域、新數(shù)據(jù)的出現(xiàn)以及新的業(yè)務(wù)需求的出現(xiàn),也需要數(shù)據(jù)挖掘不斷發(fā)展技術(shù)、拓展其應(yīng)用領(lǐng)域。在前幾年,數(shù)據(jù)挖掘曾熱極一時(shí),但經(jīng)過一段時(shí)間的實(shí)踐發(fā)現(xiàn),雖然數(shù)據(jù)挖掘能解決很多問題,但并不如廠商所鼓吹的那樣包辦一切,而有時(shí)為了分析數(shù)據(jù)也不一定需要數(shù)據(jù)挖掘這個(gè)技術(shù)手段。在這種背景下,廠商與企業(yè)開始關(guān)注以解決問題為出發(fā)點(diǎn)的業(yè)務(wù)證析Google趨勢(trends.google.com)是google提供的一項(xiàng)服務(wù),可以獲取不同關(guān)鍵詞的查詢量。從Google趨勢中可以看出,人們對于data mining的關(guān)注在一直平穩(wěn)下降,而2006年起人們對于analytics一詞的關(guān)注持續(xù)上升,2011年人們對于analytics一詞的關(guān)注度是對data mining一詞關(guān)注度的15倍以上。這里需再次強(qiáng)調(diào),判斷是否是采用證析的方法解決業(yè)務(wù)問題不是以所采用的數(shù)學(xué)分析手段是否足夠高級、足夠復(fù)雜為依據(jù)。例如,為監(jiān)控員工的滿意度,微軟公司2006年申請了一項(xiàng)專利技術(shù),利用這項(xiàng)專利技術(shù)計(jì)算機(jī)可以監(jiān)控員工的血壓、心跳、甚至面部表情。當(dāng)復(fù)雜的數(shù)據(jù)監(jiān)控與分析結(jié)果表明員工的挫折感很強(qiáng)時(shí),系統(tǒng)會發(fā)出警報(bào),也就是部門的主管該采取一些措施提升士氣了。當(dāng)然,這屬于業(yè)務(wù)證析的范疇,因?yàn)樗芾脭?shù)據(jù)幫助企業(yè)及時(shí)發(fā)現(xiàn)員工中存在的問題,并能及時(shí)做出干預(yù),不過它的實(shí)現(xiàn)極為復(fù)雜,并耗資不菲Stephen Baker,Numerati,Marine Books,2008,p19.。為了對員工的滿意度進(jìn)行分析,還有另外的做法。有一家公司給每一位員工發(fā)了一袋玻璃球,這些球有紅色、黃色、藍(lán)色。員工每天下班時(shí)根據(jù)自己今天的情緒是高興、一般或沮喪,向本部門的瓶子里投入一顆紅球、黃球或藍(lán)球。第二天早上,公司總經(jīng)理通過統(tǒng)計(jì)每個(gè)部門瓶子里不同顏色球的個(gè)數(shù)來分析員工的情緒如何,如果統(tǒng)計(jì)顯示某部門的瓶子中藍(lán)球突然增多,也就是昨天員工情緒不太好,則提醒總經(jīng)理要采取什么措施了。它的分析很簡單,簡單到用一張紙和一支筆就能完成例子轉(zhuǎn)引自Mark Graham Brown著,謝軍容譯,《超越平衡計(jì)分卡:利用分析型指標(biāo)提高商業(yè)智慧》,中國財(cái)政經(jīng)濟(jì)出版社,2010;成本也很低廉,幾百塊錢就能實(shí)現(xiàn)。但是,它也屬于業(yè)務(wù)證析的范疇,因?yàn)樗彩撬鸭炕C據(jù)(每個(gè)瓶子里不同顏色的球的個(gè)數(shù)),對量化數(shù)據(jù)進(jìn)行分析并影響決策的過程。雖然本書對于如此簡單的業(yè)務(wù)證析討論得不多,但這里還是要強(qiáng)調(diào)復(fù)雜并不是業(yè)務(wù)證析的特征和目的。同樣,并非所有利用數(shù)據(jù)指導(dǎo)決策的實(shí)踐都是業(yè)務(wù)證析。想象下面的情況,你和你的合伙人午餐期間正在為是否投資于一個(gè)項(xiàng)目爭得面紅耳赤。最終,你們決定用一個(gè)古老的方式解決爭執(zhí)。你從餐桌的牙簽筒里隨手抽出一把牙簽,并約定如果這把牙簽是奇數(shù)支,你們就投資于這個(gè)項(xiàng)目,否則就此罷休。雖然這也是用數(shù)據(jù)(牙簽的數(shù)量)影響決策(是否投資項(xiàng)目),但讀者能看出這種方法和占卜求簽并無二致,肯定也沒有人反對不將其列入業(yè)務(wù)證析的范疇。有些決策雖然看似是以數(shù)據(jù)為基礎(chǔ)做出的,但它們并不能被稱為業(yè)務(wù)證析,因?yàn)樗^的數(shù)據(jù)和分析只是為主觀臆斷披上一層科學(xué)的外衣,不過這層皇帝的新裝并不像上面這個(gè)例子中數(shù)牙簽做決策那樣容易讓人識破。如果希望給出關(guān)于證析的一個(gè)清晰界限很可能會進(jìn)入形而上學(xué)的討論中,所以本書只會通過一些例子或議論說明證析是什么不是什么,而不會給出一個(gè)結(jié)論性的封閉定義。Harrah’s一個(gè)案例下面將以一個(gè)公司的實(shí)踐為例解釋什么是業(yè)務(wù)證析。Gary Loveman,1989年在美國頂尖學(xué)府麻省理工學(xué)院(MIT)獲得經(jīng)濟(jì)學(xué)博士學(xué)位。和現(xiàn)在相比,Gary Loveman讀書時(shí)所能獲得的數(shù)據(jù)十分有限,他認(rèn)為當(dāng)時(shí)擺弄的數(shù)學(xué)只是象牙塔里學(xué)究們出于個(gè)人興趣的消遣,而對真實(shí)世界的決策沒有幫助,這讓他一度感到不滿甚至沮喪Michael Schrage,“Q&A:The Experimenter”,Technology Review Website,posted February 18,2011,http://www.technologyreview.com/business/32351.。畢業(yè)后,他也和很多博士一樣在大學(xué)謀得一個(gè)教職,在哈佛大學(xué)商學(xué)院任教授。1994年他在《哈佛商業(yè)評論》上發(fā)表的一篇有關(guān)客戶服務(wù)的文章James L.Heskett,Thomas O.Jones,Gary W.Loveman,W.Earl Sasser,Jr.,and Leonard A.Schlesinger,“Putting the Service-Profit Chain to Work”,Harvard Business Review,March-April,1994,p164-174.引起商業(yè)界的廣泛關(guān)注。很多公司向他伸出了橄欖枝,他最終于1997年接受了主營賭場業(yè)務(wù)的Harrah’s Entertainment的邀請,擔(dān)任該公司首席運(yùn)營官。當(dāng)時(shí)他只準(zhǔn)備待兩年,為此請了兩年學(xué)術(shù)假期。但實(shí)際情況是他運(yùn)營Harrah’s之后就一發(fā)而不可收,再沒有返回哈佛大學(xué)而是在Harrah’s一直待下來,并于2003年接任該公司的首席執(zhí)行官,任職至今。教授運(yùn)營的賭場,注定成為博彩業(yè)中的異數(shù)。當(dāng)時(shí)拉斯維加斯的其他賭場都投巨資于一些動人心魄的炫目表演招徠顧客。而顧客對于Harrah’s的優(yōu)質(zhì)服務(wù)印象更深,這歸功于Loveman的使用數(shù)學(xué)運(yùn)營賭場的新理念。為增加客戶忠誠度,Harrah’s使用數(shù)據(jù)庫營銷技術(shù)以及基于分析的科學(xué)決策來拉開和競爭對手之間的距離。他們深入分析客戶的數(shù)據(jù),開展各種實(shí)驗(yàn),并用分析與實(shí)驗(yàn)的結(jié)果指導(dǎo)營銷與服務(wù),為顧客提供符合他們需求的服務(wù)。和航空公司流行的做法一樣,Harrah’s也推行了一套名為“完全回饋”(最初稱作Total Gold,后改稱Total Reward)的會員卡制度。會員卡分三個(gè)等級:金卡、白金卡、鉆石卡。顧客在Harrah’s隨時(shí)隨刻都要用到會員卡:停車、玩老虎機(jī)、用餐、住宿。會員卡搜集了大量客戶信息,使得Harrah’s不僅知道顧客的年齡、性別、家庭住址,還知道顧客喜歡玩二十一點(diǎn)還是老虎機(jī),玩了多長時(shí)間,多久來一次賭場,在賭場內(nèi)如何用餐,是否過夜等信息Gary Loveman,“Diamond in the Data Mine”,Harvard Business Review,May,2003,p109-113.。到2010年,Harrah’s已積累超過4000萬會員的信息,這是博彩業(yè)最大的客戶數(shù)據(jù)庫Karl Taro Greenfeld,“How to Survive in Vegas”,Bloomberg Businessweek,August9-August15,2010,p70-75.。傳統(tǒng)市場營銷中的市場戰(zhàn)略制定與數(shù)據(jù)庫營銷是兩個(gè)割裂的流程,往往首先制定了宏觀的市場策略,然后利用數(shù)據(jù)庫營銷等手段配合完成市場策略的實(shí)施。然而,Harrah’s與之不同,數(shù)據(jù)分析已成為Harrah’s整個(gè)運(yùn)營流程中的一部分,他們會用數(shù)據(jù)指導(dǎo)市場策略的制定。通過對會員卡數(shù)據(jù)及調(diào)研數(shù)據(jù)的研究發(fā)現(xiàn),客戶用于賭場娛樂的消費(fèi)中只有36%花在Harrah’s,其他錢都花在別的賭場。這對Harrah’s意味著機(jī)會,Harrah’s將市場策略建立在提高客戶的忠誠度上面,讓客戶盡可能多地在Harrah’s消費(fèi)。為提高客戶忠誠度,Harrah’s首先要弄清楚究竟是哪些人在Harrah’s消費(fèi)。數(shù)據(jù)表明26%的客戶貢獻(xiàn)了82%的收入。然而,出人意料的是,這部分顧客并不是大多數(shù)賭場一直在爭取的那些金領(lǐng)豪客,而是包括教師、醫(yī)生、銀行職員、技師在內(nèi)的中產(chǎn)階級的中老年顧客,他們有足夠的時(shí)間和收入來玩一把。和那些豪客不同,他們的賭博風(fēng)格并不是一擲千金,而更喜歡在那些一晚上只有幾十到幾百美元輸贏的老虎機(jī)上消磨時(shí)間。數(shù)據(jù)告訴Harrah’s,這些客戶很少在賭場過夜,他們都是下班的路上或者周末過來玩玩。并且,數(shù)據(jù)還告訴Harrah’s60美元的籌碼更能取悅這部分客戶,而他們對于30美元的籌碼外加一晚免費(fèi)住宿以及免費(fèi)的兩頓大餐不是那么感興趣,明顯前者的成本會更低一些。為了贏得顧客的忠誠,Harrah’s通過對顧客的消費(fèi)模式的分析,利用復(fù)雜的量化模型計(jì)算出顧客的長期價(jià)值(customer worth)——關(guān)注一個(gè)顧客理論上長期會在Harrah’s總共消費(fèi)多少,而不只關(guān)注某一晚上顧客的消費(fèi)。Harrah’s的市場策略是盡量讓顧客有更好的體驗(yàn)。系統(tǒng)能根據(jù)顧客的背景資料及歷史的消費(fèi)模式計(jì)算出顧客的痛苦點(diǎn)(pain point)——如果他輸錢超過痛苦點(diǎn),今晚的賭博會成為一個(gè)痛苦的回憶,離開Harrah’s后一去不返。例如,Shelly,34歲,白人女性,來自中產(chǎn)階級街區(qū),喜歡玩老虎機(jī)。系統(tǒng)預(yù)測她一晚賭博的痛苦點(diǎn)是輸900美元。如果系統(tǒng)發(fā)現(xiàn)Shelly馬上就要輸?shù)?00美元,這時(shí)Harrah’s會派出一位幸運(yùn)大使(luck ambassador)將她從老虎機(jī)前勸走。幸運(yùn)大使將告訴Shelly “看來你今天在老虎機(jī)上的運(yùn)氣不太好,是時(shí)候去餐廳大餐一頓了。送你一張20美元代金券,一小時(shí)內(nèi)有效?!盨helly雖然輸了錢,但回憶起來,這一晚的經(jīng)歷還不是太糟,至少還有免費(fèi)晚餐可以享用,她以后有機(jī)會還會再次拜訪Harrah’s。所以,Harrah’s對數(shù)據(jù)的利用已經(jīng)不是簡單的匯總數(shù)據(jù),也不只是對數(shù)據(jù)進(jìn)行動作遲緩的事后分析,已能實(shí)時(shí)收集數(shù)據(jù)、實(shí)時(shí)分析數(shù)據(jù),并對顧客的行為實(shí)時(shí)做出反應(yīng)。Harrah’s對數(shù)據(jù)的實(shí)時(shí)分析與應(yīng)用在賭場運(yùn)營的方方面面都有所體現(xiàn)。老虎機(jī)是賭場的一個(gè)熱門項(xiàng)目,有的顧客為了能玩上老虎機(jī)甘愿排隊(duì)。在排隊(duì)期間,顧客很可能等得不耐煩而離開。更為重要的是,顧客在排隊(duì)期間是不消費(fèi)的,不帶來任何利潤。當(dāng)某個(gè)老虎機(jī)排隊(duì)人太多時(shí),Harrah’s會開放某些其他區(qū)域的老虎機(jī),這些老虎機(jī)會有一些優(yōu)惠政策,并把信息通知到排隊(duì)的顧客。隨著證析能力的發(fā)展,Harrah’s將對數(shù)據(jù)的分析拓展到包括人力資源管理在內(nèi)的企業(yè)內(nèi)部運(yùn)營方方面面。例如,Harrah’s的經(jīng)理會統(tǒng)計(jì)員工在面對顧客時(shí)微笑的次數(shù),因?yàn)榻?jīng)過分析發(fā)現(xiàn)微笑次數(shù)和顧客滿意度極為相關(guān)。Harrah’s還能通過建立數(shù)學(xué)模型計(jì)算每張賭桌或其他客戶接觸點(diǎn)所需員工數(shù)量,從而將適量的具有合適技能的員工分配到相應(yīng)崗位上。Harrah’s經(jīng)分析還發(fā)現(xiàn)由快樂健康的員工為顧客提供服務(wù)能夠帶來更高的客戶滿意度,據(jù)此他們更加關(guān)注員工的健康福利計(jì)劃。Harrah’s還能量化評估健康和福利計(jì)劃對員工的敬業(yè)程度和財(cái)務(wù)績效的影響。他們敦促更多的員工定期去企業(yè)自辦診所接受預(yù)防性體檢與醫(yī)療服務(wù),這項(xiàng)措施降低了企業(yè)在緊急醫(yī)療救護(hù)所花費(fèi)的成本,在一年時(shí)間內(nèi)為企業(yè)節(jié)約了數(shù)百萬美元Thomas H.Davenport,Jeanne Harris,Jeremy Shapiro,“Competing on Talent Analytics”,Harvard Business Review,October 2010,p53-58.。Harrah’s在客戶服務(wù)方面所取得的進(jìn)步與Gary Loveman推行的一切從事實(shí)出發(fā)的企業(yè)文化分不開。如果一位主管在他面前說“我認(rèn)為……”,這位主管要倒霉了。Harrah’s已經(jīng)搜集到足夠的客戶信息,所有員工所做出的決策與建議都應(yīng)從數(shù)據(jù)出發(fā),應(yīng)該是“我知道……”,而不是簡單地從個(gè)人猜測出發(fā)的“我認(rèn)為……”。David O.Becker,“Gambling on Customers”,the McKinsey Quarterly,2003 Number2,p46-59.并且,Gary Loveman要求公司在每推出一項(xiàng)新的吸引客戶的方案前,先通過小規(guī)模的實(shí)驗(yàn)以驗(yàn)證方案的合理性,之后才能在整個(gè)公司范圍內(nèi)推廣。如果哪位主管未經(jīng)實(shí)驗(yàn)驗(yàn)證就上馬新方案,則很可能職位不保,因?yàn)樵贖arrah’s員工可能被開除的理由有三:“偷竊,調(diào)戲婦女,或沒有實(shí)行有控制組的實(shí)驗(yàn)”。為了用數(shù)字支撐決策,Harrah’s每年在信息系統(tǒng)上的投資超過1億美元,其核心是坐落于拉斯維加斯公司總部的數(shù)據(jù)庫服務(wù)器,在這里公司的IT部門和市場部門并肩工作。這一切投入都物有所值,在Gary Loveman的帶領(lǐng)下,Harrah’s從擁有15家賭場的地方性企業(yè)成長為擁有美國本土39家賭場、13家海外賭場的全球性企業(yè)。并且Harrah’s的收入連續(xù)5年保持兩位數(shù)的增長,到2008年收入達(dá)89億美元,成長為全球最大的博彩公司Harrahs網(wǎng)站,http://investor.harrahs.com.。證析所包括的內(nèi)容從Harrah’s的例子可以看到,證析的目的是使用數(shù)學(xué)手段、利用客觀證據(jù)影響業(yè)務(wù)決策,在實(shí)踐過程中它可能會涉及企業(yè)管理、數(shù)學(xué)與統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)與技術(shù)等諸多領(lǐng)域的知識與技能。下面對證析過程中可能用到的技能、所需進(jìn)行的工作按順序進(jìn)行一個(gè)不完全的簡單羅列,將其分為十四項(xiàng):一、需求分析:證析是為解決業(yè)務(wù)問題、提升業(yè)務(wù)決策服務(wù)的,所以分析師需理解業(yè)務(wù)人員的問題與需求是什么,需理解業(yè)務(wù)人員所處的業(yè)務(wù)背景、通用的業(yè)務(wù)術(shù)語、所面臨的挑戰(zhàn)、不足及痛點(diǎn)。需求分析不僅僅是證析項(xiàng)目需要完成的工作,它是任何項(xiàng)目的起點(diǎn)。然而,不能單純從客戶說了什么把握業(yè)務(wù)需求。這里可以借用其他領(lǐng)域需求分析中的一個(gè)例子,客戶在表述需求時(shí)可能說“我們需要一種收割機(jī),它在收割西紅柿?xí)r不會弄破西紅柿的皮”。但“厚皮西紅柿”這個(gè)解決方案,而不是客戶提到的特種收割機(jī)將能更有效地解決客戶面臨的問題。當(dāng)很多人強(qiáng)調(diào)分析師應(yīng)該“以客戶為中心”時(shí),更好的提法應(yīng)是“以客戶的價(jià)值為中心”,分析師應(yīng)該考慮客戶(即決策者)如何實(shí)現(xiàn)其價(jià)值,而不應(yīng)囿于客戶說了什么??蛻舻膬r(jià)值以及由此決定的客戶需求限定了項(xiàng)目的范圍,為整個(gè)證析項(xiàng)目提供了基準(zhǔn)。另一方面,需求分析作為證析起點(diǎn)的特性決定了證析不是一門象牙塔內(nèi)的純粹科學(xué),它存在的目的是為了解決現(xiàn)實(shí)生活中的問題。二、決策流程分析:企業(yè)通過其價(jià)值鏈實(shí)現(xiàn)客戶價(jià)值,企業(yè)為實(shí)現(xiàn)企業(yè)價(jià)值、獲取利潤需優(yōu)化價(jià)值鏈中各環(huán)節(jié)的決策。提升嵌入于企業(yè)業(yè)務(wù)流程的決策流程的決策效果是證析項(xiàng)目的主要目標(biāo)。如不能從流程的觀點(diǎn)考慮問題,證析將只能提供一些相互割裂的獨(dú)立應(yīng)用與優(yōu)化,這些優(yōu)化為局部的目標(biāo)服務(wù),只能達(dá)到局部優(yōu)化的目的,甚至這些局部優(yōu)化的結(jié)果是以損害其他環(huán)節(jié)的績效或損害全局績效為代價(jià)的。而如能以流程的觀點(diǎn)考慮問題,證析只是流程中一些黑盒子,是整合在全部流程的一部分。無論有沒有高深的數(shù)學(xué)算法與統(tǒng)計(jì)模型整個(gè)業(yè)務(wù)流程都能運(yùn)轉(zhuǎn),而當(dāng)有更好的、經(jīng)過驗(yàn)證的算法出現(xiàn)并融入流程時(shí),整個(gè)流程的績效得到提升。所以,當(dāng)很多企業(yè)躍躍欲試希望規(guī)劃證析能力演進(jìn)路線圖時(shí),更好的做法是不去規(guī)劃獨(dú)立的證析演進(jìn)路線圖,而是規(guī)劃包含證析在內(nèi)的整個(gè)企業(yè)演進(jìn)路線圖這也是著名的物流公司UPS的態(tài)度,UPS的工業(yè)工程(Industrial Engineering)副總裁,Chuck Holland曾經(jīng)在一篇文章中提到“UPS沒有運(yùn)作管理路線圖,UPS有包含運(yùn)作管理在內(nèi)的(企業(yè))路線圖”。Chuck Holland,“A near-death experience”,Analytics January/February,2011,p4-5。三、數(shù)據(jù)管理:數(shù)據(jù)的極大豐富是當(dāng)前社會的重要特征,據(jù)IDC的一份調(diào)研報(bào)告顯示全球數(shù)據(jù)量在以每五年十倍的速度快速增長。據(jù)另一份報(bào)告估計(jì),2010年全球所產(chǎn)生的數(shù)據(jù)量相當(dāng)于人類歷史上所產(chǎn)生所有數(shù)據(jù)之和。數(shù)據(jù)的極大豐富是證析在當(dāng)前日益受到關(guān)注與普及的基礎(chǔ)。數(shù)據(jù)的來源多種多樣。隨著企業(yè)信息化進(jìn)程中計(jì)算機(jī)系統(tǒng)逐步深入滲透到企業(yè)的業(yè)務(wù)運(yùn)營流程中,企業(yè)運(yùn)營系統(tǒng)自然而然地產(chǎn)生了大量的電子化數(shù)據(jù)。為記錄和保存這些運(yùn)營數(shù)據(jù),很多企業(yè)建立了數(shù)據(jù)倉庫系統(tǒng)。與運(yùn)營系統(tǒng)中的數(shù)據(jù)庫系統(tǒng)關(guān)注及時(shí)可靠地處理各種交易數(shù)據(jù)的目的不同,數(shù)據(jù)倉庫系統(tǒng)更加關(guān)注對海量歷史數(shù)據(jù)的保存、處理與分析。并且,隨著RFID等感知技術(shù)的價(jià)格迅速下降與日益普及,企業(yè)有機(jī)會對企業(yè)運(yùn)營中各個(gè)環(huán)節(jié)施以更加精細(xì)的監(jiān)控,這將進(jìn)一步增加企業(yè)所能獲取的數(shù)據(jù)量。除企業(yè)運(yùn)營系統(tǒng)所產(chǎn)生的數(shù)據(jù)外,企業(yè)還有很多其他途徑獲得有助于提升決策質(zhì)量的數(shù)據(jù)。例如,隨著互聯(lián)網(wǎng)的普及,人們喜歡在博客、微博、Facebook發(fā)表各種意見,很多企業(yè)開始搜集與分析這些社會媒體上的大眾意見,據(jù)此及時(shí)指導(dǎo)產(chǎn)品設(shè)計(jì)與營銷方案設(shè)計(jì)。另外,企業(yè)有機(jī)會從其他機(jī)構(gòu)獲取有價(jià)值的數(shù)據(jù),例如,美國的Acxiom公司的數(shù)據(jù)庫中保存和匯編了美國超過兩億成年人在購物和生活方式方方面面的相關(guān)數(shù)據(jù),這些數(shù)據(jù)來自美國最大的連鎖超市、運(yùn)營商等機(jī)構(gòu),Acxiom利用這些數(shù)據(jù)為它的合作伙伴提供服務(wù)。隨著數(shù)據(jù)源的豐富,企業(yè)的數(shù)據(jù)管理工作面臨著更艱巨的挑戰(zhàn),這里列舉幾個(gè)例子。例如,傳統(tǒng)的數(shù)據(jù)庫技術(shù)更擅長于處理結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)庫中某個(gè)數(shù)字代表收入還是用戶數(shù)有明確的意義。來自互聯(lián)網(wǎng)的信息大多是以文本、網(wǎng)頁、圖像、視頻等形式出現(xiàn)。如何獲取和管理對這些半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)的描述,也就是元數(shù)據(jù)(metadata,描述數(shù)據(jù)的數(shù)據(jù))的管理將是企業(yè)的數(shù)據(jù)管理面臨的一個(gè)挑戰(zhàn)。又如,假設(shè)連鎖超市內(nèi)部以會員卡號碼作為客戶的唯一標(biāo)識維護(hù)著客戶資料,超市通過交換或購買等方式從外部獲取了一批數(shù)據(jù)以豐富對客戶的描述、加深對客戶的理解,但外部獲取的數(shù)據(jù)肯定不含有會員卡號碼,如何將這些不同來源的客戶數(shù)據(jù)整合(CDI consumer data integration)在一起,也是數(shù)據(jù)管理面臨的一個(gè)挑戰(zhàn)。再如,一家銀行可能通過包括信用卡機(jī)構(gòu)、銀行卡發(fā)卡機(jī)構(gòu)、保險(xiǎn)銷售部、柜臺、網(wǎng)站在內(nèi)的多個(gè)渠道和客戶保持接觸、獲取客戶的地址,客戶可能在其中任何一個(gè)渠道變更通信地址,在各個(gè)孤立的信息系統(tǒng)中可能維護(hù)著有關(guān)客戶地址的不同版本,如何在不同的渠道維護(hù)有關(guān)客戶重要信息的唯一版本,也就是如何進(jìn)行主數(shù)據(jù)管理(MDM master data management)也是數(shù)據(jù)管理需要面對的一個(gè)問題。另外,即使對于意義相同的數(shù)據(jù),例如企業(yè)財(cái)務(wù)報(bào)表,不同企業(yè)或同一企業(yè)的不同機(jī)構(gòu)都可能以不同的格式表示,如何制定標(biāo)準(zhǔn)以方便數(shù)據(jù)在不同的機(jī)構(gòu)與系統(tǒng)之間的交換也是數(shù)據(jù)管理工作中需解決的一個(gè)問題。還有,因?yàn)楹芏喾治龆际怯蓸I(yè)務(wù)人員所發(fā)起的,分析的目的是為了應(yīng)對環(huán)境的變化,因?yàn)榄h(huán)境的變化不可預(yù)知,分析的需求也難以事先設(shè)定。如何使得業(yè)務(wù)人員能夠方便靈活地獲取所需粒度的數(shù)據(jù)進(jìn)行即席分析(ad-hoc)是數(shù)據(jù)管理中所需面臨的另一個(gè)問題。最后,因?yàn)閿?shù)據(jù)中包含著很多涉及企業(yè)和客戶的敏感信息,如何在方便數(shù)據(jù)訪問的同時(shí)控制訪問者的數(shù)據(jù)訪問權(quán)限也是一個(gè)不容忽視的問題。從各個(gè)來源抽取與搜集數(shù)據(jù)、建立數(shù)據(jù)倉庫、管理數(shù)據(jù)是證析項(xiàng)目的基礎(chǔ)和重要組成部分,并且這部分工作動輒需要購買昂貴的軟硬件系統(tǒng)、占用大量投資。但技術(shù)驅(qū)動的數(shù)據(jù)管理工作不應(yīng)是證析項(xiàng)目的起點(diǎn),不應(yīng)以數(shù)據(jù)驅(qū)動證析項(xiàng)目的進(jìn)程,而應(yīng)以業(yè)務(wù)問題驅(qū)動證析項(xiàng)目的發(fā)展。并且,證析項(xiàng)目和數(shù)據(jù)倉庫項(xiàng)目的區(qū)別在于證析項(xiàng)目中的分析師需要從業(yè)務(wù)需求出發(fā),通過主動尋找新的數(shù)據(jù)來源、設(shè)計(jì)更好的人機(jī)交互方式、設(shè)計(jì)實(shí)驗(yàn)等方式更加主動地搜集數(shù)據(jù),以獲取為支撐決策所需的數(shù)據(jù)與證據(jù),它不是一個(gè)純粹的信息系統(tǒng)建設(shè)項(xiàng)目。四、度量:數(shù)據(jù)是度量的基礎(chǔ),但數(shù)據(jù)不等同于度量,例如“某省的GDP是2萬億元人民幣”只描述了一個(gè)事實(shí)。根據(jù)這個(gè)數(shù)字不能判斷該省經(jīng)濟(jì)發(fā)展是否良好,和去年比是否有增長,是否完成了當(dāng)年的目標(biāo)。度量除了數(shù)字之外還需要知道這個(gè)數(shù)字的含義是什么,所處的語境是什么。度量在證析中占有重要的地位,甚至有些人將證析(analytics)等同于度量,例如,在Google Analytics 認(rèn)為“證析(analytics)是生成度量的軟件程序Jerri Ledford,Joe Teixeira,Mary E.Tyler,Google Analytics,Third Edition,Wiley Publishing Inc.,2010,p10.”。人們將沒有度量指標(biāo)的企業(yè)管理比喻成沒有儀表盤駕駛的飛機(jī)。度量指標(biāo)不僅僅描述了企業(yè)運(yùn)行的狀況,也指引著企業(yè)運(yùn)行的目標(biāo)與方向。正如法國總統(tǒng)薩科奇所說“我堅(jiān)信:除非我們改變度量經(jīng)濟(jì)績效的方法,否則我們不會改變自身的行為。Joseph E.Stiglitz,Amartya Sen,Jean-Paul Fitoussi,Mismeasuring Our Lives:Why GDP Doesn’t Add Up,New Press,2010,F(xiàn)orwarded by Nicolas Sarkozy,p1.中譯本:阮江平 王海昉譯:《對我們生活的誤測——為什么GDP增長不等于社會進(jìn)步》,新華出版社,2011?!倍攘坑绊懼髽I(yè)中人們行為的方式和目標(biāo),錯誤的度量方式將導(dǎo)致錯誤的行為,將企業(yè)引入錯誤的軌道與方向。例如前蘇聯(lián)以出廠汽車的重量度量汽車廠的生產(chǎn)績效,這導(dǎo)致蘇聯(lián)引進(jìn)的菲亞特汽車生產(chǎn)線所生產(chǎn)的汽車比意大利同款汽車要多出不必要的20%的重量戈登?塔洛克著,柏克 鄭景勝譯,《官僚體制的政治》,商務(wù)印書館,2010。一方面,度量指標(biāo)決定了證析項(xiàng)目所需要優(yōu)化的決策的目標(biāo),有缺陷的度量指標(biāo)有可能導(dǎo)致偏頗、歪曲、有缺陷的結(jié)論。正確的度量是成功的證析項(xiàng)目的基礎(chǔ)。另一方面,作為企業(yè)內(nèi)部量化溝通的重要手段,度量指標(biāo)是證析影響企業(yè)各個(gè)層次決策的有利工具。發(fā)現(xiàn)并實(shí)施新的、有洞察力的、合理的度量指標(biāo)是證析項(xiàng)目的重要工作。有些分析師希望設(shè)計(jì)一些綜合性的指標(biāo)來表示企業(yè)“總體”運(yùn)行狀況。想象一下,汽車的儀表盤上顯示車速為每小時(shí)80公里,顯示油箱剩余油量能夠繼續(xù)行駛400公里,獨(dú)立的兩個(gè)指標(biāo)分別都有清晰而重要的意義,駕駛員希望獲得這兩個(gè)數(shù)值。但如果將二者相加得到的480公里這個(gè)數(shù)沒有任何意義。所以這里需要提醒一點(diǎn),證析項(xiàng)目中如果不是出于必要,應(yīng)努力避免使用復(fù)雜的數(shù)學(xué)手段以炫技為目的設(shè)計(jì)度量指標(biāo),否則將喪失指標(biāo)的清晰性,讓業(yè)務(wù)人員很難以此進(jìn)行溝通,并且不知如何決策與行動來影響指標(biāo)。然而,這里并不是說數(shù)學(xué)工具在度量指標(biāo)設(shè)計(jì)的時(shí)候沒有用武之地。相反,它是指標(biāo)設(shè)計(jì)的重要手段,其中一個(gè)重要的應(yīng)用就是發(fā)現(xiàn)驅(qū)動業(yè)務(wù)結(jié)果的領(lǐng)先指標(biāo)。這里可以做一個(gè)比喻,例如,交警部門希望降低交通事故發(fā)生頻次。然而,這里交通事故發(fā)生次數(shù)是一個(gè)結(jié)果指標(biāo)。交警發(fā)現(xiàn)造成交通事故的一個(gè)重要原因是司機(jī)酒后駕車,通過降低酒后駕車司機(jī)人數(shù)這個(gè)領(lǐng)先指標(biāo)來降低交通事故發(fā)生頻次這個(gè)結(jié)果指標(biāo)。而分析師希望通過對數(shù)據(jù)的分析找到驅(qū)動諸如企業(yè)收入增長這些結(jié)果指標(biāo)的領(lǐng)先指標(biāo)是什么。隨著時(shí)間的推移,驅(qū)動企業(yè)增長的動力是不斷變化的,與之對應(yīng)的領(lǐng)先指標(biāo)也是不斷變化的,分析師需要不斷探測到這些變化以增加企業(yè)競爭力。在需求分析階段,分析師只能定性的確定項(xiàng)目的范圍和目標(biāo)。在獲得了企業(yè)運(yùn)營數(shù)據(jù)以及企業(yè)現(xiàn)狀的度量之后,分析師有可能制定諸如“成本削減10%”這樣量化的項(xiàng)目目標(biāo)。五、探索性數(shù)據(jù)分析與數(shù)據(jù)可視化:在數(shù)據(jù)的分析和處理過程中,人類的模式識別能力仍然占有重要的地位。人們能夠通過從不同角度擺弄數(shù)據(jù),由高層次的匯總數(shù)據(jù)“下鉆”到低層次的細(xì)節(jié)數(shù)據(jù)等手段發(fā)現(xiàn)數(shù)據(jù)中存在的模式或異常。通過數(shù)據(jù)探索,人們能夠得到對數(shù)據(jù)以及業(yè)務(wù)運(yùn)行狀況的初步印象與假設(shè),雖然這些假設(shè)還需要進(jìn)一步推敲,但它能指引人們應(yīng)進(jìn)一步搜集與分析什么樣的數(shù)據(jù),選擇什么樣的統(tǒng)計(jì)工具或技術(shù)驗(yàn)證與推翻這些假設(shè)。圖形以及表格是有效組織數(shù)據(jù)、協(xié)助研究人員對數(shù)據(jù)進(jìn)行探索的重要手段。在科學(xué)研究的歷史上,門捷列夫發(fā)明的元素周期表改變了化學(xué)家的思維方式,導(dǎo)致了新元素的發(fā)現(xiàn)。天文學(xué)家發(fā)明的對星體分類的“光譜—亮度圖”促成了中子星的發(fā)現(xiàn)。通過圖形或表格的方式有效地組織數(shù)據(jù)也能夠幫助商業(yè)領(lǐng)域的業(yè)務(wù)人員有效地發(fā)現(xiàn)新問題、發(fā)現(xiàn)解決問題的新方法有關(guān)數(shù)據(jù)可視化、信息可視化可參見Stephen Few,Edward R.Tufte等人的著作。包括:Stephen Few,Information Dashboard Design,O’Reilly,2006。Edward R.Tufte,Visual Explanations:Images and Quantatives,Evidence and Narrative,Graphics Press,1997。隨著個(gè)人電腦運(yùn)算能力的增強(qiáng)及計(jì)算機(jī)圖形學(xué)的發(fā)展,計(jì)算機(jī)科學(xué)家提供的各種數(shù)據(jù)可視化軟件使得分析師能夠更方便地、以更加豐富的形式探索數(shù)據(jù)。數(shù)據(jù)可視化不僅用于探索性數(shù)據(jù)分析,也是傳遞分析結(jié)論的重要手段。可視化的方式能夠使得分析師有效地將分析結(jié)論傳遞給消費(fèi)數(shù)據(jù)的人,與之高效溝通。儀表盤(dashboard)是數(shù)據(jù)的可視化表示與溝通的重要手段,有很多軟件廠商能夠提供工具幫助分析師方便地開發(fā)儀表盤。更加注重設(shè)計(jì)的信息圖(InfoGraphics)也開始逐漸流行。包括《華盛頓郵報(bào)》(Washing Post)、《彭博社商業(yè)周刊》(Bloomberg Businessweek)在內(nèi)的傳統(tǒng)媒體已經(jīng)開始大量使用信息圖等形式向讀者傳遞數(shù)字信息與結(jié)論。在證析項(xiàng)目中,設(shè)計(jì)圖表、儀表盤或者信息圖向業(yè)務(wù)人員傳遞分析結(jié)論、績效指標(biāo)等信息需要分析師不僅對數(shù)字有深刻理解,還需要具備一定的審美與設(shè)計(jì)能力。六、提出假設(shè),發(fā)現(xiàn)模型、關(guān)聯(lián)與模式:為了獲得對世界的認(rèn)識并對環(huán)境施加控制,人們在決策前希望發(fā)現(xiàn)外部世界存在的模式并做出關(guān)于環(huán)境的假設(shè)。這些假設(shè)可能來自人們的經(jīng)驗(yàn)與直覺,可能來自基于已有知識的演繹,也可能來自探索性數(shù)據(jù)分析或?qū)D表解讀過程中形成的認(rèn)識。在證析項(xiàng)目中的以“如果……那么……”假想性陳述方式表達(dá)的假設(shè)應(yīng)該是可證偽的。例如“如果你足夠認(rèn)真工作,那么你就能得到提升”這樣的假設(shè)就不屬于可證偽的表述。因?yàn)槟橙巳绻ぷ鲄s未得到提升,我們可能會說他沒有“足夠”努力工作,即無論發(fā)生什么結(jié)果仿佛都與這條假設(shè)不悖,故是不可證偽的Anne Myers,Christine H.Hansen,Experimental Psychology,5th Edition,Wadsworth,2002.中譯本:于國慶等譯,《實(shí)驗(yàn)心理學(xué)》,江蘇教育出版社,2006,p99-108。現(xiàn)在很多所謂的管理大師所鼓吹的方案都是以不能證偽的方式表述的,假設(shè)是否可證偽是證析的方法與點(diǎn)子大王、勵志大師式的管理大師的方法之間最重要的區(qū)別。假設(shè)是否可證偽也是劃分是盲從權(quán)威與教條還是獨(dú)立思考進(jìn)行無止境地探索的兩種態(tài)度的分野。形成假設(shè)需要分析師或業(yè)務(wù)人員很強(qiáng)的能力,產(chǎn)生富有成效的新的假設(shè)是新的洞察、新的發(fā)現(xiàn)的開始,這是整個(gè)證析過程中極為困難的一個(gè)環(huán)節(jié)。然而,隨著海量數(shù)據(jù)的出現(xiàn),“假設(shè)驅(qū)動”這種傳統(tǒng)的研究方法受到了挑戰(zhàn),有人認(rèn)為傳統(tǒng)的假設(shè)沒有足夠的能力描述海量數(shù)據(jù)中蘊(yùn)含的外界環(huán)境中存在的復(fù)雜關(guān)系生物學(xué)與醫(yī)學(xué)研究中,假設(shè)驅(qū)動(Robert Weinberg,“Point:Hypotheses first”)以及數(shù)據(jù)驅(qū)動(Todd Golub,“Counterpoint:Data first”)的不同觀點(diǎn)爭論可以參見 Nature,April 1,2010,p678-679。以數(shù)據(jù)挖掘和模式識別為代表的在海量數(shù)據(jù)中自動發(fā)現(xiàn)關(guān)系和模式的機(jī)械化數(shù)據(jù)處理工具為人們分析海量數(shù)據(jù)提供了可能。這些關(guān)系和模式可能是以算法或計(jì)算機(jī)語言的形式儲存在計(jì)算機(jī)中,而不以傳統(tǒng)的假設(shè)中所使用的自然語言、數(shù)學(xué)語言及其他形式化語言顯式表現(xiàn)。商業(yè)領(lǐng)域的一些特性也決定了以數(shù)據(jù)驅(qū)動利用數(shù)據(jù)挖掘算法機(jī)械化的數(shù)據(jù)分析和模式識別有其獨(dú)特的優(yōu)勢。隨著企業(yè)信息化程度的深入,計(jì)算機(jī)深入企業(yè)業(yè)務(wù)運(yùn)營的各個(gè)領(lǐng)域,海量的電子化記錄是企業(yè)運(yùn)營流程信息化自然而然的副產(chǎn)物。為了優(yōu)化流程中的決策,證析需要分析海量數(shù)據(jù),并以此為依據(jù)改善大量日常的重復(fù)性決策。但很多決策的獲利十分微小,不足以投入相對昂貴的人力為其按照傳統(tǒng)的科學(xué)研究方法提出專門的假設(shè)并作出相應(yīng)的改善,這造成了決策量與人力之間的矛盾。另外,科學(xué)研究的數(shù)據(jù)是相對公開的,所有人都有機(jī)會分析這些數(shù)據(jù)。而企業(yè)的數(shù)據(jù)是私有的,只有企業(yè)內(nèi)部及企業(yè)合作伙伴中少數(shù)人有機(jī)會接觸到這些數(shù)據(jù),這進(jìn)一步增加了業(yè)務(wù)證析工作中人力的限制。機(jī)械化的方法可以彌補(bǔ)人力的不足。這正如福特的自動化與生產(chǎn)線改變了二十世紀(jì)傳統(tǒng)的由手藝人手工地、緩慢地打造汽車的生產(chǎn)方式,機(jī)械化的方法也將改變?nèi)藗儌鹘y(tǒng)的知識生產(chǎn)方式。并且,自然科學(xué)的規(guī)律相對穩(wěn)定,例如牛頓三大定律放之四海而皆準(zhǔn),亙古不變。商業(yè)領(lǐng)域中很多問題涉及對人、對社會的理解和建模,這些規(guī)律沒有自然科學(xué)定理中的普適性和穩(wěn)定性,并會隨著社會的變化而變化。但是,企業(yè)需要及時(shí)認(rèn)識規(guī)律、及時(shí)作出決策以獲利。規(guī)律的適用范圍窄、穩(wěn)定性差、存在及時(shí)決策的需求,這些特點(diǎn)也決定了機(jī)械化的方法有其獨(dú)特的優(yōu)勢。網(wǎng)絡(luò)廣告投放,以及電子商務(wù)的產(chǎn)品推薦就是典型的案例。在通常觀念下,建立數(shù)學(xué)模型以及數(shù)據(jù)挖掘模型曾經(jīng)被認(rèn)為是證析項(xiàng)目中分析師最重要的工作。甚至有些證析項(xiàng)目中,分析師被認(rèn)為是數(shù)據(jù)挖掘工程師的同義詞。七、檢驗(yàn)與評估:假設(shè)可能成立,也可能不成立,假設(shè)成立與否需要使用數(shù)據(jù)利用統(tǒng)計(jì)的方法進(jìn)行檢驗(yàn)。例如,也許剛好你的朋友中北方人普遍偏高,南方人身高普遍偏低,你可以假設(shè)“出生地在黃河以北的成年中國男性平均身高大于出生地在黃河以南的成年中國男性的平均身高”。南方人北方人的身高差異也許的確存在,也可能只是你的個(gè)人偏見,需要利用可靠的數(shù)據(jù)以及統(tǒng)計(jì)方法來檢驗(yàn)這個(gè)假設(shè)。另一方面,對于不同的數(shù)據(jù)挖掘模型有不同的檢驗(yàn)標(biāo)準(zhǔn)David Hand,Heikki Mannila,Padhraic Smyth,Principles of Data Mining,MIT,2001,p211-233.,例如,預(yù)測類模型的預(yù)測準(zhǔn)確率就是一個(gè)對模型的檢驗(yàn)指標(biāo)。一個(gè)電子商務(wù)網(wǎng)站的數(shù)據(jù)挖掘算法可以根據(jù)用戶對商品打分的歷史數(shù)據(jù)中的一部分建立模型預(yù)測用戶對其他商品的打分,也就是預(yù)測用戶是否會喜歡其他商品。然后,分析師可以用建模數(shù)據(jù)之外的另外一部分?jǐn)?shù)據(jù)驗(yàn)證這個(gè)模型的預(yù)測是否準(zhǔn)確。這種從數(shù)字的角度對模型進(jìn)行檢驗(yàn)是在檢驗(yàn)?zāi)P妥龅迷趺礃?。另一方面,因?yàn)槟P投际菫榱私鉀Q特定的業(yè)務(wù)問題而建立的,所以也需要從模型是否能夠滿足業(yè)務(wù)目標(biāo)的角度對模型進(jìn)行檢驗(yàn),也就是檢驗(yàn)?zāi)P褪欠裨谧稣_的事情。并且,因?yàn)閿?shù)據(jù)挖掘模型是計(jì)算機(jī)以機(jī)械的方式自動生成的,其中所發(fā)現(xiàn)的很多規(guī)律可能沒有任何意義甚至是荒謬的,如有可能的話,需要人們用自己對外部世界的知識檢驗(yàn)這些機(jī)器所發(fā)現(xiàn)的規(guī)律。檢驗(yàn)與評估是保證證析項(xiàng)目質(zhì)量,確保證析項(xiàng)目的資源在朝著正確方向努力的重要手段。所以,企業(yè)需要在控制成本與風(fēng)險(xiǎn)的前提下使用多種手段從各個(gè)方面檢驗(yàn)證析項(xiàng)目的成果。仍以推薦引擎的評估為例,企業(yè)可能通過利用離線數(shù)據(jù)模擬用戶響應(yīng)的方法、招募試用用戶研究用戶響應(yīng)、研究推薦引擎在真實(shí)運(yùn)行環(huán)境下的用戶響應(yīng)等方法對推薦引擎的效果進(jìn)行研究Guy Shani and Asela Gunawardana,Evaluating Recommendation Systems,in Francesco Ricci?Lior Rokach?Bracha Shapira,Paul BKantor edsRecommender Systems Handbook,Springer,2011,p257-298。八、形成理論與洞察:人們在觀察分析數(shù)據(jù)的過程中會進(jìn)一步加深對現(xiàn)象的認(rèn)識,然而人們不滿足于只是描述觀測到的現(xiàn)象與數(shù)據(jù),人們希望利用自己的歸納和推理能力,對數(shù)據(jù)的產(chǎn)生機(jī)理做出猜測,從而形成理論。人們擁有理論之后將不滿足于只是利用理論對已觀察到的現(xiàn)象進(jìn)行描述,而是希望將其外推到未知領(lǐng)域,希望能夠預(yù)測。舉一個(gè)例子以說明如果擁有理論、知道數(shù)據(jù)產(chǎn)生機(jī)制則有可能對從未觀測到的現(xiàn)象進(jìn)行預(yù)測。假設(shè)你作為玩家在賭場賭骰子,每注100元,莊家擲一枚骰子,如果骰子擲出1點(diǎn),則玩家贏1000元,否則玩家血本無歸。你可以觀察莊家100次擲骰子的結(jié)果,統(tǒng)計(jì)其中出現(xiàn)1的次數(shù),以此來判斷骰子是否均勻,據(jù)此決定是否應(yīng)該玩這個(gè)游戲。然而,假設(shè)莊家在一塊幕布后擲骰子,你并不能看到骰子究竟擲出了幾點(diǎn),你只能獲知莊家向外公布的一系列勝負(fù)結(jié)果,例如:1000100100000100000000100000010000000000000100000100000000000100001110101000000000001000100010010000,其中1代表玩家贏,0代表莊家贏。你通過觀察發(fā)現(xiàn),這100次結(jié)果中,玩家贏了18次。你據(jù)此推測,如果玩100次,你需要下注10000元,但是有可能贏得18000元,凈賺8000元。由此你認(rèn)為這個(gè)賭博有利可圖,值得一試。其實(shí)這也是很多證析項(xiàng)目的實(shí)際做法。例如,分析師向一萬名顧客推薦產(chǎn)品,經(jīng)過觀察發(fā)現(xiàn)其中兩千名顧客購買了產(chǎn)品,這時(shí)分析師不需要知道顧客購買的原因是什么,可以單純通過觀察不同客戶群的推薦成功率推測向顧客推薦產(chǎn)品是否劃算。在此,正如在擲骰子的游戲中無論玩家和莊家之間有沒有那層幕布,甚至玩家是否知道莊家是在擲骰子決定勝負(fù)都變得不重要了。進(jìn)一步,如果莊家改變了游戲規(guī)則,玩家每次只需下注10元就有機(jī)會贏得百萬元大獎。當(dāng)然,玩家贏的概率也沒有那么高了,你觀察1000次可能都沒有看到一次玩家贏得百萬大獎。即使如此,你也不能斷定玩家一定不能贏得百萬大獎,因?yàn)槟阒腊偃f大獎不是那么容易得到的。然而,如果這時(shí)你想辦法撕開了阻隔玩家和莊家之間的幕布,并且知道了決定玩家勝負(fù)的規(guī)則。你發(fā)現(xiàn)莊家現(xiàn)在是擲六枚骰子決定勝負(fù),如果六枚骰子都擲出1算玩家贏,否則算莊家贏。你又觀測了1000次這六枚骰子擲出的點(diǎn)數(shù),以此判斷這六枚骰子是否均勻。通過觀察你發(fā)現(xiàn)這六枚骰子中每一枚出現(xiàn)1的概率都大概是1/6,莊家應(yīng)該沒有作弊。雖然這1000次觀察中,你還是沒有機(jī)會看到六枚骰子同時(shí)出現(xiàn)1的情況發(fā)生,但是你知道了玩家贏的機(jī)理,你能夠算出玩家贏的概率是21/1000000,從而做出玩這個(gè)游戲會比較劃算的結(jié)論。如果玩一百萬次這個(gè)游戲,你幾乎一定不會輸,并且預(yù)期能凈賺一千一百萬元。當(dāng)你撕開了這層幕布之后,你只需觀察100次擲骰子的結(jié)果也能相對準(zhǔn)確判斷出這六枚骰子出現(xiàn)1的概率是多少,以此估算玩家贏的概率。這樣的觀察比沒有撕開這層幕布時(shí)觀察了十萬次玩家輸贏的結(jié)果更加有效。因?yàn)榧词沽恩蛔佣际蔷鶆虻?,每枚骰子出現(xiàn)1的概率都是六分之一,那么十萬次投擲結(jié)果中出現(xiàn)六個(gè)1的情況平均也只出現(xiàn)2.1次,甚至很有可能這十萬次結(jié)果中一次六個(gè)1也沒有出現(xiàn),也就是玩家一次也沒有贏這個(gè)例子中假設(shè)六枚骰子擲出的點(diǎn)數(shù)相互獨(dú)立。用六枚均勻骰子重復(fù)這個(gè)游戲十萬次,沒有出現(xiàn)六個(gè)1的概率是11.7%。這個(gè)游戲是玩家玩的次數(shù)越多,贏的可能性越大。例如,玩家只玩一次,他投的10塊賭注幾乎一定血本無歸。如果玩家玩10萬次,輸?shù)母怕适?1.7%,不輸不贏的概率是25%。而如果玩家玩100萬次,輸或者平局的概率只有0.4%,有99.6%的可能性能夠贏錢。另外,如果玩家只是觀察勝負(fù)結(jié)果,即使玩家在十萬次游戲觀察到了2次玩家勝出,他也不敢貿(mào)然入局,因?yàn)檫@可能是隨機(jī)波動的結(jié)果,即使在十萬次游戲中玩家贏了兩次,但是實(shí)際上玩家勝率小于十萬分之一,也就是長久玩下來玩家會輸?shù)目赡苄砸灿?4%。這是理論的力量,天文學(xué)家能夠很好地解釋某些天文現(xiàn)象出現(xiàn)的原因,根據(jù)這些天文知識天文學(xué)家能夠預(yù)測一些從很少有機(jī)會被觀測到的事件的發(fā)生。例如對于某類特殊的日全食,在一萬年的時(shí)間內(nèi)只會發(fā)生49次,但是天文學(xué)家能夠?qū)λ某霈F(xiàn)做出準(zhǔn)確的預(yù)測Andrew WLo and Mark TMueller,WARNING:Physics Envy May Be Hazardous To Your Wealth!,Draft,March 19,2010.。很多理論的作用就如撕開隔在玩家和莊家之間那層幕布一樣,人們除了知道發(fā)生了什么即“是什么”之外,也希望知道“為什么”。知道了“為什么”,人們能夠用更合適的語言、更好的表達(dá)方式描述模型。在這個(gè)例子中,我們看到為了回答“為什么”這個(gè)問題,需要更為精細(xì)的觀測(需要觀測到六個(gè)骰子擲出的點(diǎn)數(shù),而不只是簡單的輸贏結(jié)果),也需要對系統(tǒng)運(yùn)作的機(jī)制作出猜測(“如果出現(xiàn)六個(gè)1則玩家贏”),這個(gè)猜測可能是通過一些其他知識獲得的。不論觀察者如何做出這樣的猜測,但是正如前面所討論的,這樣的假設(shè)是可以被證偽的。也就是說,如果某次真的擲出六個(gè)1,并且玩家贏了,觀察者對這個(gè)理論更有信心,但不能就此說這個(gè)理論是正確的。反過來,只要有一次擲出了六個(gè)1玩家卻沒有獲得百萬獎金,就能推翻這條理論。分析師需要跳出日常商業(yè)運(yùn)營的細(xì)節(jié),在對經(jīng)驗(yàn)總結(jié)的基礎(chǔ)之上獲得洞察,從而形成更有普遍意義的理論。這需要分析師具有足夠的洞察力與創(chuàng)造力,這樣的分析師可遇而不可求。九、推理與優(yōu)化:有時(shí)雖然我們掌握了可靠的理論和事實(shí),但如果要得出有用的結(jié)論還需經(jīng)過一定的推理工作??梢钥匆幌赂柲λ沟耐评磉^程:“馬廄中有一條狗,然而,盡管有人進(jìn)來,并且把馬牽走,它竟毫不吠叫……顯然,這位午夜來客是這條狗非常熟悉的人物?!笨履系罓栔罴以谱g,銀色馬,《福爾摩斯探案全集(中冊)》,群眾出版社,1981年,p26。雖然有人會辯駁說,福爾摩斯的“來者不是陌生人”的結(jié)論蘊(yùn)涵在他所掌握的“如果來者是陌生人,那么狗會叫”這個(gè)理論和他所觀察到的“狗沒有叫”這個(gè)事實(shí)之中,整個(gè)推理沒有產(chǎn)生任何新知識。但很顯然,如果沒有經(jīng)過推理,福爾摩斯不會得到“來者不是陌生人”這條對破案至關(guān)重要的線索。分析師就是證析項(xiàng)目中的福爾摩斯,雖然分析師了解了很多業(yè)務(wù)知識,構(gòu)建了很多理論,觀察到很多事實(shí),但如果他不運(yùn)用推理的能力還是不能從這些知識、理論、事實(shí)中抽取出對解決問題有幫助的信息。使用計(jì)算機(jī)進(jìn)行自動推理曾是人工智能領(lǐng)域的重要研究課題,八十年代專家系統(tǒng)的興起使其受到了大眾更為廣泛的關(guān)注。然而,在那個(gè)數(shù)據(jù)相對匱乏的年代,專家系統(tǒng)作為一個(gè)封閉系統(tǒng)很難維系與更新其知識庫,從而專家系統(tǒng)沒有取得曾被期許的目標(biāo)。但專家系統(tǒng)中用于自動推理的規(guī)則引擎還是得到了進(jìn)一步的發(fā)展和應(yīng)用。規(guī)則引擎能夠幫助企業(yè)管理復(fù)雜的業(yè)務(wù)規(guī)則與業(yè)務(wù)邏輯,并有可能據(jù)此幫助企業(yè)自動化地做出大量的運(yùn)營決策James Taylor,Neil Raden,Smart (Enough) Systems:How to Deliver Competitive Advantage by Automating Hidden Decisions,Prentice Hall,2007.。如果說福爾摩斯的邏輯推理得出的有意義的結(jié)論已經(jīng)蘊(yùn)涵在他所掌握的事實(shí)與理論中,那么很多數(shù)學(xué)運(yùn)算也具此特征。例如,假設(shè)我們擁有全國各個(gè)城市之間的公路里程表,我們知道從北京到上海運(yùn)送貨物距離最短的路線。雖然這個(gè)問題的答案也蘊(yùn)涵在城市間公路里程表中,但必須通過搜索和優(yōu)化算法進(jìn)行數(shù)學(xué)運(yùn)算才能獲知“從北京經(jīng)由濟(jì)南到達(dá)上?!边@條路徑是我們想要的答案,而貨車不應(yīng)走“從北京經(jīng)由西寧到達(dá)上?!边@條路線。十、干預(yù)與解決方案設(shè)計(jì):如果說前面幾個(gè)階段工作更多是分析導(dǎo)向的,是與數(shù)字打交道的,那么這個(gè)階段的工作需要更多的創(chuàng)意。前面的分析工作的目的大多是為了設(shè)計(jì)出能夠改善業(yè)務(wù)的解決方案做準(zhǔn)備,為了完成這個(gè)任務(wù)需要分析師以及合作者能夠理解分析結(jié)果,需要具備豐富的行業(yè)知識以及對企業(yè)的深入理解。前面的分析結(jié)果以及模型可能是以計(jì)算機(jī)系統(tǒng)的形式作為解決方案的一部分出現(xiàn),也可能只是為解決方案指明了方向而不出現(xiàn)在解決方案之中。所以,計(jì)算機(jī)系統(tǒng)絕對不是干預(yù)和解決方案的全部,甚至不是其中最重要的部分,解決方案可能是針對人、組織、文化、系統(tǒng)不同方面的干預(yù)。這一階段的工作大致包括產(chǎn)生創(chuàng)意、細(xì)化創(chuàng)意、選擇方案等幾個(gè)步驟。十一、模擬與仿真:隨著計(jì)算能力日益強(qiáng)大,需要耗費(fèi)大量計(jì)算資源的模擬與仿真的方法開始變得可行,并得到重視。模擬與仿真是人們獲取數(shù)據(jù)與經(jīng)驗(yàn)的一種經(jīng)濟(jì)、有效的方式,例如飛行員在駕駛昂貴的飛機(jī)上天之前可以在模擬真實(shí)飛行環(huán)境的模擬器上學(xué)習(xí)飛行,以此學(xué)習(xí)應(yīng)如何面對各種情況。如有可能,決策者在推行一項(xiàng)新的方案之前進(jìn)行一番“沙盤推演”也能快速、低成本、直觀的評估方案的優(yōu)劣。通過模擬的方式能夠讓決策者認(rèn)識到不同選擇對結(jié)果的影響。例如,降價(jià)會對銷量、銷售額、利潤產(chǎn)生不同程度的影響,雖然數(shù)學(xué)模型能夠描述幾者之間的關(guān)系,但如果決策者能夠看到不同幅度的降價(jià)對銷量、銷售額、利潤的不同程度的影響,能讓他在權(quán)衡利弊之后做出選擇。并且,仿真也是分析師和決策者進(jìn)行溝通的有力工具。假想一個(gè)村莊即將被大水淹沒,村民需要選擇一個(gè)合適的避難點(diǎn)躲避洪水,村莊中的教堂塔尖是村中的最高點(diǎn),如果分析師使用優(yōu)化算法提供一個(gè)唯一答案時(shí),鐘樓塔尖將是他所推薦的首選。然而,很明顯這個(gè)塔尖是一個(gè)難以立足的地方,很不穩(wěn)定,并且在上面避難也很不舒服。如果分析師能夠以仿真模型的形式將分析結(jié)果提供給決策者,決策者得到的建議不只是應(yīng)該在塔尖上避難這么一個(gè)孤立的結(jié)果,決策者能主動發(fā)現(xiàn)教堂旁富豪家的房頂只比這個(gè)塔尖低一米,并且房頂平臺更大,會是一個(gè)更好的避難所,他可能會放棄塔尖這個(gè)“最優(yōu)”答案。當(dāng)輸入變量不是一個(gè)確定取值,而是在一個(gè)取值范圍內(nèi)的隨機(jī)分布時(shí),數(shù)學(xué)模型的結(jié)果也將不是一個(gè)單點(diǎn)的確定輸出,利用模擬與仿真實(shí)現(xiàn)的上述場景將更加有用。另外,當(dāng)證析得出的模型與公式包含很多主觀經(jīng)驗(yàn),使用模擬的方法能夠讓決策者更全面的評估各種假設(shè)是否合理。例如,在分配權(quán)重過程中一些細(xì)微的權(quán)重調(diào)整都有可能得出截然不同的結(jié)果,而通過模擬仿真的方法可以讓決策者評估不同的權(quán)重假設(shè)會得到什么樣不同的結(jié)果。當(dāng)模型中涉及對未來的假設(shè)時(shí),模擬仿真的方法可以讓決策者評估當(dāng)未來以不同的方式展開時(shí),不同的決策會產(chǎn)生什么不同的后果。另外,很多業(yè)務(wù)決策中涉及對包括客戶、員工等多個(gè)個(gè)體的復(fù)雜系統(tǒng)的干預(yù)。因?yàn)檫@種復(fù)雜系統(tǒng)中的個(gè)體之間存在交互作用,會出現(xiàn)整體大于部分相加之和的現(xiàn)象,對單個(gè)個(gè)體有效的干預(yù)手段將不一定適于對整體的干預(yù)。例如,當(dāng)電影院銀幕意外發(fā)生火災(zāi)時(shí),電影院的經(jīng)理希望觀眾通過遠(yuǎn)離銀幕的1號門撤離現(xiàn)場,這條規(guī)則是某一位觀眾最安全的逃生方案。但是,當(dāng)所有的觀眾都涌向1號門時(shí),必然造成觀眾的擁擠、踩踏的現(xiàn)象,造成誰都無法逃離現(xiàn)場,曾經(jīng)最安全的逃生方案變成了最危險(xiǎn)的逃生方案。對這種復(fù)雜系統(tǒng)用傳統(tǒng)的形式化數(shù)學(xué)工具描述與求解是一項(xiàng)十分困難的工作。另外的求解方法是利用一種最近十余年逐步流行起來的“基于主體的建模”(Agent-Based Modeling)手段對其進(jìn)行研究。這種研究方式對社會系統(tǒng)中的個(gè)體建立模型,并且把計(jì)算機(jī)模擬的個(gè)體放到計(jì)算機(jī)模擬的虛擬環(huán)境中,觀察個(gè)體在這個(gè)人工虛擬環(huán)境中如何交互。例如,上面例子中在計(jì)算機(jī)中建立一個(gè)虛擬的電影院模型,這個(gè)電影院的模型中有放映大廳布局、失火位置、電影院座椅擺放方式、電影院出口位置等信息。研究人員在這個(gè)虛擬的電影院中還需要建立每個(gè)觀眾的模型,觀眾模型中包含了諸如他將從1號門逃生這樣的規(guī)則。當(dāng)把虛擬的觀眾放到虛擬的電影院中,研究者可以對觀眾逃生過程中是否會發(fā)生擁堵的現(xiàn)象,擁堵在什么情況下發(fā)生等問題進(jìn)行研究?;谥黧w建模的好處是能夠?qū)⑽⒂^的個(gè)體規(guī)則(觀眾從1號門逃生)和宏觀的整體現(xiàn)象(發(fā)生擁堵和踩踏)聯(lián)系起來,讓研究者有機(jī)會觀察整體的宏觀現(xiàn)象如何從遵循簡單規(guī)則的個(gè)體交互中涌現(xiàn)(emerge)出來。雖然這樣的分析其預(yù)測效果有限,但是影院經(jīng)理通過觀察虛擬世界的觀眾逃生情況能夠?qū)κ枭⒁?guī)則、影院座椅布置、出口設(shè)置等因素對影院安全的影響有一個(gè)直觀的認(rèn)識。十幾年前,基于主體的建模剛剛興起時(shí),它可以彌補(bǔ)當(dāng)時(shí)社會科學(xué)研究中數(shù)據(jù)不足的缺陷,研究者可以通過計(jì)算機(jī)模擬仿真產(chǎn)生大量數(shù)據(jù)用于研究。隨著現(xiàn)在手機(jī)、GPS的普及,對個(gè)體的觀測數(shù)據(jù)日益豐富,研究者有可能對個(gè)體建立更加復(fù)雜的模型進(jìn)行仿真。并且,它對于那些難以搜集數(shù)據(jù)(例如,例子中的電影院火災(zāi))、搜集數(shù)據(jù)受到法規(guī)限制(例如,法規(guī)和隱私條例限制不得抓取微博上某些類型的信息為此,電信運(yùn)營商Telefonica建立了一個(gè)仿真平臺。參見,Vijay Erramilli,Xiaoyuan Yang,Pablo Rodriguez,“Explore what-if scenarios with SONG:Social NetworkWrite Generator”,http://arxiv.org/abs/1102.0699。)或者搜集數(shù)據(jù)成本過高的問題的研究仍然具有很重要的價(jià)值。基于主體的仿真還不如統(tǒng)計(jì)或者數(shù)據(jù)挖掘那么流行,還不是分析師工具箱中的主流工具,但是包括美國軍方、電信運(yùn)營商等一些組織或企業(yè)已經(jīng)開始用它進(jìn)行問題研究有關(guān)Agent Based Modeling簡介參見Michael J.North and Charles M.Macal (eds.),Managing business complexity :discovering strategic solutions with agent-based modeling and simulation,Oxford University Press,2007。Stefania Bandini,Sara Manzoni,Giuseppe Vizzari,“Agent Based Modeling and Simulation”,in Robert A.Meyers (Ed.),Encyclopedia of Complexity and Systems Science,Springer Science + Buisiness Media,LLC.,2009,p184-223.有關(guān)ABM研究者辦公司,參見 Evan I.Schwartz,Predictive Modeling Isn’t Magic,Technology Review website,posted December 13,2010,http://www.technologyreview.com/business/26886/。十二、實(shí)驗(yàn):通過對歷史數(shù)據(jù)的分析、挖掘與建模能夠發(fā)現(xiàn)數(shù)據(jù)中的一些隱含的模式和關(guān)聯(lián)關(guān)系。但是,相關(guān)性并不等同于因果性。例如,通過數(shù)據(jù)分析發(fā)現(xiàn)某家商場的高檔服裝和高檔酒銷量同時(shí)上升,二者之間存在很強(qiáng)的相關(guān)性。但是,商場不能據(jù)此得出結(jié)論:促銷高檔酒能夠幫助商場賣出更多的高檔服裝。這只是提升高檔服裝銷量的一種可能的方法,這種方法是否真的有效,需要實(shí)際試一試才能知道。提高高檔服裝銷量的手段有很多種,并且這些方法可能隱藏在人們的視野范圍之外。數(shù)據(jù)與理論所產(chǎn)生的洞察能夠幫助人們發(fā)現(xiàn)一些改善結(jié)果的方法,但是在經(jīng)過實(shí)驗(yàn)驗(yàn)證之前,這些方法還只是一些假設(shè),研究者需要通過設(shè)計(jì)實(shí)驗(yàn)驗(yàn)證這些方法的有效性。數(shù)據(jù)和理論能夠產(chǎn)生很多可能的假設(shè),因?yàn)閷?shí)驗(yàn)需要成本,研究者能夠通過實(shí)驗(yàn)進(jìn)行檢驗(yàn)的假設(shè)只占所有假設(shè)中的一小部分,而對哪些假設(shè)進(jìn)行實(shí)驗(yàn)檢驗(yàn)往往需要人們的直覺與判斷。實(shí)驗(yàn)作為自然科學(xué)的研究方法已經(jīng)被人們所熟知,它也在運(yùn)作管理、工業(yè)設(shè)計(jì)等領(lǐng)域得到了廣泛應(yīng)用。但它在商業(yè)領(lǐng)域的應(yīng)用還不如在自然科學(xué)領(lǐng)域的應(yīng)用那么普遍與嚴(yán)格。例如,有些具有多家分支機(jī)構(gòu)的企業(yè)在采用和推廣某項(xiàng)方案之前會先在一些小范圍內(nèi)試點(diǎn),這些試點(diǎn)能夠幫助人們獲得對此方案的一些直觀的經(jīng)驗(yàn)。但是因?yàn)樵谠圏c(diǎn)過程中每次改變了過多的要素,使人們很難在被混淆的諸多要素中分辨出具體是哪些要素對效果的提升起了作用Thomas H.Davenport,“How to Design Smart Business Experiments”,Harvard Business Review,F(xiàn)eb.2009,p68-76.。因?yàn)闃I(yè)務(wù)證析中的決策往往是對涉及人或者人群的復(fù)雜系統(tǒng)的干預(yù),適用于這些復(fù)雜系統(tǒng)的規(guī)律不如描述物理系統(tǒng)的規(guī)律那么具有普適性。對這些系統(tǒng)的干預(yù)經(jīng)常是目標(biāo)導(dǎo)向的,經(jīng)常用收入等指標(biāo)衡量這些干預(yù)手段的效果。業(yè)務(wù)證析的這些特點(diǎn)和醫(yī)學(xué)治療有相似之處,醫(yī)療是通過對人體這個(gè)復(fù)雜的系統(tǒng)的干預(yù)以達(dá)到治愈疾病等目標(biāo)。隨機(jī)化實(shí)驗(yàn)的手段已經(jīng)在以循證醫(yī)學(xué)(EBM,evidence-based medicine)為代表的醫(yī)學(xué)研究中有廣泛的應(yīng)用,循證醫(yī)學(xué)的研究方法對業(yè)務(wù)證析有很多可借鑒之處,本書將在第二章予以介紹。雖然理論和洞察能夠幫助人們設(shè)計(jì)干預(yù)手段、設(shè)計(jì)實(shí)驗(yàn),但對許多還沒有成熟的理論支撐,不能得到“為什么”的滿意答案的領(lǐng)域,實(shí)驗(yàn)?zāi)軌蜃屟芯空吒雨P(guān)注結(jié)果,通過實(shí)驗(yàn)設(shè)計(jì)與分析來關(guān)注“怎么做才是有效的”。在這種思路下,對歷史數(shù)據(jù)的占有與挖掘并產(chǎn)生洞察并不是設(shè)計(jì)干預(yù)手段與實(shí)驗(yàn)設(shè)計(jì)的必要條件。所以,實(shí)驗(yàn)也是那些還不具備充足的數(shù)據(jù)的領(lǐng)域和企業(yè)主動搜集數(shù)據(jù)的一種有效手段。十三、應(yīng)用與推廣:證析是為決策服務(wù)的,決策者包括但不限于企業(yè)經(jīng)理、高管等高層決策者,也包括企業(yè)一線的運(yùn)營人員。雖然證析項(xiàng)目是由企業(yè)的管理者發(fā)起并推動的,數(shù)據(jù)的搜集與分析是由分析師完成的,但是證析所生產(chǎn)的知識不是由企業(yè)管理者和分析師所專有的,這些知識可能對整個(gè)企業(yè)產(chǎn)生影響。只有這樣,證析才有可能發(fā)揮其最大價(jià)值。證析對企業(yè)的影響主要以三種形式體現(xiàn):工具或系統(tǒng)、組織與流程、人力資源。機(jī)械工程師會根據(jù)其經(jīng)驗(yàn)與知識設(shè)計(jì)新的工具以提升工作效率,這些新的工具是知識、訣竅、技能的物化。證析項(xiàng)目不可避免地要用到計(jì)算機(jī)進(jìn)行數(shù)據(jù)處理與分析,計(jì)算機(jī)系統(tǒng)是分析師應(yīng)用和推廣證析結(jié)果的首選。和機(jī)械工程師設(shè)計(jì)新工具相類似,分析師會設(shè)計(jì)一些自動化的算法和計(jì)算機(jī)能夠理解的業(yè)務(wù)規(guī)則,并將其與企業(yè)現(xiàn)有的運(yùn)營系統(tǒng)相融合,通過機(jī)器自動決策的形式指導(dǎo)

編輯推薦

《證析:大數(shù)據(jù)與基于證據(jù)的決策》是第一本關(guān)于Analytics的中文專注。其重點(diǎn)并不在于技術(shù)。證析的目的是使用數(shù)據(jù)提升決策質(zhì)量,它是思想、方法、組織、商業(yè)、系統(tǒng)、技術(shù)幾方面共同作用的結(jié)果。并且,除了IT技術(shù)之外,統(tǒng)計(jì)學(xué)、哲學(xué)、經(jīng)濟(jì)學(xué)、管理學(xué)、社會學(xué)、心理學(xué)等學(xué)科的思想與發(fā)展也必將對其產(chǎn)生重大影響?!蹲C析:大數(shù)據(jù)與基于證據(jù)的決策》是作者從思想與業(yè)務(wù)的角度對證析進(jìn)行探討的一個(gè)嘗試。

名人推薦

這個(gè)領(lǐng)域在理論與實(shí)踐均是剛剛起步。如果我們下大力氣,從實(shí)踐到理論,從理論到實(shí)踐來抓起,有可能在此領(lǐng)域參與、推動甚至領(lǐng)導(dǎo)世界上此行業(yè)的發(fā)展。我相信數(shù)十年后,人類對數(shù)據(jù)-信息-知識過程的創(chuàng)新,會如同蒸汽機(jī)、計(jì)算機(jī)的誕生一樣將是一個(gè)重大領(lǐng)域的創(chuàng)新。對建設(shè)創(chuàng)新性國家的中國無疑是歷史性的機(jī)遇。未來,我們每個(gè)人將有一個(gè)“數(shù)據(jù)銀行”。數(shù)據(jù)加工業(yè),數(shù)據(jù)工廠等新產(chǎn)業(yè)形式將層出不窮。它將帶來幾十萬、上百萬新型軟件工程師、數(shù)據(jù)分析師等新的工作與就業(yè)機(jī)會,中國應(yīng)有可能在過去幾十年成為世界工廠后,在未來幾十年成為世界的“數(shù)據(jù)工廠”?!袊鴮拵зY本基金董事長 田溯寧

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    證析 PDF格式下載


用戶評論 (總計(jì)51條)

 
 

  •   這本書寫的很好,里邊有大量的例子證明大數(shù)據(jù)的證析。
  •   證據(jù)是實(shí)事求是的根本元素,但很多企業(yè)決策都不依賴數(shù)據(jù)——數(shù)字證據(jù)
  •   大數(shù)據(jù)時(shí)代,了解證據(jù)方面的內(nèi)容
  •   很不錯的大數(shù)據(jù)讀物,不是一個(gè)朋友推薦了,確實(shí)對思路有幫助。不過是真想吐槽一下這物流速度,前天下單,今天快晚上才到。
  •   數(shù)據(jù)提供給我們完整的一生。
  •   大數(shù)據(jù)的世界已來臨。
  •   這本書的感覺是科學(xué)性和哲學(xué)性的結(jié)合,很不錯。
  •   案例豐富,引人入勝
  •   思考的角度很特別,值得一看
  •   給單位購買的圖書,發(fā)給員工看,觀看感說挺好的,需要了解的知識里面也挺全,發(fā)貨速度也很好,紙張印刷也不錯,非常好
  •   很不錯的一本書,包裝也非常精美
  •   領(lǐng)導(dǎo)很喜歡這本書,正在細(xì)細(xì)研讀。他說這本書很有意思,能鍛煉人的思維。
  •   老師推薦的一本課外讀物,非常好
  •   絕對好書,深入淺出,值得推薦,值得收藏。
  •   不錯,能把問題寫的這樣清晰不容易。問題是如何從其中獲得一些方法
  •   非常實(shí)用 很權(quán)威 對工作有幫助
  •   書挺好的,如果可以跟發(fā)票一起寄給我就更好了:)
  •   只是書太多,不知道什么時(shí)候可以看完
  •   書和東西都很好呀!
  •   非常好的書,考研必備,對我的幫助巨大
  •   Very impressive
  •   本人所反對的是某些信口開河、固步自封、狹隘自私的所謂'專家‘;反對的是用專家頭銜、華而不實(shí)的所謂'理論’自上而下的精英主義的灌輸觀念與建議。
  •   幫同事買的,看后說不錯。
  •   剛開始看有些難度,是本不錯的好書!會堅(jiān)持看完的!
  •   不錯,內(nèi)容很好,有內(nèi)涵,值得細(xì)讀
  •   打開另一扇門,給人一種全新的解讀和思維
  •   值得一看的關(guān)于大數(shù)據(jù)的書
  •   內(nèi)容很專業(yè),但讀進(jìn)去感覺豁然開朗,好書值得推薦。
  •   看目錄覺得內(nèi)容應(yīng)該還是不錯的
  •   挺好玩的,通俗易懂
  •   很有種開天辟地的氣勢
  •   感覺更適合管理者或研究信息管理學(xué)的學(xué)者來閱讀,和我原來想買的大數(shù)據(jù)技術(shù)類圖書初衷有點(diǎn)差別。更多是從大數(shù)據(jù)的意義,以及經(jīng)營、管理等方面進(jìn)行了論述??赡芨⒅厮伎挤椒ㄒ恍?。
  •   一般,較為空洞寬泛,可泛讀
  •   拿到書以后一氣讀下來。這本書是我看到中國人寫關(guān)于大數(shù)據(jù),數(shù)據(jù)分析和挖掘最好的書。里面充滿了案例,但更重要是是有觀點(diǎn)。本人從事商業(yè)和市場分析,對個(gè)人非常有啟發(fā)。建議從事分析,營銷以及企業(yè)高層拿來讀一下。真正的數(shù)據(jù)驅(qū)動,需要企業(yè)最高領(lǐng)導(dǎo)對數(shù)據(jù)和分析的價(jià)值有充分認(rèn)識,對數(shù)據(jù)和數(shù)據(jù)驅(qū)動有理解,自上而下地驅(qū)動企業(yè)數(shù)據(jù)變革。對很多公司來說,坐在數(shù)據(jù)的金山上但是不知道如何應(yīng)用。而很多傳統(tǒng)行業(yè)又說自己沒有數(shù)據(jù)。其實(shí),數(shù)據(jù)不需要多,關(guān)鍵是要將數(shù)據(jù)和自己的業(yè)務(wù)建立起來聯(lián)系。有機(jī)會可以看一下江南春在2012年艾瑞上海年會上講的垃圾數(shù)據(jù)的例子。希望有更多的人可以認(rèn)真讀一下這本中國人自己寫的,適合中國環(huán)境和腦子的書。
  •   帶著國內(nèi)第一本該領(lǐng)域書的好奇閱讀了該書。很有思想深度的一本書,關(guān)于大數(shù)據(jù)為背景如何有效提升決策質(zhì)量。決策對人類來說是個(gè)常規(guī)事務(wù),但在大數(shù)據(jù)的背景下,在商業(yè)競爭激烈的情況下,決策質(zhì)量和效率之于成敗攸關(guān)重要。作者指出了傳統(tǒng)決策的誤區(qū)和缺陷,并以科學(xué)方法對決策面對的不確定性進(jìn)行了具有可操作性的啟發(fā)、指導(dǎo)分析,使得工作中面對的很多實(shí)際問題豁然開朗;從運(yùn)營的角度,企業(yè)從客戶需求的捕捉、組織運(yùn)營、考核等方面如何基于事實(shí)本身的分析和運(yùn)用獲得競爭優(yōu)勢,作者以科學(xué)方法論的方式進(jìn)行了闡述并提出了驗(yàn)證思想和實(shí)踐指導(dǎo);最后,如何組織整合建立大數(shù)據(jù)資源也有很多建設(shè)性想法,體現(xiàn)了大數(shù)據(jù)為基礎(chǔ)的認(rèn)識和實(shí)踐思想
  •   角度不僅新穎并且確實(shí)很有現(xiàn)實(shí)指導(dǎo)意義,受到不少啟發(fā)。
  •   讀到后面有些松勁了,再努力讀吧!
  •   寫得挺不錯的,很實(shí)用
  •   作者是國內(nèi)的 寫的還是很好的 有理有據(jù)
  •   有點(diǎn)羅嗦,觀點(diǎn)也很不明確,有時(shí)候很多時(shí)候不知道作者在討論什么議題。雖然題目是big data,但是明顯是圖書商人掛羊頭賣狗肉。和周濤翻譯的那個(gè)暢銷書big data差很遠(yuǎn)。
  •   還沒有讀完,但是感覺不錯。最主要是書中提供的是思維方法。
  •   “如果說以前商業(yè)上最大的秘密是可口可樂的神秘配方,那么現(xiàn)在商業(yè)上最大的秘密就是eBay、Google這些公司如何處理和利用客戶數(shù)據(jù)的算法”。早期IT應(yīng)用的優(yōu)勢不再有效,但I(xiàn)T應(yīng)用并未死亡。過去理解的IT是電子化應(yīng)用的基礎(chǔ)設(shè)施及軟件定制,現(xiàn)在則是大數(shù)據(jù)環(huán)境下,企業(yè)與用戶交互行為數(shù)據(jù)挖掘。
  •   絕非人云亦云之作??梢钥纯醋詈笠徽轮袑S克托?邁爾?舍恩伯格在《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》一書中提到的相關(guān)性大于因果性的批評。
  •   將已有的各類信息進(jìn)行堆砌,說明一個(gè)顯而易見的事實(shí):信息分析的重要性。我們想看到是針對不同行業(yè)或有代表性的過程如何收集信息,如何分析信息。書中對我而言沒有新信息。
  •   故弄玄虛,純粹是作者自以為是的主觀意見,或者對于現(xiàn)象的斷章取義......
  •   感覺蠻實(shí)在的一本書 比較有理性和邏輯性 蠻適合我的口味對數(shù)據(jù)分析有個(gè)框架性的認(rèn)識
  •   很好, 很不錯 很喜歡!
  •   真心覺得是一本好書,可以慢慢研究
  •   選大數(shù)據(jù)時(shí)的推薦書
  •   這本書不錯的樣子。。。
  •   很多有趣的案例,通俗易懂!
 

250萬本中文圖書簡介、評論、評分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號-7