什麼都能算,什麼都不奇怪

出版時(shí)間:2008年10月27日  出版社:時(shí)報(bào)文化  作者:Ian Ayres  譯者:張美惠  
Tag標(biāo)簽:無(wú)  

內(nèi)容概要

   為什麼Google與亞馬遜比你更了解你的品味?   賭場(chǎng)為什麼不讓你繼續(xù)輸錢(qián)?   數(shù)學(xué)公式如何幫你找到另一半?   應(yīng)徵工作時(shí),你知道自己是因統(tǒng)計(jì)分析而吃了閉門(mén)羹嗎?   生活裡,數(shù)據(jù)無(wú)所不在,決策只靠經(jīng)驗(yàn)與直覺(jué),已不夠看,在這個(gè)資料至上的社會(huì),統(tǒng)計(jì)文盲絕無(wú)法成功--甚至難以生存。   數(shù)據(jù)+直覺(jué)+經(jīng)驗(yàn)=創(chuàng)意→聰明決策   這是個(gè)數(shù)據(jù)思考的時(shí)代。這場(chǎng)數(shù)字革命,與其抗拒,不如參與。   舉凡醫(yī)生的診斷、下一代的教育、企業(yè)經(jīng)營(yíng)、政府組織、網(wǎng)站--例如Google與亞馬遜便比你更了解你的品味   這些新品種的決策者無(wú)處不在發(fā)揮影響力。他們提出的預(yù)測(cè)精準(zhǔn)到讓人咋舌?!? 你知道棒球教練即使沒(méi)有見(jiàn)過(guò)球員也能評(píng)斷他的潛力嗎?你希望在購(gòu)買(mǎi)機(jī)票之前預(yù)知票價(jià)會(huì)漲還是會(huì)跌?簡(jiǎn)單的公式為何比酒評(píng)家更能預(yù)估葡萄酒的品質(zhì)?這些問(wèn)題,超級(jí)數(shù)據(jù)達(dá)人都有答案。在這個(gè)方程式VS專(zhuān)家的美麗新世界,蘊(yùn)藏其中的利益與風(fēng)險(xiǎn)為何?誰(shuí)是贏家?誰(shuí)是輸家?如何善用超級(jí)數(shù)據(jù)分析以避免被操縱?   仰賴(lài)直覺(jué)進(jìn)行決策的時(shí)代已然過(guò)去。不論你是企業(yè)家、消費(fèi)者或?qū)W生,若想要超越群倫,在跨出下一步之前一定要先讀讀《什麼都能算,什麼都不奇怪--超級(jí)數(shù)據(jù)分析的祕(mì)密》。 

作者簡(jiǎn)介

伊恩?艾瑞斯(Ian Ayres)
計(jì)量經(jīng)濟(jì)學(xué)家與律師,耶魯法學(xué)院教授(William K. Townsend教授席),耶魯管理學(xué)院教授。經(jīng)常在美國(guó)公共電臺(tái)的「市場(chǎng)分析節(jié)目」(Marketplace)擔(dān)任評(píng)論員,也是《富比世雜誌》(Forbes)的專(zhuān)欄作家。目前擔(dān)任《法律、經(jīng)濟(jì)學(xué)與組織期刊》(Journal of Law, Economics, and Organization)編輯,已出版八本書(shū),發(fā)表過(guò)上百篇文章。另外,也以客座部落客身分在《紐約時(shí)報(bào)》「蘋(píng)果橘子經(jīng)濟(jì)學(xué)部落格」定期發(fā)表評(píng)論、分享意見(jiàn)。

編輯推薦

   ◎聯(lián)合推薦   亞洲資採(cǎi)技術(shù)總監(jiān)&微軟特約顧問(wèn)/尹相志   輔仁大學(xué)統(tǒng)計(jì)資訊學(xué)系教授/中華資料採(cǎi)礦協(xié)會(huì)理事長(zhǎng)/謝邦昌   臺(tái)灣實(shí)證醫(yī)學(xué)學(xué)會(huì)祕(mì)書(shū)長(zhǎng)/萬(wàn)芳醫(yī)院實(shí)證醫(yī)學(xué)中心主任/陳杰峰   臺(tái)灣體育大學(xué)休閒產(chǎn)業(yè)經(jīng)營(yíng)學(xué)系副教授/陳美燕   政治大學(xué)公共行政學(xué)系助理教授/蕭乃沂

圖書(shū)封面

圖書(shū)標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    什麼都能算,什麼都不奇怪 PDF格式下載


用戶(hù)評(píng)論 (總計(jì)25條)

 
 

  •     就是原書(shū)副標(biāo)題:Why Thinking-By-Numbers is the New Way To Be Smart.
      
      說(shuō)到標(biāo)題真是無(wú)法理解《什么都能算,什么都不奇怪》這個(gè)東西到底是從哪里翻譯出來(lái)的,不要告訴我是增加銷(xiāo)量考慮。。。下方正文:
      
      1. 控制臨界點(diǎn)
      
      哈樂(lè)賭場(chǎng)運(yùn)用顧客的資訊來(lái)預(yù)測(cè)特定賭客可以忍受輸?shù)舳嗌馘X(qián)(將顧客資料套入會(huì)回歸分析公式),仍愿意回來(lái)消費(fèi),即痛苦臨界點(diǎn)。而當(dāng)資料庫(kù)偵測(cè)到某顧客將要輸?shù)脚R界點(diǎn)時(shí),會(huì)有幸運(yùn)大師引導(dǎo)她離開(kāi)機(jī)子(比如好可惜今天運(yùn)氣不好,我知道你喜歡我們的牛排,不如離開(kāi)去嘗一下這樣)
      
     ?。粌H是數(shù)據(jù)和分析,更是消費(fèi)心理。的確有一些顧客本來(lái)就抱著手上錢(qián)都輸?shù)艟妥呷说男睦碓谕?,但都輸光后基本就感覺(jué)心愿已了,以后也不會(huì)再來(lái)了。
      
      
      2. 消費(fèi)者(or 對(duì)立面?zhèn)€體)的反擊
      
      比如發(fā)現(xiàn)航空公司在起飛前不斷調(diào)整價(jià)格的教授進(jìn)行反向分析,創(chuàng)立了farecast。 還有房地產(chǎn)業(yè)的Zillow是根據(jù)大量資料集的分析,通過(guò)過(guò)去房?jī)r(jià)幫助買(mǎi)賣(mài)雙方訂定適當(dāng)價(jià)格。
      
     ?。R?jiàn)的是用過(guò)去數(shù)據(jù)(大量數(shù)據(jù))進(jìn)行對(duì)未來(lái)的預(yù)測(cè)和分析,而且在作者看來(lái)會(huì)因?yàn)橘Y料的大量產(chǎn)生(智能化),免費(fèi)取得而使進(jìn)行分析更加方便。但我覺(jué)得更有效的是針對(duì)商家算法進(jìn)行反分析~一時(shí)之間想不出典型案例,先記一下。
      
      3.人與程式的對(duì)立
      
      書(shū)種典型案例(在我看來(lái))是直接教學(xué)法。因?yàn)檫@個(gè)方法基本上,明顯,坦白,直接地消除了教師作為個(gè)體的價(jià)值(或者附加價(jià)值)。教師只用照本宣科,不用準(zhǔn)備也不用創(chuàng)新,那下一階段的發(fā)展就是取消或者減小這一載體(全面電子化或者遠(yuǎn)程)。所以看那一段的時(shí)候我想到的是《慧眼挑金》里提到的技術(shù)進(jìn)步必然帶來(lái)大批工作的消亡,的說(shuō)法。
      
      總結(jié):
      
      相比《大數(shù)據(jù)》(Big Data:A Revolution That Will Transform How We Live, Work, and Think),這本書(shū)中商業(yè),創(chuàng)新化的案例少得多。而且大概是學(xué)者慣例,常用大半章講一個(gè)社會(huì)化的案例(醫(yī)學(xué),教育)。
      
      在實(shí)際操作上,給了一個(gè)有效的公式——就是我們的葡萄酒先生。大概因?yàn)橛泄綗o(wú)銷(xiāo)量的理念太深入人心了。問(wèn)題是數(shù)字非常多,尤其是涉及常舉的決策層面例子時(shí),差點(diǎn)變成~大數(shù)字~。。。
      
      最后一點(diǎn)是此書(shū)很適合和其他幾類(lèi)配合看。比如大數(shù)據(jù)類(lèi),還有賭場(chǎng)掌控臨界點(diǎn)的已經(jīng)進(jìn)入了行為心理學(xué)范疇。 直接教學(xué)的爭(zhēng)議性是工業(yè)革命以來(lái)技術(shù)威脅職員的又一例證。 算法和反算法的進(jìn)步真是讓人對(duì)人類(lèi)的未來(lái)期待得熱淚盈眶。
      
      
      作者在書(shū)中提到的有用工具:
      
      Google :: prediction tools ayres (是的這多方便)
      
  •     作者推薦閱讀:
      Ray C. Fair,
      Predicting Presidential Elections and Other Things (2002).
      
      Steven Levitt and Stephen J. Dubner,
      Freakonomics: A Rogue Economist Explores the Hidden Side of Everything (2005).
      
      John Allen Paulos,
      Innumeracy: Mathematical illiteracy and Its Consequences (1989).
      
      John Donohue,
      Beautiful Models, and Other Threats to Life, Law, and Truth (forthcoming).
      
      書(shū)中值得一讀的其他書(shū)籍和文章:
      
      An introduction to Neural Networks By Kevin Gurney
      
      Neural Networks and Betting:
      Hsinchun Chen et al.,
      "Expert Prediction, Symbolic Learning, and Neural Networks: An Experiment on
      Greyhound Racing," 9 IEEE Expert 21 (Dec. 1994).
      
      Daniel C. Esty and Reece Rushing, Data-Driven Policymaking, Center for American Progress (Dec. 2005).
      
      James Surowiecki, The Wisdom of Crowds (2004)
      
      Steve Carter and Chadwick Snow, eHarmony.com, "Helping Singles Enter Better Marriages Using Predictive Models of Marital Success," Presentation to 16th Annual Convention of the American Psychological Society (May 2004), http://sratic.eharmony.com/images/eHarmony-APS-handout.pdf
      
      Barbara Ehrenreich, Nickel and Dimed: On (Not) Getting By in America (2001).
      
      Ronald Fisher, Statistical Methods for Research Workers (1925);
      Ronald Fisher, The Design of Experiments (1935).
      
      David Greenberg et al., Social Experimentation and Public Policy-making (2003).
      
      
      Benjamin A. Olken, "Monitoring Corruption: Evidence from a Field Experiment in Indonesia,"
      
      Clinical Versus Statistical Prediction: The Contribution of Paul E. Meehl," 61 J. Clinical Psychol. 1233 (2005), http://www.psych.umn.edu/faculty/grove/112clinicalversusstatisticalprediction.pdf
      
      
       William M. Grove and Paul E. Meehl,
      "Comparative Efficiency of Informal (Subjective, Impressionistic) and Formal
      (Mechanical, Algorithmic) Prediction Procedures: The Clinical-Statistical
      Controversy," 2 Psychol. Pub. Pol'y and L. 293, 298 (1996);
      
      D. Kahneman et al.,Judgment Under Uncertainty: Heuristics and Biases (1982)
      
      
      Oliver Wendell Holmes, Jr.,
      "The Path of the Law," 10 Harv. L. Rev. 457 (1897)
  •     在大部分被數(shù)學(xué)折磨得死去活來(lái)的關(guān)注人類(lèi)心靈的“人文學(xué)者”或是文藝青年眼里,數(shù)學(xué)不過(guò)是加減乘除,用來(lái)算算房?jī)r(jià)、股市收益或是購(gòu)物打折就可以了,更高深點(diǎn)的東西是科學(xué)呆瓜們的事情。看看那幫毫無(wú)情趣的家伙,他們神情呆滯,體態(tài)孱弱,老是犯類(lèi)似“然后,就沒(méi)有然后了……”的錯(cuò)誤,終日在實(shí)驗(yàn)室中鼓搗那些與正常生活八竿子打不著的東西,用甚至自己都看不懂的數(shù)學(xué)公式將他們的工作包裝一番,不知怎么的就得出了一個(gè)可能全世界只有幾個(gè)人會(huì)關(guān)心的結(jié)論。
      
      但現(xiàn)在看來(lái),文藝青年們的陣地可能要失守了。Super Crunchers科普了統(tǒng)計(jì)學(xué)在諸多領(lǐng)域的應(yīng)用和強(qiáng)大威力。在過(guò)去幾十年里,潘多拉搖身一變?yōu)椤敖y(tǒng)計(jì)學(xué)”,已經(jīng)偷偷溜出了關(guān)著她的實(shí)驗(yàn)室,把魔爪伸到諸如葡萄酒娘、電影、書(shū)籍、癥狀診斷、法律、教育理念等以往看來(lái)跟數(shù)學(xué)毫無(wú)關(guān)系的領(lǐng)域。它施展諸如回歸方程、正態(tài)分布、貝葉斯公式,甚至神經(jīng)網(wǎng)絡(luò)算法等十八般武藝,拳打品酒師,腳踢制片人,將這些領(lǐng)域中靠經(jīng)驗(yàn)和直覺(jué)吃飯的權(quán)威專(zhuān)家們打得滿地找牙節(jié)節(jié)敗退。
      
      有什么辦法呢,哪怕你是有著50年從醫(yī)經(jīng)驗(yàn)的專(zhuān)家醫(yī)師,世界上11000種疾病你也只知點(diǎn)滴,依然有各種疑難怪病是你見(jiàn)所未見(jiàn)聞所未聞的。但將癥狀與數(shù)據(jù)庫(kù)信息匹配,很快就能夠?qū)⒁伤萍膊∫钥赡苄缘母叩鸵涣锱砰_(kāi)。
      
      又或者,就算你拍過(guò)一系列暢銷(xiāo)電影,對(duì)電影的認(rèn)識(shí)極具洞見(jiàn),但你可敢宣稱(chēng)暢銷(xiāo)電影不需要明星,不需要好導(dǎo)演,不需要滿世界找拍攝地點(diǎn)?數(shù)據(jù)統(tǒng)計(jì)的分析結(jié)果告訴你,一部賣(mài)座的電影,確實(shí)不需要這些。統(tǒng)計(jì)學(xué)家們根據(jù)劇本就能夠預(yù)測(cè)電影的票房——雖然不是特別精準(zhǔn),但已經(jīng)比“業(yè)內(nèi)專(zhuān)家”的準(zhǔn)確率高了一倍!
      
      再比如說(shuō)靠“感覺(jué)”吃飯的品酒師,他們品呷一口美酒,給它定下品級(jí),決定了價(jià)錢(qián),一不小心便成就幾百萬(wàn)的生意。但統(tǒng)計(jì)學(xué)家告訴人們,品酒師們的舌頭跟鼻子可不準(zhǔn)確,立場(chǎng)也未必中立,葡萄酒的質(zhì)量要看當(dāng)年的氣溫和降雨量。有了這兩個(gè)參數(shù),計(jì)算機(jī)能夠預(yù)測(cè)出葡萄酒的品質(zhì)。這讓品酒師們氣急敗壞。但最后結(jié)果證明,統(tǒng)計(jì)數(shù)據(jù)是對(duì)的。無(wú)論品酒師們?cè)趺创祰u,市場(chǎng)價(jià)格最終證明了86年的波爾多紅酒確實(shí)品質(zhì)很差,同時(shí)也證明了88年的紅酒品質(zhì)極佳,89年的更勝一籌。
      
      想來(lái)真是一件美妙的事情。無(wú)論什么事情,只要將其數(shù)據(jù)化,輸入計(jì)算機(jī),經(jīng)過(guò)一系列復(fù)雜的計(jì)算,便能預(yù)知未來(lái)的可能性——統(tǒng)計(jì)學(xué)家和極客們將要統(tǒng)治世界!想想看,我在猶豫是否要買(mǎi)iphone 4s,計(jì)算機(jī)分析我的過(guò)往消費(fèi)和生活習(xí)慣數(shù)據(jù)后,給出建議,讓我去買(mǎi)1000元的山寨機(jī),這能讓我收益最大化。而深圳的山寨機(jī)廠雖然生產(chǎn)手機(jī)不怎么樣,但有超強(qiáng)的數(shù)據(jù)分析能力,他能夠根據(jù)我以往的消費(fèi)習(xí)慣,分析出我能最多能被坑/購(gòu)買(mǎi)另一家廠商的產(chǎn)品的價(jià)格臨界點(diǎn),利潤(rùn)最大化。這個(gè)世界將井然有序,科學(xué)合理,不是么?
      
      不過(guò)數(shù)據(jù)統(tǒng)計(jì)并非萬(wàn)能。數(shù)據(jù)畢竟來(lái)源于過(guò)去,完全由歷史來(lái)推斷未來(lái),很多時(shí)候顯得自縛手腳。默片時(shí)代,數(shù)據(jù)無(wú)法證明一部有聲音的電影將會(huì)賣(mài)座。在蘋(píng)果鼓搗出iphone之前,數(shù)據(jù)的來(lái)源是可以用來(lái)砸核桃的諾基亞手機(jī),根據(jù)它的預(yù)測(cè),更好的手機(jī)應(yīng)該是續(xù)航更久、鍵盤(pán)更好用……而不是......iphone。
      
      但真正讓人深思的不僅僅如此。書(shū)中還提到了統(tǒng)計(jì)學(xué)在法律中的應(yīng)用。潘多拉搖曳著身姿,進(jìn)入了最為嚴(yán)肅、關(guān)乎人類(lèi)社會(huì)基石的領(lǐng)域。同樣的罪行,假如受到更嚴(yán)厲的懲罰(坐更長(zhǎng)時(shí)間的牢),是否會(huì)降低罪犯出獄后再犯的幾率?看上去是的。但統(tǒng)計(jì)學(xué)研究告訴我們,坐牢時(shí)間長(zhǎng)短與再犯率沒(méi)有關(guān)系。
      
      另一個(gè)例子讓人更加印象深刻。一名劣跡斑斑的性罪犯刑滿出獄。在他即將踏出監(jiān)獄大門(mén)的時(shí)候,法官們用計(jì)算機(jī)分析他的案底、心理數(shù)據(jù)后發(fā)現(xiàn),這家伙重犯的幾率非常高,于是要讓他一直被民事拘留,直到他通過(guò)年度審核,經(jīng)過(guò)一些列的測(cè)試,法官認(rèn)可后才可真正獲得自由——否則便是無(wú)異于終身監(jiān)禁的持續(xù)性拘留。
      
      多棒的一幅后現(xiàn)代圖景!人們已經(jīng)為過(guò)往的行為付出了代價(jià),卻依然要因?yàn)楦鶕?jù)自己的過(guò)去而計(jì)算出來(lái)的一個(gè)“可能性”而失去自由——為還未發(fā)生的事情負(fù)責(zé)。盡管在商業(yè)中,比如說(shuō)銀行貸款,銀行完全可以根據(jù)一個(gè)人的信用記錄來(lái)決定給不給顧客提供服務(wù);但這畢竟是剝奪自由,不是你情我愿的商業(yè)買(mǎi)賣(mài)。
      
      一個(gè)持槍走向銀行的人有明顯的危險(xiǎn)性要被制止(感謝李騰君提供的例子),對(duì)犯罪的預(yù)防是有必要的。但你能夠想象,一個(gè)眼前看上去毫無(wú)侵略性的人,會(huì)因?yàn)樗臍v史和心理狀態(tài)而已經(jīng)失去了自由么?哪怕是被提前截下的銀行搶劫未遂者,也是在他謀劃、行動(dòng)途中,而不會(huì)是在兩個(gè)月前跟女友分手,或是失業(yè)半年窮困潦倒的時(shí)候被逮捕吧?
      
      但有趣的是,這個(gè)法案確實(shí)被通過(guò)了。(當(dāng)然,我是法律外行,只能就最淺顯的信息作出近乎直覺(jué)的判斷)
      
      看過(guò)黑鏡的同學(xué)應(yīng)該還記得,第三集的男主角要開(kāi)車(chē)的時(shí)候,Grain警告他的心理狀態(tài)不適合駕駛。按照片中對(duì)Grain的描述,它自然也能夠分析出男主角當(dāng)時(shí)有強(qiáng)烈的暴力傾向,非常有可能進(jìn)行犯罪行為——這個(gè)時(shí)候應(yīng)該馬上有警察將他拿下,預(yù)防犯罪嘛。數(shù)據(jù)收集、分析、預(yù)測(cè),加上預(yù)防犯罪……
      
      可以想象,未來(lái)的某天,由于前天晚上忘了設(shè)置鬧鐘,起床太晚馬上要遲到,因此產(chǎn)生了強(qiáng)烈的反社會(huì)情緒。計(jì)算機(jī)馬上根據(jù)我的心理狀況預(yù)測(cè)出我有89%的幾率要在老板的辱罵下揍他一頓;同時(shí)根據(jù)我的能量水平和肌肉狀態(tài),認(rèn)為我確實(shí)有這個(gè)能力,于是禁止我出門(mén)。在焦急中我產(chǎn)生了更強(qiáng)烈的暴力傾向,計(jì)算機(jī)接收數(shù)據(jù)后經(jīng)過(guò)計(jì)算,直接報(bào)警通知警察。我在心緒平靜下來(lái)后,決定要掩飾自己的反社會(huì)情緒,計(jì)算機(jī)查探出了我的“掩飾”,于是乎我要掩飾“掩飾”……最后我終于出門(mén)了,內(nèi)心的小宇宙被無(wú)數(shù)層“正?!钡目装?,臉上洋溢著幸??鞓?lè)而又意味深長(zhǎng)的蒙娜麗莎式微笑……
      
      李騰君說(shuō),盡管這是可能的發(fā)展方向,只要人類(lèi)還保持對(duì)權(quán)力的警惕,應(yīng)該不至于如此。
      
      但人類(lèi)對(duì)權(quán)力保持警惕乃是因?yàn)閷?duì)人性和理性的完備性不信任。但假如權(quán)力依托于機(jī)器呢??jī)r(jià)值中立的計(jì)算機(jī),隨著科技的發(fā)展,因擁有超強(qiáng)的信息搜集和數(shù)據(jù)運(yùn)算能力而幾乎理性完備,世界于是乎可以在他/她/它的安排下井井有條……
      
      又或者,雖然人類(lèi)對(duì)權(quán)力抱有警惕,但你知道有些權(quán)力代表著真善美、高大全,是不管你的警惕的……如果那個(gè)社團(tuán)熬過(guò)了某個(gè)“科技閾值”,于是……
      
      噢,未來(lái)還真是值得期待啊。一曲忠誠(chéng)的贊歌。
      
  •      這是BI系列的書(shū),BI(bussiness intelege)是綜合了統(tǒng)計(jì)學(xué),現(xiàn)代信息技術(shù),人工智能的多個(gè)學(xué)科的決策方法。令我驚奇的是作者是計(jì)量經(jīng)濟(jì)學(xué),律師,管理學(xué)教授。讀他這本書(shū)有些法律方面的探討有點(diǎn)難理解,也覺(jué)得美國(guó)對(duì)于法律方面的“糾結(jié)”真多。
       書(shū)中事例很多也隨之介紹了基本的統(tǒng)計(jì)學(xué)知識(shí),如隨機(jī)試驗(yàn),回歸預(yù)測(cè),平均值,標(biāo)準(zhǔn)差,概率,置信區(qū)間還有貝葉斯。從古到今,我們的自己做的決策和選擇的過(guò)程,往往是依賴(lài)于對(duì)于整個(gè)信息的
      綜合反映,也夾雜著作為人的這種情感動(dòng)物的顯著特點(diǎn),而社會(huì)科學(xué)給我們大家的感覺(jué)是研究一種人類(lèi)活動(dòng)的規(guī)律,現(xiàn)在數(shù)學(xué)尤其是統(tǒng)計(jì)學(xué)作為一種定量分析工具越來(lái)越參與進(jìn)來(lái)了。書(shū)中涉及到的公共政策
      制定的隨機(jī)試驗(yàn),醫(yī)學(xué)上的循證法,教學(xué)上的直導(dǎo)教學(xué)法,各類(lèi)生產(chǎn)上的預(yù)測(cè),商業(yè)上的廣告隨機(jī)試驗(yàn),消費(fèi)分析,銀行業(yè)上的信用評(píng)價(jià)等通過(guò)強(qiáng)大的數(shù)據(jù)庫(kù)系統(tǒng)搜集信息,利用統(tǒng)計(jì)學(xué)的知識(shí)還有人工智能
      方面(如神經(jīng)網(wǎng)絡(luò))的知識(shí)產(chǎn)生更加準(zhǔn)備的決策信息讓人感覺(jué)新的時(shí)代將要到來(lái),但這也的確讓人沮喪,我們?nèi)绱俗院?,?dú)一無(wú)二的直覺(jué),感情,邏輯所形成的“智慧”有時(shí)候竟然比不過(guò)機(jī)器,自己通過(guò)網(wǎng)絡(luò)搜索得到的診斷有時(shí)候比專(zhuān)業(yè)醫(yī)生準(zhǔn)備,若是有一套強(qiáng)大的自我跟蹤數(shù)據(jù)庫(kù)系統(tǒng),經(jīng)過(guò)跟蹤整理可以很快分析出你的病因,以及需要采取的治療手段,對(duì)于記憶調(diào)用來(lái)說(shuō),數(shù)據(jù)庫(kù)的確擁有無(wú)法比擬的優(yōu)勢(shì),得益于信息科技的突飛猛進(jìn)的發(fā)展,首先,我們自己的知識(shí)量可以通過(guò)網(wǎng)絡(luò)得到無(wú)限的擴(kuò)充,而進(jìn)一步,我們的思維活動(dòng)決策開(kāi)始可以依賴(lài)建立在定量基礎(chǔ)上的機(jī)器分析出來(lái)結(jié)果,這種變革引發(fā)的爭(zhēng)議更是不少,書(shū)中作者探討了很多這方面問(wèn)題,比如人的隱私怎么辦,或許在得到好處后是否能夠?qū)㈦[私重新定義呢?而我們是否是應(yīng)該利用數(shù)字做參考,還是我們應(yīng)該大輔助相信通過(guò)機(jī)器而來(lái)的決策呢?我們的直覺(jué),創(chuàng)造力如何與這個(gè)用算法處理出來(lái)的決策信息結(jié)合呢?數(shù)據(jù)統(tǒng)計(jì)決策失效怎么辦,會(huì)帶來(lái)多大的災(zāi)難性后果而這個(gè)人為決策比較呢?我的行為下一步已經(jīng)被預(yù)測(cè),這告訴我后會(huì)產(chǎn)生怎樣的循環(huán)反映呢,這對(duì)人來(lái)說(shuō),對(duì)社會(huì)來(lái)說(shuō)意味著什么?我們?cè)撓嘈耪l(shuí),或者我們應(yīng)該如果融合這項(xiàng)新技術(shù)?未來(lái)會(huì)怎么樣,人工智能會(huì)發(fā)展到什么程度,未來(lái)我們能干什么,失去的智慧思考能力,萬(wàn)一機(jī)器連電影都可以寫(xiě)的比我們好時(shí),繪畫(huà)也比我們好時(shí),我們能否重新找到人生意義?
       1,現(xiàn)代信息技術(shù)發(fā)達(dá),如網(wǎng)速的提升,cpu運(yùn)算能力提升,硬盤(pán)存儲(chǔ)提升,平板,無(wú)線,移動(dòng)終端的智能化,七七八八的定律都證明的是這種發(fā)展速度是以?xún)赡攴端俣仍鲩L(zhǎng)的;2,互聯(lián)網(wǎng)世界的誕生,人們生活的拓展,互聯(lián)網(wǎng)帶來(lái)新的生活,社交,商業(yè)體驗(yàn)以及維基精神,開(kāi)源運(yùn)動(dòng)等開(kāi)放,互助,共享,遠(yuǎn)程合作,虛擬世界的新文化;3,統(tǒng)計(jì)學(xué)在信息科學(xué)的運(yùn)用還有涉及人工智能的模式識(shí)別,神經(jīng)網(wǎng)絡(luò),遺傳算法。。等等,結(jié)合最新數(shù)據(jù)庫(kù)技術(shù)得以實(shí)現(xiàn)。我覺(jué)得這種趨勢(shì)是不可避免的,唯一做的就是敞開(kāi)自己的胸懷去了解它?,F(xiàn)在來(lái)說(shuō),我們應(yīng)該有種新的思維來(lái)認(rèn)識(shí)這個(gè)世界,用數(shù)據(jù)的眼光來(lái)分析這個(gè)世界,當(dāng)然這可以當(dāng)一種樂(lè)趣一樣去行動(dòng),想想如何對(duì)待自己的行為,如何將信息組織起來(lái),如何將信息用來(lái)分析,如何參考結(jié)論再結(jié)合自己的經(jīng)驗(yàn)發(fā)現(xiàn)些新的,有意思的東西。
      例子:
      第一代“診斷-決策支持”軟件。一個(gè)名叫“伊莎貝爾”的診斷項(xiàng)目使醫(yī)生可以輸入病人的癥狀就可以得到一系列最可能的病因。它甚至還可以告訴醫(yī)生病人的癥狀是否由于過(guò)度服用藥物,涉及藥物達(dá)到4000多種?!耙辽悹枴睌?shù)據(jù)庫(kù)涉及1100多種疾病的大量臨床發(fā)現(xiàn),實(shí)驗(yàn)室結(jié)果,病人的病史,以及其本身的癥狀?!耙辽悹枴钡捻?xiàng)目涉及人員創(chuàng)立了一套針對(duì)所有疾病的分類(lèi)法,然后通過(guò)搜索報(bào)刊文章的關(guān)鍵詞找出統(tǒng)計(jì)上與每個(gè)疾病最相關(guān)的文章,如此形成一個(gè)數(shù)據(jù)庫(kù)。這種統(tǒng)計(jì)搜索程序顯著地提高給每個(gè)疾病癥狀匹配編碼的效率。而且如果有新的并且高相關(guān)性的文章出現(xiàn)時(shí),可以不斷更新數(shù)據(jù)庫(kù)。
      
      
  •     
      最近在卓越上買(mǎi)了一些商業(yè)智能相關(guān)的書(shū),卓越給我推薦了一些相關(guān)的書(shū)。這兩本都是卓越給推薦的,感覺(jué)可能還值得一看,就買(mǎi)來(lái)看了看。
      
      《數(shù)據(jù)分析競(jìng)爭(zhēng)法》是商務(wù)印書(shū)館的哈佛經(jīng)管系列之一,名頭比較大,先看它。不過(guò)有些失望。不是給技術(shù)人員看的。題目中的數(shù)據(jù)分析大約是說(shuō)商業(yè)智能中的數(shù)據(jù)挖掘。作者把企業(yè)利用數(shù)據(jù)挖掘的程度分為由低到高的五級(jí)。全書(shū)反復(fù)論述每個(gè)級(jí)別的方法、工具、流程、對(duì)企業(yè)的好處,還舉了一些的例子。在我看來(lái)這些例子不夠詳細(xì),太籠統(tǒng)。所以我認(rèn)為這本書(shū)適合于不了解商業(yè)智能與數(shù)據(jù)挖掘的管理人員閱讀。
      
      《超級(jí)數(shù)字天才》也在將數(shù)據(jù)挖掘給人類(lèi)帶來(lái)的好處。不同之處是相對(duì)比較詳細(xì),給出了具體的例子和實(shí)現(xiàn)的思路。書(shū)中列也在使用“數(shù)據(jù)分析”這個(gè)詞,基本也在指“數(shù)據(jù)挖掘”。書(shū)中列舉了數(shù)據(jù)挖掘在政府政策、教育、醫(yī)療等許多方面的實(shí)際應(yīng)用的例子,都比較有意思。想了解數(shù)據(jù)挖掘的具體應(yīng)用,可以看看這本書(shū)。
      
      書(shū)中給我印象比較深刻的是例子中政府與教育行業(yè)的數(shù)據(jù)挖掘應(yīng)用。一項(xiàng)政策的好壞,一個(gè)教育方法的好壞,美國(guó)人都試圖用數(shù)據(jù)說(shuō)話。
      
      
  •     First of all, 我老人家就是喜歡沒(méi)事收集和tweek data,分析看看有沒(méi)有什么trend的,雖然生活里面沒(méi)有什么設(shè)計(jì)randomized trial驗(yàn)證假設(shè)的機(jī)會(huì),但是這個(gè)概念實(shí)在非常貼近內(nèi)心。Overall I like the book,雖然新信息不是很多,這個(gè)喜歡來(lái)自于自己的bias吧。
      
      喜歡本書(shū)的另外原因是剛好書(shū)里提到的好幾個(gè)方面從前也讀過(guò)類(lèi)似的書(shū),Checklist Manifesto, Freakonomics等等,(回頭來(lái)列一下幾大方向的試驗(yàn))。Randomized trial in marketing and medical research, 甚至還提了一點(diǎn)supple chain management (which is an area that I am hugely curious about but not sure where to look for further information)
      
      書(shū)里提出的一個(gè)idea是,不要用heuristics 去猜什么辦法會(huì)有最佳成效,instead推出各種類(lèi)似辦法,設(shè)計(jì)試驗(yàn)用數(shù)據(jù)驗(yàn)證到底哪個(gè)辦法最好。這個(gè)說(shuō)法在現(xiàn)在很多書(shū)里面都提到,包括the dragonfly effect(use social media for nonprofit organizations)。大體意思是,不要糾結(jié)于自己的成見(jiàn),快速measure and analyze,放棄不好的辦法,趕快去adopt事實(shí)證明就是好用的辦法,就行了。甚至不需要知道一種辦法為什么work,if good data says it works, then adopt it on a wider scale (作為statistician 這個(gè)claim還是有點(diǎn)懷疑態(tài)度,因?yàn)樵囼?yàn)設(shè)計(jì)里面出各種問(wèn)題忽略一些因素的可能還是很大的)
      
      對(duì)作者claim的regression sustainably beat expert opinion in many fields,很想看看具體數(shù)據(jù)和試驗(yàn)設(shè)計(jì),雖然是一條我很樂(lè)于同意的claim,還是覺(jué)得too good to be true。
      
      書(shū)中提到eharmony之類(lèi)claim data driven prediction model是他們claim成功的原因,但是The upside of irrationality 里面攻擊這個(gè)model的弱點(diǎn)也正在于此。Human traits are not so readily reduced to easy to compute dimensions.
      
      
      書(shū)還沒(méi)有讀完,我還想知道作者有沒(méi)有說(shuō)什么場(chǎng)合下可以stats prediction consistently beat experts,什么時(shí)候不是。
      
      -------------------------------------
      讀完了,缺乏驚人的地方,最終也沒(méi)有能回答上面提的問(wèn)題。
      書(shū)可能過(guò)淺顯了?讀過(guò)的感覺(jué)是good to know, but now what?
      也許對(duì)于我自己來(lái)說(shuō),就是多想想自己生活里面還有什么其他data可以去crunch?
  •     這本書(shū)的主標(biāo)題是"Super (Number) Crunchers", 副標(biāo)題是"Why Thinking-by-Numbers Is the New Way to Be Smart". 前者和我的專(zhuān)業(yè)相關(guān),后者則是在贊美我的專(zhuān)業(yè),所以我本著自我肯定和自我欣賞的目的讀了這本書(shū) : P
      
      寫(xiě)到這里,有必要澄清,讀這本書(shū)絕對(duì)無(wú)需數(shù)學(xué)分析或高等數(shù)學(xué)的基礎(chǔ),不過(guò)你若是對(duì)隨機(jī)抽樣、統(tǒng)計(jì)回歸、置信區(qū)間、數(shù)據(jù)挖掘等概念稍有了解,則最好不過(guò)。如果這些名詞對(duì)你來(lái)說(shuō)完全陌生,你仍可以100%看懂這本書(shū),只是無(wú)法深入理解其應(yīng)用。
      
      這是一本很不錯(cuò)的Freakonomics以及The Long Tail的后續(xù)讀物,前兩本書(shū)指出了社會(huì)現(xiàn)象,而Super Crunchers則展示了其背后豐富的實(shí)際應(yīng)用,尤其是商業(yè)和公共政策方面的運(yùn)用,比如:
      
      如何計(jì)算出素未謀面的球員的價(jià)值?
      哪個(gè)學(xué)校的教育給學(xué)生的人生附加值最高?
      如何用數(shù)理統(tǒng)計(jì)方法找到最適合你的另一半?
      如何用數(shù)據(jù)輔助醫(yī)療決定,降低誤診率和死亡率?
      如何給自己的書(shū)起個(gè)最為“標(biāo)題黨”的名字,最大化點(diǎn)擊量?
      如何用一個(gè)簡(jiǎn)單公式精確預(yù)測(cè)尚未上市的葡萄酒多年后的市場(chǎng)價(jià)格?
      如何將有限的促銷(xiāo)資源分配給即將流失的優(yōu)質(zhì)客戶(hù)(而不是消費(fèi)最多的客戶(hù))?
      如何在賭客達(dá)到最大損失心理承受值之際,及時(shí)幫助其收手,維護(hù)顧客體驗(yàn)從而留住回頭客?
      
      這本書(shū)是漸入佳境式的,后一半更有閱讀價(jià)值 (關(guān)于Neural Network, Direct Instruction (DI) 和數(shù)據(jù)挖掘的廣泛社會(huì)影響的內(nèi)容),對(duì)統(tǒng)計(jì)應(yīng)用有一定了解的人可以直接從后一半讀起。
      
      國(guó)外網(wǎng)站上關(guān)于這本書(shū)的評(píng)論有點(diǎn)兩極分化,大眾讀者的評(píng)價(jià)較高,而專(zhuān)業(yè)人士則提出不少批評(píng),他們指出Ian Ayres的所謂大樣本數(shù)據(jù)挖掘遠(yuǎn)不夠?qū)I(yè),舉例時(shí)未說(shuō)明過(guò)去事件和未來(lái)事件的獨(dú)立性,以及回避了商業(yè)數(shù)據(jù)挖掘的倫理問(wèn)題等等等等。
      
      這些意見(jiàn)都有其道理,而且我認(rèn)為本書(shū)在統(tǒng)計(jì)應(yīng)用方面也算不上有多創(chuàng)新。但從另一個(gè)角度來(lái)看,這不過(guò)是一本兩百多頁(yè)的大眾讀物,目的在于介紹數(shù)據(jù)挖掘的實(shí)際應(yīng)用,講述商業(yè)故事,而非提供具體數(shù)理方法的專(zhuān)業(yè)著作,從這個(gè)角度來(lái)說(shuō),這本書(shū)不失為有趣易讀且富于啟發(fā)性。
      
      
      
      
      推薦閱讀人群:1)喜歡Freakonomics或The Long Tail的人 2)對(duì)數(shù)理統(tǒng)計(jì)的實(shí)際應(yīng)用感興趣者
      推薦擴(kuò)展閱讀:《The Numerati》 http://book.douban.com/subject/3218109/
      
      推薦反面觀點(diǎn):《Blink》 (這兩本書(shū)相當(dāng)于 Pro-intuition v.s. Anti-intuition)
      
      推薦擴(kuò)展游戲:www.20q.net (此游戲可看作Super Crunching的擴(kuò)展應(yīng)用)
      
      
      
      
      Interesting Quotes:
     ?。剑剑剑剑剑剑剑剑?br />   "William Osler must be turning over in his grave. You Googled the diagnosis? . . . Are we physicians no longer needed?”
     ?。orry, doctors, but it's time to face the inconvenient truth
      
      Some researchers have so comprehensively tortured the data that their datasets become like prisoners who will tell you anything you want to know.
     ?。aha, 這不就是我嘛!作為一個(gè)有明確目的的獄長(zhǎng),敝人的逼供哲學(xué)是:統(tǒng)計(jì)結(jié)果要為我的觀點(diǎn)服務(wù),與觀點(diǎn)一致的統(tǒng)計(jì)量被我技術(shù)性放大,與觀點(diǎn)沖突的數(shù)據(jù)被我"合理"去除。在學(xué)術(shù)上,我也許不是個(gè)好學(xué)生,但在工作上,我顯然是個(gè)模范員工 : P
      
      As a nation, we lack a vocabulary of dispersion.
      
      The future belongs to the super cruncher who can work back and forth and back again between his intuitions and numbers.
     ?。W髡叩腣ision
      
      Progress in medical science occurred one funeral at a time.
     ?。<词乖诮裉欤@仍是真理。
      
      "You can't Google dead trees."
      He meant that it was (then) impossible to search the text of books.
     ?。OL, I am still a tree book person.
  •     通勤途中讀的科普書(shū)。對(duì)應(yīng)的大致是「?jìng)€(gè)體計(jì)量」與「實(shí)驗(yàn)經(jīng)濟(jì)學(xué)」兩個(gè)領(lǐng)域。
      
      有一次我問(wèn)計(jì)量課老師,類(lèi)似《蘋(píng)果橘子經(jīng)濟(jì)學(xué)》那樣的個(gè)體計(jì)量研究,究竟在公共政策實(shí)務(wù)上有什麼應(yīng)用空間?
      
      尤其在臺(tái)灣,公共政策的品質(zhì)之糟糕是有目共睹的,各種施政根本不尋求嚴(yán)謹(jǐn)?shù)难芯恐С?,甚或發(fā)包的研究案擺明了就是要求為其施政背書(shū)宣傳。另一個(gè)重大的侷限則是資料的品質(zhì)。相較於美國(guó)和日本,臺(tái)灣的統(tǒng)計(jì)資料品質(zhì)實(shí)在不好,既有的許多資料在取得上也有各種奇怪限制,自然也大大侷限了此類(lèi)個(gè)體計(jì)量的研究空間。
      
      老師回答說(shuō),個(gè)體計(jì)量在臺(tái)灣的政策實(shí)務(wù)上確實(shí)沒(méi)什麼用,只是有啟發(fā)性的研究。不過(guò)他接著補(bǔ)充說(shuō),在企業(yè)界已經(jīng)有人開(kāi)始重視這種方法,分析企業(yè)手中所掌握的資訊,可以對(duì)企業(yè)產(chǎn)生直接助益。
      
      這本書(shū)就是這樣的應(yīng)用案例集。書(shū)中的案例五花八門(mén),例如(括號(hào)中為頁(yè)數(shù)):
      ? 以氣溫和雨量來(lái)預(yù)測(cè)紅酒的品質(zhì)(3);
      ? 球團(tuán)以球員過(guò)去表現(xiàn)的數(shù)據(jù)來(lái)預(yù)測(cè)其未來(lái)潛力(8);
      ? 交友網(wǎng)站以使用者人際關(guān)係基本資訊來(lái)篩選你理想的伴侶(23);
      ? 賭場(chǎng)從你過(guò)去的行為模式研究你的「痛苦臨界點(diǎn)」,當(dāng)你逼近臨界點(diǎn)時(shí)阻止你再賭下去(31);
      ? 1840年代奧地利的史模懷斯(Ignaz Semmelweis)透過(guò)統(tǒng)計(jì)分析找出孕婦大量死亡的原因是醫(yī)生離開(kāi)解剖室後沒(méi)把手洗乾淨(jìng)(80);
      ? 伯衛(wèi)克(Don Berwick)利用實(shí)證醫(yī)學(xué)研究推動(dòng)「拯救十萬(wàn)人活動(dòng)」,指出只要簡(jiǎn)單改變一些作法就可降低病患風(fēng)險(xiǎn),如將病床的頭部調(diào)高並經(jīng)常清潔患者口腔就可降低術(shù)後肺部感染風(fēng)險(xiǎn)(82);
      ? 伊莎貝爾(Isabel)軟體將各種疾病的特徵、醫(yī)學(xué)相關(guān)研究與病例病史等資訊整合為可快速檢索的資料庫(kù),協(xié)助醫(yī)生減少誤診率(94);
      ? 以過(guò)去採(cǎi)購(gòu)案的資料進(jìn)行統(tǒng)計(jì)分析,預(yù)測(cè)企業(yè)採(cǎi)購(gòu)案的交貨準(zhǔn)時(shí)度、預(yù)算符合度、採(cǎi)購(gòu)滿意度(108);
      ? 運(yùn)用神經(jīng)網(wǎng)路預(yù)測(cè)電影上映後的票房(140);
      ? 或者企業(yè)利用隨機(jī)試驗(yàn)(主要是網(wǎng)路)找出最佳行銷(xiāo)策略(第二章)。
      
      本書(shū)也提到一些與公共政策有關(guān)的實(shí)驗(yàn)研究案例:
      ? 強(qiáng)制提供求職輔助可幫助失業(yè)者提早找到工作減少失業(yè)津貼給付(64);
      ? 刑期長(zhǎng)短不影響再犯率(70);
      ? 國(guó)安單位分析電話通聯(lián)紀(jì)錄找出恐怖攻擊嫌犯;揪出工程投標(biāo)舞弊(42);
      ? 墨西哥政府的教養(yǎng)計(jì)畫(huà),將讓孩子上學(xué)、懷孕時(shí)接受產(chǎn)檢與營(yíng)養(yǎng)監(jiān)測(cè),作為現(xiàn)金補(bǔ)助的條件,且只有母親可拿到補(bǔ)助金(73);
      ? 預(yù)測(cè)法院法官判決結(jié)果(102);
      ? 預(yù)測(cè)受刑人再犯率(70、115);
      ? 評(píng)估何種教學(xué)方法比較有效(156)
      
      書(shū)中案例的研究方式大致可分為兩類(lèi),一是利用既有的資料進(jìn)行統(tǒng)計(jì)分析,另一種則是設(shè)計(jì)實(shí)驗(yàn)產(chǎn)生出新資料。
      
      ◎去技術(shù)化與階級(jí)問(wèn)題
      
      在這些令人眼花撩亂的案例之外,作者明確提出了「將舊的(依賴(lài)經(jīng)驗(yàn)的)白領(lǐng)專(zhuān)家去技術(shù)化」的議題。
      
      「去技術(shù)化」是社會(huì)學(xué)領(lǐng)域的勞動(dòng)過(guò)程研究的關(guān)鍵議題,也是歷史上許多工人運(yùn)動(dòng)的主題,但這裡不多談了,有興趣者請(qǐng)參考經(jīng)典著作:LABOR AND MONOPOLY CAPITAL by Harry Braverman。
      
      在本書(shū)中,矛頭針對(duì)的是那些依賴(lài)經(jīng)驗(yàn)的專(zhuān)家,這種專(zhuān)家一再被統(tǒng)計(jì)分析擊敗,十分狼狽。這些過(guò)去被認(rèn)為是白領(lǐng)專(zhuān)家的人,比如醫(yī)生,如今也可能面臨去技術(shù)化的衝擊。
      
      但稍有常識(shí)的人都知道,「受害」的絕對(duì)不只是這些人,還包括舊一代的技術(shù)人員、一般基層員工(本書(shū)中提到受到更精細(xì)管控的Wallmart員工,但作者覺(jué)得這沒(méi)什麼不對(duì))。而在企業(yè)外部,受害的或許在某種程度上也包括要面對(duì)更加高明的行銷(xiāo)手段的消費(fèi)者、個(gè)人資料更加沒(méi)有隱蔽的一般公民等。
      
      去技術(shù)化當(dāng)然不是指技術(shù)水平的簡(jiǎn)單降低。就整體技術(shù)水平來(lái)說(shuō),很難論證新科技的引進(jìn)造成技術(shù)的降低,首先,技術(shù)高低很難有一致的衡量標(biāo)準(zhǔn),再者,新技術(shù)也許確實(shí)會(huì)將某些工作去技術(shù)化,但也會(huì)產(chǎn)生另一些技術(shù)性工作。
      
      去技術(shù)化爭(zhēng)論的關(guān)鍵在於,被去技術(shù)化的,與掌握新技術(shù)的,是不同群體,時(shí)間與空間上都是分開(kāi)的,於是便出現(xiàn)了很明顯的一群受害者與受益者。在現(xiàn)行的資本主義制度之下,資方總是千方百計(jì)要將基層勞工去技術(shù)化,以方便控制、壓低工資,將技術(shù)集中在高級(jí)管理人員與技術(shù)專(zhuān)家手中。在這種「技術(shù)進(jìn)步」的模式中,這些受害者很難得到補(bǔ)償,也很不容易轉(zhuǎn)移到其他工作而不至降低報(bào)酬。也就是說(shuō),看似中性的技術(shù)進(jìn)步在現(xiàn)行的社會(huì)制度下一點(diǎn)都不中性,反而具有很明確的階級(jí)敵視意涵,即便這些技術(shù)人員可能並不具任何「惡意」。
      
      當(dāng)然,他們也可能具有惡意。操作技術(shù)的始終是具體的從屬於某些權(quán)力關(guān)係之中的人,高明的人還是有辦法用新的辦法玩弄統(tǒng)計(jì)。比如書(shū)中提到的利用統(tǒng)計(jì)分析設(shè)定有利於特定種族的條件(173)。也就是說(shuō),儘管作者努力把統(tǒng)計(jì)分析描述成無(wú)偏見(jiàn)、可信賴(lài)的科學(xué)力量,但其實(shí)統(tǒng)計(jì)本身也有很多不同的設(shè)計(jì)方法,生產(chǎn)出你想要的結(jié)果,用以包裹各種意圖。在此方面,我們看到的可能比較不是統(tǒng)計(jì)專(zhuān)家與非專(zhuān)家的對(duì)立,而是不同立場(chǎng)的統(tǒng)計(jì)專(zhuān)家的對(duì)立。
      
      ◎次貸風(fēng)暴也算是其應(yīng)用的後果吧
      
      以上所談大致還是學(xué)術(shù)研究、以及簡(jiǎn)單的預(yù)測(cè)應(yīng)用,在作者筆下基本上十分光明、成功。但現(xiàn)實(shí)世界當(dāng)然沒(méi)有這麼單純美好,將統(tǒng)計(jì)新技術(shù)玩到極端玩到爛,最終導(dǎo)致災(zāi)難的例子還不算少。作者書(shū)中曾簡(jiǎn)略地提到銀行核貸人員的經(jīng)驗(yàn)與知識(shí)被統(tǒng)計(jì)取代的例子,但他沒(méi)有繼續(xù)往下說(shuō)的是,這種作法幫助了房地產(chǎn)市場(chǎng)以及金融市場(chǎng)泡沫的擴(kuò)大,以及隨著泡沫破裂而來(lái)臨的全球金融危機(jī)。這方面已經(jīng)有很多人提過(guò)了,這裡不再重複,轉(zhuǎn)貼一篇文章供參考:
      
      
       【信報(bào)財(cái)經(jīng)新聞】 2009年3月6日
       濫用中國(guó)學(xué)者公式引致金融海嘯
       林行止
      
       一、
      
       三十年代華爾街大崩潰後,投資理論並無(wú)重大進(jìn)展,它之出現(xiàn)突破,為一 九五二年的事;是年三月號(hào)(第七卷第一期)的《財(cái)務(wù)學(xué)學(xué)報(bào)》(Journal of Finance),發(fā)表哈利.馬可維茨(Harry M. Markowitz, 1922-)的論文〈投資組合選擇〉(Portfolio Selection),引起投資理論的革命;馬可維茨的文章,被投資學(xué)界稱(chēng)為「十四頁(yè)最重要的論文」─這篇論文只有十四頁(yè),四頁(yè)文字其餘皆為程式和圖表。
      
       包 括馬可維茨在內(nèi),誰(shuí)都沒(méi)有料到這篇短文會(huì)造成「革命性影響」。因?yàn)檫@篇被稱(chēng)為不朽的文章(monumental article),當(dāng)年只有二十五歲的作者不會(huì)想到三十八年後的一九九○年,他因此和其他二位學(xué)者米勒(Merton Miller, 1923-2000)與夏普(W. Sharpe, 1934-)分享諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)!
      
       馬可維茨知道投資者對(duì)回報(bào)和風(fēng)險(xiǎn)同樣關(guān)注,這是何以 投資者通?!覆粫?huì)把雞蛋放在同一籃裏」的原因。風(fēng)險(xiǎn)和報(bào)酬率(Risk & Reward Ratio)便是這樣發(fā)展出來(lái)的。馬可維茨的真知灼見(jiàn)是,風(fēng)險(xiǎn)為整個(gè)投資過(guò)程的重心,一項(xiàng)投資計(jì)劃若沒(méi)有風(fēng)險(xiǎn)(riskless),困難將不存在,但利潤(rùn) 亦相應(yīng)低微。風(fēng)險(xiǎn)意味著可能發(fā)生的事較預(yù)期發(fā)生的更多!我們並不期待居住的樓宇火災(zāi),但火災(zāi)可能發(fā)生,為了避免這種可能損失,只有買(mǎi)保險(xiǎn);同理,我們不希 望所持的股票跌價(jià),然而它們可能下跌,因此我們不把所有資金購(gòu)進(jìn)一種股票,即使它看起來(lái)前景那麼美好。
      
       分散投資(把雞蛋放在多個(gè)籃裏)和看中後重錘出擊(雞蛋少籃子亦少)孰優(yōu)孰劣,是馬可維茨試圖解答的問(wèn)題?!赐顿Y組合選擇〉告訴投資者如何在風(fēng)險(xiǎn)與報(bào)酬之間作正確的取捨(trade-off),即如何建立一個(gè)風(fēng)險(xiǎn)與報(bào)酬平衡的投資組合。
      
       非常明顯,「提供最高回報(bào)的有效率投資組合」,在七十年代風(fēng)起雲(yún)湧,投資基金的成立如雨後春筍,帶旺了華爾街進(jìn)而全球的金融業(yè),令基金市場(chǎng)成為以萬(wàn)億美元計(jì)的大生意,它便是建立在馬可維茨組合投資理論基礎(chǔ)上。一篇短文帶起一個(gè)行業(yè),馬可維茨因此得以分享諾獎(jiǎng)。
      
       二、
      
       南 開(kāi)大學(xué)經(jīng)濟(jì)學(xué)碩士、加拿大滑鐵盧大學(xué)統(tǒng)計(jì)學(xué)博士李祥林(Xiang Lin Li,江蘇連雲(yún)港人;以David X Li之名行世),在二○○○年三月號(hào)的《固定收入學(xué)報(bào)》(The Journal of Fixed Income)發(fā)表〈聯(lián)結(jié)函數(shù)的違約相關(guān)分析〉(On Default Correlation: A Copula Function Approach)?!嘎?lián)結(jié)」和「相關(guān)」均為統(tǒng)計(jì)學(xué)名詞,用大眾化語(yǔ)言,可作這樣的解釋─夫妻日夕相處,生活習(xí)慣漸漸相近,其中一人過(guò)世,另一半在短期內(nèi) 的平均死亡率較夫妻健在者高;這種關(guān)係換為統(tǒng)計(jì)術(shù)語(yǔ)便是「聯(lián)結(jié)」和「相關(guān)」的關(guān)係。李祥林把之引入金融分析,指出一間發(fā)行債券的公司倒閉,對(duì)另外一間甚至 多間相關(guān)企業(yè)必然帶來(lái)衝擊。李祥林的計(jì)量模型提出一項(xiàng)創(chuàng)新的觀點(diǎn)「time-until-default」(直至違約〔?〕),描述在一定經(jīng)濟(jì)環(huán)境下,公 司倒閉的相關(guān)聯(lián)結(jié)性。
      
       李祥林的研究,刺激了信貸衍生債券市場(chǎng)的高速發(fā)展,其勢(shì)有人稱(chēng)為「爆炸性」,帶動(dòng)一種新興衍生金融工具「信貸違約掉期」(CDS, Credit Default Swaps)。從此角度,李祥林對(duì)金融業(yè)的貢獻(xiàn)不下於馬可維茨。
      
       在 傳統(tǒng)市場(chǎng),投資者購(gòu)進(jìn)債券,獲得固定孳息,同時(shí)承受債券發(fā)行企業(yè)或政府可能破產(chǎn)無(wú)力付息及屆時(shí)無(wú)力贖回即違效的風(fēng)險(xiǎn),CDS等於把債券持有者的風(fēng)險(xiǎn)賣(mài)掉; 由於債市數(shù)額以萬(wàn)億美元計(jì),擔(dān)保債券不會(huì)違約的CDS幾乎是無(wú)限制地發(fā)行。李祥林適時(shí)地提出一個(gè)模型,幫助CDS的投資者在特定情況下能準(zhǔn)確計(jì)算回報(bào)、定 價(jià)、計(jì)算風(fēng)險(xiǎn)及應(yīng)採(cǎi)取什麼策略以降低風(fēng)險(xiǎn),等於為結(jié)構(gòu)化的信貸衍生產(chǎn)品的估價(jià)和風(fēng)險(xiǎn)控制提供定量化的有效工具,有了這套準(zhǔn)則,CDS發(fā)行及成交大增;而把 不同種類(lèi)的CDS滙集而成的「?jìng)鶆?wù)抵押債券」(CDO-Collateralized Debt Obligations)應(yīng)運(yùn)而生,金融機(jī)構(gòu)把CDO以債券形式賣(mài)給散戶(hù)(下游投資者),那等於把風(fēng)險(xiǎn)以傳統(tǒng)最穩(wěn)健的債券形式賣(mài)給小投資者。在風(fēng)調(diào)雨順的 日子,CDO持有者可獲比債券孳息高的利息,是不錯(cuò)的投資,一旦形勢(shì)逆轉(zhuǎn),CDS的「現(xiàn)金回報(bào)」驟降,市場(chǎng)風(fēng)雲(yún)變色,投資者全軍覆沒(méi),金融海嘯由是而起!
      
       二 月二十五日《Wired》月刊發(fā)表名記者沙爾蒙(F. Salmon)題為〈災(zāi)難的處方─摧毀華爾街的公式〉(Recipe for Disaster-The Formula That Killed Wall Stree),歐美傳媒紛紛轉(zhuǎn)載,網(wǎng)上且有令人愈讀愈糊塗的中譯本。文章指出在不久前,因?yàn)閹鹨粋€(gè)新行業(yè)令金融市場(chǎng)狂旺的李祥林,是諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的熱 門(mén)人選;可是,自從○八年三月次按問(wèn)題浮現(xiàn)以至七、八月間的危機(jī)驟起,李祥林公式成為令華爾街步入絕境的禍?zhǔn)?!這種說(shuō)法當(dāng)然非常偏頗,那便如武器殺人但殺 人者非其發(fā)明者。財(cái)迷心竅、貪婪無(wú)厭和不負(fù)責(zé)任的華爾街炒家利用所僱用的「火箭專(zhuān)家」讀通李氏公式後(李氏○五年曾對(duì)《華爾街日?qǐng)?bào)》記者說(shuō)了解其公式的人 不多),濫發(fā)CDO,才是造成金融海嘯的罪魁。
      
       歷任歐美金融機(jī)構(gòu)要職的李祥林,○八年做了海歸派,擔(dān)任中國(guó)國(guó)際金融的風(fēng)險(xiǎn)管理部門(mén)主管。
  •     賭場(chǎng)老板會(huì)關(guān)心你的財(cái)政狀況與輸贏,及時(shí)勸阻你在走霉運(yùn)時(shí)繼續(xù)孤注一擲;你可以在醇酒剛釀制時(shí)就預(yù)測(cè)品質(zhì),及早買(mǎi)下奇貨可居,而不必再等待10年花費(fèi)巨額金錢(qián)拍下“絕世佳釀”;真命天子,很可能就在你鼠標(biāo)的數(shù)次點(diǎn)擊下,再不必?fù)?dān)心茫茫人海無(wú)緣相逢;同樣一件商品,你也許要付出別人兩倍的價(jià)錢(qián),因?yàn)槿说牟顒e而非商品的差別;航空公司重新定位常旅客,不再獎(jiǎng)勵(lì)飛行里程最多的乘客轉(zhuǎn)而獎(jiǎng)勵(lì)讓公司盈利最多的乘客;通過(guò)神奇數(shù)字,你可以發(fā)現(xiàn)競(jìng)標(biāo)中的欺詐行為;雇主在面試時(shí)就可以分辨誰(shuí)將會(huì)是適應(yīng)本企業(yè)文化的忠心耿耿的好雇員;企業(yè)在迅捷反饋消費(fèi)者需求時(shí)又能做到零庫(kù)存以節(jié)省成本;不相信?Well, 歡迎來(lái)到Super Crunchers的美麗新世界。
      
      科技的迅捷發(fā)展(Moore's Law & Kryder's Law所揭示的計(jì)算機(jī)性能與硬盤(pán)存儲(chǔ)空間的發(fā)展趨勢(shì))、龐大的數(shù)據(jù)庫(kù)(Terabyte、Petabyte數(shù)量級(jí))、智能的搜索引擎,使年逾百歲的統(tǒng)計(jì)數(shù)學(xué)工具(Regression、Randomized Trials)青春煥發(fā),朝氣蓬勃得向這一愿景奔去。書(shū)中,Ian Ayers列舉了很多有趣的故事來(lái)說(shuō)明Super Crunchers如何用數(shù)字說(shuō)話,從海量數(shù)據(jù)中挖掘看似毫不相關(guān)的事物之間的內(nèi)在聯(lián)系和因果關(guān)系,發(fā)現(xiàn)隱藏的規(guī)律,預(yù)測(cè)未來(lái)。耐人尋味的是,在與 super crunchers的同臺(tái)競(jìng)技中,依賴(lài)于經(jīng)驗(yàn)和直覺(jué)的傳統(tǒng)專(zhuān)家屢戰(zhàn)屢敗,預(yù)測(cè)未來(lái)的精準(zhǔn)度常常略輸一籌。Ian一度想以“The End of Intuition"命名此書(shū),也是因?yàn)樵谠絹?lái)越多的領(lǐng)域的較量中,經(jīng)驗(yàn)法則和直覺(jué)正節(jié)節(jié)敗退給數(shù)字分析這個(gè)事實(shí)。但在其后的章節(jié),他也指出,數(shù)據(jù)決策方法的興起并不代表直覺(jué)的末日,它們是相輔相成的互助關(guān)系,因?yàn)槊翡J的直覺(jué)能夠指引我們?nèi)グl(fā)現(xiàn)問(wèn)題、提出問(wèn)題,而數(shù)據(jù)挖掘則能夠分析問(wèn)題、檢驗(yàn)直覺(jué)。
      
      不可否認(rèn),Super Crunchers在犯罪學(xué)、教育學(xué)、醫(yī)學(xué)、經(jīng)濟(jì)學(xué)、政治學(xué)等各領(lǐng)域攻城掠地,在力圖改變以往決策模式的同時(shí),也掀起權(quán)力更迭的大潮。他們的崛起威脅到很多傳統(tǒng)職業(yè)的權(quán)力、地位,以及受尊重程度,既得利益者對(duì)其的否定和抵觸自然不難理解。此外,除了人們因循守舊的慣性,數(shù)字化進(jìn)程對(duì)公民隱私權(quán)的侵蝕也是抵觸和恐慌情緒蔓延的重要源頭之一——你的一切數(shù)據(jù)、信息盡在掌握中,有人比你更了解你自己的行為、意識(shí)甚至潛意識(shí)。不過(guò),人類(lèi)發(fā)展史也一再揭示了“順我者昌,逆我者亡”這一規(guī)律,未來(lái),屬于那些能夠在直覺(jué)和數(shù)據(jù)之間游走自如的super crunchers,因?yàn)樗麄儽葌鹘y(tǒng)專(zhuān)家和電腦都看得更遠(yuǎn)、更準(zhǔn)。你要做的,是克服對(duì)數(shù)字、公式的望而生畏,努力掌握基本的統(tǒng)計(jì)數(shù)學(xué)概念和工具,改變自己的思維、決策方式,做一個(gè)站在浪尖風(fēng)口的弄潮兒,而不是被潮流吞噬的溺水者。
      
      闔上書(shū)本的最后一頁(yè),我腦中不禁浮現(xiàn)狄更斯廣為流傳的一段話 “It was the best of times, it was the worst of times; It was the age of wisdom, it was the age of foolishness; It was the epoch of belief, it was the epoch of incredulity; It was the season of Light, it was the season of Darkness; It was the spring of hope, it was the winter of despair; We had everything before us, we had nothing before us; We were all going direct to heaven, we were all going direct the other way”...
      
      Some useful concepts in the book:
      
      Super crunching is statistical analysis that impact real-world decision. Super Crunching predicitions usually bring together the combination of data, speed and scale.
       * the big size of dataset, both in number of observations and variables.
       * the increasing speed of analysis.
       * the huge scale of impact
      
      Collaborative filters are examples of "the wisdom of crowds":
       * the collective predictions are more accurate than the best estimate that any member of the group could achieve.
       * a kind of tailored audience polling.
       * preference database are powerful ways to improve personal decision making.
      
      But, there is also a social cost to exploiting the long tail:
       * the more successful these personalized filters are, the more we as a citizen are deprived of a common expereience
       * expose citizens only to information that fits with their narrowly preconceived preferences.
      
      The core of super crunching techniques:
       1. Regression:
       * a statistical procedure that takes raw historical data and estimates how various causal factors influence a single variable of interest.
       * not only make predictions but also are able to simultaneously tell you how precise the prediction is.
       2. Randomized trials:
       * having a computer flip a coin and treating prospects who come up head differently that the ones who come up tails.
       * the sample size is the key: after randomization makes the two groups identical on every other dimension, we can be confident that any change in the two groups' outcome was caused by their different treatment. -- treatment effect.
       * the process of randomization creates matched distribution.
       3. Neural Network:
       * computer can be programmed to update their reponse based on new or different information.
       * neural network is a series of interconnected switches that receive, evaluate and transmit information. Each switch is a mathematical equation that takes and weighs multiple types of input information.
      
      Regression versus Randomized trials:
       * Regression lets the researcher sit back and decide what to test after the fact.
       * Randomized trials require to hypothesize in advance before the test starts.
       * Regression are used for identify the target group.
       * Randomized trials are used for test the impact of one specific treatment.
      
      Regression versus Neural Network:
       * Regression need to be specified the specific form of the equation in advance.
       * Neural Network let the data pick out the best functional form from massively interconnected set of equations.
       * Compared to plain-old regression analysis, neural network is more flexible and nuanced.
       * The subtle interplay of its weighting schemes in neural network leads to the biggest drawback of neural network: it can't identify which single factor will impact on the prediction result and how it will impact; it can't tell the confidence intervals of its prediction.
       * The overfitting problem in neural network may hinder the predicting capability.
  •     Super Crunchers 這本書(shū)向我們展現(xiàn)了現(xiàn)代人,或者說(shuō)現(xiàn)代的西方學(xué)者,是怎么研究社會(huì)科學(xué)的。在我國(guó),常常是很多人因?yàn)楦械綌?shù)學(xué)不好學(xué)而去學(xué)社會(huì)科學(xué),比如說(shuō)去學(xué)法律。這樣自然選擇的結(jié)果是產(chǎn)生了一大批像李銀河這樣感情充沛而不切實(shí)際的所謂學(xué)者。然而現(xiàn)在最領(lǐng)先的西方學(xué)者已經(jīng)拋棄了過(guò)去那一套抱著悲天憫人的心態(tài)空談理論的研究方法。如果你去讀他們的論文,你會(huì)發(fā)現(xiàn)其中到處都是圖表和數(shù)學(xué)公式;如果你去觀察他們的工作,你會(huì)發(fā)現(xiàn)他們大部分時(shí)間不是在寫(xiě)字,而是在編程。
      
      法律領(lǐng)域內(nèi)有一個(gè)非常經(jīng)典的問(wèn)題:給犯罪分子更長(zhǎng)的刑期,是否會(huì)增強(qiáng)對(duì)他的改造,從而減少其出獄后的再犯罪率?在以往,人們可能會(huì)從倫理,道德,心理學(xué)的角度去分析這個(gè)問(wèn)題。有的人可能會(huì)舉出各種例子來(lái)證明他的論點(diǎn),然而這些例子往往是非常極端而沒(méi)有代表性的。這個(gè)問(wèn)題直到最近才得到一個(gè)有說(shuō)服力的答案。
      
      耶魯大學(xué)的Berube 和 Green 的研究完全基于數(shù)學(xué)統(tǒng)計(jì)。聯(lián)邦法院總是隨機(jī)的往不同的轄區(qū)派法官。有些法官傾向于重判,給長(zhǎng)刑期;有些法官傾向于輕判,而隨機(jī)過(guò)程決定了每個(gè)法官傾向于總體面對(duì)類(lèi)似的案件。這樣一來(lái),可能完全相同的犯罪事實(shí),有的犯罪分子比較幸運(yùn)就獲得了較短的刑期,而不幸的就會(huì)刑期較長(zhǎng)。作者通過(guò)對(duì)一萬(wàn)多名犯罪分子記錄的統(tǒng)計(jì)分析,結(jié)論是,刑期長(zhǎng)短與再犯罪率無(wú)關(guān)。如果沒(méi)有這樣的統(tǒng)計(jì)數(shù)據(jù),如果沒(méi)有法官的隨機(jī)指定,像這樣的問(wèn)題可能永遠(yuǎn)都無(wú)法解決。
      
      統(tǒng)計(jì)是一個(gè)非常強(qiáng)大的研究社會(huì)問(wèn)題的手段。NCAA籃球中有沒(méi)有球隊(duì)參與賭球?拉斯維加斯的一個(gè)賭博項(xiàng)目是每場(chǎng)比賽的勝負(fù)分差(Point Spread),也就是我們所常說(shuō)的讓多少球。比如賓夕法尼亞大學(xué)對(duì)哈佛大學(xué),賭場(chǎng)開(kāi)出的分差是14.5分,也就是說(shuō)如果你押賓大,他們必須贏至少15分你才能賭贏。如果你考察每場(chǎng)比賽的實(shí)際分差,和賭場(chǎng)事先開(kāi)出來(lái)的比賽分差,其相差值幾乎完美地符合正態(tài)分布(平均值是0)。這樣一來(lái),正好有50%的時(shí)候,勝者實(shí)際贏了對(duì)手多少分比賭場(chǎng)預(yù)測(cè)值高,50%的時(shí)候比預(yù)測(cè)值低。也就是說(shuō)賭博的賠率幾乎是50%。這種50%概率正是賭場(chǎng)最喜歡的賭贏概率。
      
      然而問(wèn)題是,如果你考察那些勝負(fù)分差超過(guò)12分的場(chǎng)次,那么其分布就不是完美的正態(tài)分布了:有53%的機(jī)會(huì),勝隊(duì)實(shí)際取勝分差會(huì)比預(yù)測(cè)值低。為什么會(huì)出現(xiàn)這種情況?賓大學(xué)者 WOLFERS 猜測(cè),當(dāng)穩(wěn)操勝券的時(shí)候,勝隊(duì)會(huì)故意放水一點(diǎn),去操縱比賽分差來(lái)影響賭局(術(shù)語(yǔ)叫做 Shave Points)。也就是說(shuō)使用統(tǒng)計(jì)方法,你甚至不需要任何直接的證據(jù)就能發(fā)現(xiàn)有人參與賭博。
      
      類(lèi)似的手段可以應(yīng)用幾乎任何社會(huì)領(lǐng)域。比如說(shuō)婚姻問(wèn)題。傳統(tǒng)的婚姻問(wèn)題專(zhuān)家判斷一對(duì)夫婦是否會(huì)離婚,成功率只有53%,只比瞎蒙高一點(diǎn)。而最新的方法,聽(tīng)一對(duì)夫婦之間的交談15分鐘,專(zhuān)家就有能以95%的準(zhǔn)確率判斷他們未來(lái)15年內(nèi)會(huì)不會(huì)離婚。其所使用的方法,是給這15分鐘的交談錄像,然后幾個(gè)人坐下來(lái)看錄像,一個(gè)畫(huà)面一個(gè)畫(huà)面的分析其中人物的細(xì)微表情和語(yǔ)言,然后把統(tǒng)計(jì)結(jié)果輸入一個(gè)事先做好的復(fù)雜方程之中,這個(gè)方程會(huì)告訴你該夫婦離婚的可能性。這個(gè)方程是怎么設(shè)計(jì)出來(lái)的呢?用大量的數(shù)據(jù)回歸出來(lái)的。
      
      統(tǒng)計(jì)方法能夠大行其道的根本原因是現(xiàn)在網(wǎng)路和計(jì)算機(jī)技術(shù)的提高,特別是便宜的海量存儲(chǔ)給大量的數(shù)據(jù)分析提供了可能性?,F(xiàn)在指導(dǎo)社會(huì)科學(xué)的先進(jìn)文化是理工科思維,先進(jìn)生產(chǎn)力是統(tǒng)計(jì)模型,計(jì)算機(jī)和海量的數(shù)據(jù)。
      
      這種通過(guò)分析海量數(shù)據(jù)來(lái)預(yù)測(cè)和理解社會(huì)問(wèn)題的方法被人稱(chēng)為 number crunching,現(xiàn)在甚至已經(jīng)有了專(zhuān)業(yè)的公司專(zhuān)門(mén)為商業(yè)公司干這個(gè)事情來(lái)預(yù)測(cè)顧客行為。這樣做的一個(gè)結(jié)果是商家可能比你自己更了解你。比如你從 Blockbuster 租了一盤(pán) DVD,Blockbuster 可能比你更了解你不按時(shí)歸還的概率。
      
      一個(gè)典型的專(zhuān)業(yè)公司是 Teradata。它為65%的世界頂級(jí)零售商,70% 的航空公司,和40%的銀行服務(wù)。他們的一個(gè)典型業(yè)務(wù)是判斷哪些老顧客可能會(huì)因?yàn)橐淮尾挥淇斓姆?wù)經(jīng)歷而離開(kāi)你們公司。Continental Airlines 就專(zhuān)門(mén)有人做這個(gè)。比如一次航班誤點(diǎn)或者行李丟失事件發(fā)生之后,如果統(tǒng)計(jì)分析系統(tǒng)判斷某個(gè)長(zhǎng)期顧客有可能要因此從此不飛 Continental 了,這位客戶(hù)就會(huì)得到特別好的照顧。
      
      甚至賭場(chǎng)也這么做。每一個(gè)顧客入場(chǎng)玩都刷卡。他們根據(jù)每一個(gè)顧客的收入,年齡,以往賭博記錄,居住地等等計(jì)算該顧客的 pain point - 也就是此人一晚上最多輸多少錢(qián)下次還能來(lái)玩。一旦發(fā)現(xiàn)某位顧客今晚輸?shù)腻X(qián)已經(jīng)接近 pain point 了,就會(huì)立即派服務(wù)員過(guò)去邀請(qǐng)他免費(fèi)吃頓牛排停止賭博。
      
      這件事情的最可怕前景是,商家將會(huì)可以根據(jù)顧客不同的價(jià)格承受能力,給每個(gè)顧客一個(gè)不同的價(jià)格。
      
      傳統(tǒng)的社會(huì)專(zhuān)家靠直覺(jué),甚至是個(gè)人感情好惡來(lái)做研究,而未來(lái)屬于數(shù)字。但我國(guó)在這方面可以說(shuō)是相當(dāng)落后。我國(guó)"主流經(jīng)濟(jì)學(xué)家"經(jīng)常鄙視那些玩數(shù)學(xué)模型的海歸,人們不習(xí)慣用數(shù)字說(shuō)話。
      
      更不利的一點(diǎn)是,我們可能根本就沒(méi)有數(shù)字可以用。我國(guó)的統(tǒng)計(jì)水平可以說(shuō)是極差,一個(gè)最基本的GDP數(shù)字居然都能隨便變來(lái)變?nèi)?。在這種情況下你怎么才能很好的做出決策?我們看NBA比賽,無(wú)不贊嘆美國(guó)人對(duì)數(shù)字統(tǒng)計(jì)的熱衷:這是他的這個(gè)賽季的第幾個(gè)兩雙,如果他兩雙了球隊(duì)獲勝的概率是多少,等等等等。量化思維必須被培養(yǎng)成一種習(xí)慣。從這個(gè)角度講,"吉尼斯世界紀(jì)錄"的最大貢獻(xiàn)可能是培養(yǎng)了人們尊重?cái)?shù)字的習(xí)慣。
      
      沒(méi)有數(shù)字就沒(méi)有真像。
      
      本書(shū)作者作者是耶魯法學(xué)院的教授,此人擅長(zhǎng)用計(jì)算機(jī)做統(tǒng)計(jì)研究。
      
  •     昨晚,終于把《超級(jí)數(shù)字天才》看完,看到很晚。
      
      大概讀了一個(gè)星期的時(shí)間,讀的過(guò)程中,一直覺(jué)得這是一本很枯燥,很羅嗦的,挺難懂的書(shū)。
      
      不過(guò)昨天晚上看的時(shí)候,最后一章----講的是超級(jí)數(shù)字天才和經(jīng)驗(yàn)直覺(jué)之間的互補(bǔ),互相彌補(bǔ)----充分地展示數(shù)學(xué)或者說(shuō)數(shù)字在現(xiàn)實(shí)中的應(yīng)用,更具體點(diǎn)是概率統(tǒng)計(jì)在生活中的應(yīng)用。讓我對(duì)這本書(shū)有了新的認(rèn)識(shí)。
      
      我本來(lái)就是喜歡數(shù)學(xué)的美以及數(shù)學(xué)的萬(wàn)能,后來(lái)因?yàn)榇髮W(xué)四年枯燥的數(shù)學(xué)理論學(xué)習(xí),讓我對(duì)數(shù)學(xué)失去了興趣。
      
      可是這一次,這本書(shū)又再次燃起了我對(duì)數(shù)學(xué)的高度熱情。
      
      
      看完最后一章,我又有了去重新學(xué)習(xí)數(shù)學(xué)分析,高等代數(shù),概率統(tǒng)計(jì)等等的沖動(dòng)。
      
      只是再仔細(xì)一想,這是一個(gè)怎么樣的時(shí)期,數(shù)學(xué)的確在我們的生活中扮演中絕對(duì)重要的作用,正是因?yàn)槟切?shù)字,以及處理那些數(shù)字的方法,才讓我們更加了解自然規(guī)律,讓世界上的少數(shù)人賺取了很多很多的錢(qián)。
      但是有一點(diǎn)需要知道,全心研究數(shù)學(xué)的數(shù)學(xué)家,他們物質(zhì)上不富有,他們的工作成功被別人利用,讓利用數(shù)學(xué)的人,享受著這個(gè)世界。
      
      我很想做一個(gè)數(shù)學(xué)家,很想做一個(gè)能夠給世界帶來(lái)變革的數(shù)學(xué)家。但是我已經(jīng)落后了很多時(shí)間,已經(jīng)不能有什么成就。何況現(xiàn)在的矛頭是要對(duì)準(zhǔn)物質(zhì)。
      
      也許我會(huì)在以后,足夠的經(jīng)濟(jì)自由以后傾注我的精力在數(shù)學(xué)上,傾注在數(shù)學(xué)美上。
      
      不過(guò),并不是現(xiàn)在就能無(wú)視數(shù)學(xué),正如《超級(jí)數(shù)字天才》所說(shuō),我們只要用一些數(shù)學(xué)的公式概念,數(shù)學(xué)的理念,就能給我們的生活帶來(lái)很多驚喜,能夠讓我們對(duì)未來(lái)更有把握。
  •     這本書(shū)相當(dāng)大程度的沖擊了我的觀念,現(xiàn)在的超級(jí)數(shù)字天才們已經(jīng)可以做到了讓我難以想象的地步了,可以預(yù)測(cè)選舉結(jié)果,可以預(yù)測(cè)法官判定結(jié)果,可以預(yù)測(cè)采購(gòu)結(jié)果,等等這些。
      我現(xiàn)在唯一有些想法的就是,是不是也可以預(yù)測(cè)金融市場(chǎng)呢?不過(guò)估計(jì)是不行的。
      但是至少有一點(diǎn)可以肯定,那就是未來(lái)肯定是數(shù)字運(yùn)算的天下,不懂這個(gè),一定會(huì)吃虧的。
  •     作者是stevn levitt的朋友,也是好幾本書(shū)的共同作者. 這本身和freakeconomic比起來(lái),深入的講到了(1)統(tǒng)計(jì)的方法(2)對(duì)社會(huì)的影響.如果你知道regression test , randomized test 和 neural network的話, 會(huì)有幫助理解那些分析的背景.
      
      這本書(shū)也提供了很有趣的故事. 比如用regression來(lái)預(yù)測(cè)波爾多紅酒的質(zhì)量.但是更重要的是作者提出了一些我們要將來(lái)思考的問(wèn)題 - data driven decision making能不能代替人們的經(jīng)驗(yàn)和直覺(jué). 如果可以的話, 那些受到尊重的職業(yè)是不是要敗落? 比如醫(yī)生,貸款審批人員.
      
      這本書(shū)對(duì)我來(lái)說(shuō),開(kāi)闊了我的視野.很多沒(méi)有想到的東西原來(lái)都是可以用數(shù)據(jù)分析來(lái)達(dá)到更好的效果的. 使我開(kāi)始用一種思考的方法來(lái)看待一些日常的生活,同時(shí)也幫助我重新思考工作的一些的改進(jìn)怎么用數(shù)據(jù)來(lái)作為基礎(chǔ).
      
      
  •   有一定水準(zhǔn)
    不過(guò)
    說(shuō)話客氣一些也是可以寫(xiě)出深刻、風(fēng)趣的文章的
    陳景潤(rùn)以及
    那些白首皓經(jīng)的老人家
    比如季羨林
    還是值得敬仰的
  •   少數(shù)派報(bào)告即將降臨。
  •   對(duì)未來(lái)圖景的暢想有意思,應(yīng)該再發(fā)揮一下。
  •   當(dāng)當(dāng)也是推薦這兩本
  •   Wow, numbers are really beyond me.
  •   “你要做的,是克服對(duì)數(shù)字、公式的望而生畏,努力掌握基本的統(tǒng)計(jì)數(shù)學(xué)概念和工具,改變自己的思維、決策方式,做一個(gè)站在浪尖風(fēng)口的弄潮兒,而不是被潮流吞噬的溺水者。 ”
    風(fēng)口浪尖我不站,我追著它,呵呵
  •   因?yàn)檫€要掉頭跑
  •   沒(méi)有數(shù)字就沒(méi)有真相
  •   社會(huì)學(xué)的統(tǒng)計(jì)傾向往往給人一種科學(xué)的錯(cuò)覺(jué),實(shí)際上很多內(nèi)容是無(wú)法用數(shù)字進(jìn)行描述和量化的,而可進(jìn)行量化的部分往往很難涉及到事物的基本運(yùn)行程序,導(dǎo)致了定量研究的重大局限。而不顧這種局限進(jìn)行研究,比如我印象看到過(guò)類(lèi)似用定量方法做什么愛(ài)情研究的,就會(huì)陷入到一種難以前行的尷尬處境。
    而如果社會(huì)學(xué)僅僅滿足于數(shù)理表面上的相關(guān),而不去研究人類(lèi)行為的內(nèi)在模式便使得這門(mén)學(xué)問(wèn)如同初中應(yīng)用題般索然無(wú)味。
    但幾乎所有的社會(huì)學(xué)理論又都無(wú)法避免過(guò)多的經(jīng)驗(yàn)和主觀意愿的介入,使得理論的可檢驗(yàn)性極低,且與所追求的科學(xué)有部分相背。也使得這門(mén)學(xué)科因長(zhǎng)久的糾結(jié)于其中而走向落寞。
    所以,關(guān)于如何研究社會(huì),在我看來(lái),只要去揭示事實(shí)便可以了。
  •   "結(jié)論是,刑期長(zhǎng)短與再犯罪率無(wú)關(guān)"
    難道美國(guó)到現(xiàn)在都還沒(méi)搞清楚“再犯罪率”和什么有關(guān)嗎?印象中關(guān)于防止再犯的經(jīng)驗(yàn),美國(guó)好像是采取的社區(qū)關(guān)懷的形式,據(jù)說(shuō)在這方面很有經(jīng)驗(yàn)了,而且這方面的統(tǒng)計(jì)數(shù)據(jù)也不少。
  •   是嗎,有空也研究一下...
  •   人心應(yīng)該是預(yù)測(cè)不了的。
 

250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7