計(jì)算機(jī)體系結(jié)構(gòu)

出版時(shí)間:2012-12  出版社:人民郵電出版社  作者:[美] John L. Hennessy,[美] David A. Patterson  頁(yè)數(shù):595  字?jǐn)?shù):1139000  譯者:賈洪峰  
Tag標(biāo)簽:無  

前言

  本書的目的  本書到現(xiàn)在已經(jīng)是第5個(gè)版本了,我們的目標(biāo)一直沒有改變,就是要闡述那些為未來技術(shù)發(fā)展奠定基礎(chǔ)的基本原理。計(jì)算機(jī)體系結(jié)構(gòu)的各種發(fā)展機(jī)遇總是讓我們激情澎湃,不曾有絲毫消退。我們?cè)诘?版中就作出過如下的論述:“這個(gè)學(xué)科不是令人昏昏欲睡、百無一用的紙版模型。絕對(duì)不是!這是一個(gè)受到人們熱切關(guān)注的學(xué)科,需要在市場(chǎng)競(jìng)爭(zhēng)力與成本·性能·能耗之間作好權(quán)衡,從事這個(gè)學(xué)科既可能導(dǎo)致可怕的失敗,也可能帶來顯赫的成功。”  在編寫第1版時(shí),我們的主要目的是希望改變?nèi)藗冊(cè)瓉韺W(xué)習(xí)和研究計(jì)算機(jī)體系結(jié)構(gòu)的方式。現(xiàn)今,我們感到這一目標(biāo)依然正確,依然重要。該領(lǐng)域日新月異,在對(duì)其進(jìn)行研究時(shí),必須采用真實(shí)計(jì)算機(jī)上的測(cè)量數(shù)據(jù)和真實(shí)示例,而不是去研究一大堆從來都不需要實(shí)現(xiàn)的定義和設(shè)計(jì)。我們不僅熱烈歡迎過去與我們結(jié)伴而行的老讀者,同樣也非常歡迎現(xiàn)在剛剛加入我們的新朋友。不管怎樣,我們都保證將采用同樣的量化方法對(duì)真實(shí)系統(tǒng)進(jìn)行分析?! 『颓皫装嬉粯樱诰帉戇@個(gè)新版本時(shí),我們力爭(zhēng)使其既適用于學(xué)習(xí)高級(jí)計(jì)算機(jī)體系結(jié)構(gòu)與設(shè)計(jì)課程的學(xué)生,也適用于專業(yè)的工程師和架構(gòu)師。與第1版類似,這個(gè)版本重點(diǎn)介紹新平臺(tái)(個(gè)人移動(dòng)設(shè)備和倉(cāng)庫(kù)級(jí)計(jì)算機(jī))和新體系結(jié)構(gòu)(多核和GPU)。這一版還秉承了前幾版的做法,希望能夠通過強(qiáng)調(diào)成本、性能、能耗之間的平衡和優(yōu)秀的工程設(shè)計(jì),揭去計(jì)算機(jī)體系結(jié)構(gòu)的神秘面紗。我們相信這一領(lǐng)域正在日趨成熟,發(fā)展成為一門具備嚴(yán)格量化基礎(chǔ)的經(jīng)典理工學(xué)科?! £P(guān)于第5版  我們?cè)?jīng)說過,第4版可能因?yàn)檗D(zhuǎn)向討論多核芯片而成為自第1版以來的最重要版本。但我們收到了這樣的反饋意見:第4版已經(jīng)失去了第1版重點(diǎn)突出的優(yōu)點(diǎn),它一視同仁地討論所有內(nèi)容,不分重點(diǎn)和場(chǎng)合。我們非常確信,第5版不會(huì)再有這樣的評(píng)價(jià)了?! ∥覀兿嘈?,最令人激動(dòng)的地方在于計(jì)算規(guī)模的兩個(gè)極端:以移動(dòng)電話和平板電腦之類的個(gè)人移動(dòng)設(shè)備(PMD)為客戶端,以提供云計(jì)算的倉(cāng)庫(kù)級(jí)計(jì)算機(jī)為服務(wù)器。(具有敏銳觀察力的讀者可能已經(jīng)看出本書封面上云計(jì)算的寓意。)盡管這兩個(gè)極端的規(guī)模大小不同,但它們?cè)诔杀?、性能和能效方面的共同主題給我們留下了深刻印象。因此,每一章的討論背景都是PMD和倉(cāng)庫(kù)級(jí)計(jì)算機(jī)的計(jì)算,第6章是全新的一章,專門討論倉(cāng)庫(kù)級(jí)計(jì)算機(jī)。  本書的另一條主線是討論并行的所有不同形式。我們首先在第1章指出了兩種應(yīng)用級(jí)別的并行,一個(gè)是數(shù)據(jù)級(jí)并行(DLP),它的出現(xiàn)是因?yàn)橛性S多數(shù)據(jù)項(xiàng)允許同時(shí)對(duì)其進(jìn)行操作;另一個(gè)是任務(wù)級(jí)并行(TLP),它的出現(xiàn)是因?yàn)閯?chuàng)建了一些可以獨(dú)立執(zhí)行并在很大程度上并行的工作任務(wù)。隨后解釋4種開發(fā)DLP和TLP的體系結(jié)構(gòu)樣式,分別是:第3章介紹的指令級(jí)并行(ILP),第4章介紹的向量體系結(jié)構(gòu)和圖形處理器(GPU),這一章是第5版新增加的內(nèi)容;第5章介紹的線程級(jí)并行;第6章通過倉(cāng)庫(kù)級(jí)計(jì)算機(jī)介紹的需求級(jí)并行(RLP),這一章也是第5版中新增加的。本書中,我們將存儲(chǔ)器層次結(jié)構(gòu)的內(nèi)容提前到第2章,并將存儲(chǔ)系統(tǒng)那一章改作附錄D。我們對(duì)第4章、第6章的內(nèi)容尤為感到自豪,第4章對(duì)GPU的解讀是目前最詳盡、最清晰的,第6章首次公布了Google倉(cāng)庫(kù)級(jí)計(jì)算機(jī)的最新細(xì)節(jié)?! ∨c前幾版相同,本書前三個(gè)附錄提供了有關(guān)MIPS指令集系統(tǒng)、存儲(chǔ)器層次結(jié)構(gòu)和流水線的基礎(chǔ)知識(shí),如果讀者沒有讀過《計(jì)算機(jī)組成與設(shè)計(jì)》之類的書籍,可用作參考。為了在降低成本的同時(shí)還能提供一些讀者感興趣的補(bǔ)充材料,我們?cè)诰W(wǎng)絡(luò)上提供了另外9個(gè)附錄,網(wǎng)址為:http://booksite.mkp.com/9780123838728。這些附錄的頁(yè)數(shù)之和比本書還要多呢!  這一版繼續(xù)發(fā)揚(yáng)“以真實(shí)示例演示概念”的傳統(tǒng),并增加了全新的“融會(huì)貫通”部分。這一版中的“融會(huì)貫通”內(nèi)容包括以下各服務(wù)器的流水線組成與存儲(chǔ)器層次結(jié)構(gòu):ARM Cortex A8處理器、Intel core i7處理器、NVIDIA GTX-280和GTX-480 GPU,還有Google倉(cāng)庫(kù)級(jí)計(jì)算機(jī)。  主題的選擇與組織  和以前一樣,我們?cè)谶x擇主題時(shí)采用了一種保守的方法,畢竟這個(gè)領(lǐng)域中值得討論的思想實(shí)在太多了,不可能在這樣一本主要討論基本原理的書中將其全部涵蓋在內(nèi)。我們沒有面面?zhèn)樀降胤治鲎x者可能遇到的所有體系結(jié)構(gòu),而是將重點(diǎn)放在那些在任何新計(jì)算機(jī)中都可能涉及的核心概念上。根據(jù)一貫堅(jiān)持的選材標(biāo)準(zhǔn),本書討論的思想都經(jīng)過深入研究并已被成功應(yīng)用,其內(nèi)容足以采用量化方法進(jìn)行討論。  我們一直重點(diǎn)關(guān)注的內(nèi)容都是無法從其他來源獲取的同類資料,因此我們將繼續(xù)盡可能討論比較高級(jí)的內(nèi)容。事實(shí)上,本書介紹的有些系統(tǒng),就無法在文獻(xiàn)中找到相關(guān)描述。如果讀者需要了解更為基礎(chǔ)的計(jì)算機(jī)體系結(jié)構(gòu)知識(shí),可以閱讀《計(jì)算機(jī)組成與設(shè)計(jì):硬件/軟件接口》(Computer Organization and Design: The Hardware/Software Interface)一書?! ?nèi)容概述  這一版對(duì)第1章進(jìn)行了補(bǔ)充,其中包括能耗、靜態(tài)功率、動(dòng)態(tài)功率、集成電路成本、可靠性和可用性的計(jì)算公式。(封二上也列出了這些公式。)在本書后續(xù)部分讀者能夠一直應(yīng)用這些公式。除了計(jì)算機(jī)設(shè)計(jì)與性能測(cè)量方面的經(jīng)典量化原理之外,還對(duì)PIAT一節(jié)進(jìn)行了升級(jí),采用了新的SPECPower基準(zhǔn)測(cè)試?! ∥覀冋J(rèn)為,與1990年相比,指令集體系結(jié)構(gòu)扮演的角色有所弱化,所以我們把這一部分內(nèi)容作為了附錄A。它仍然采用MIPS64體系結(jié)構(gòu)。(為便于快速查看,封三匯總了MIPS ISA相關(guān)信息。)網(wǎng)站上的附錄K介紹了10種RISC體系結(jié)構(gòu)、80x86、DEC VAX和IBM 360/370,獻(xiàn)給ISA愛好者們。  隨后,我們?cè)诘?章開始討論存儲(chǔ)器層次結(jié)構(gòu),這是因?yàn)楹苋菀揍槍?duì)這些內(nèi)容應(yīng)用成本·性能·功耗原理,而且存儲(chǔ)器是其余各章的關(guān)鍵內(nèi)容。和上一版一樣,附錄B對(duì)緩存機(jī)制作了概述,以供讀者需要時(shí)查閱。第2章討論了對(duì)緩存的10種高級(jí)優(yōu)化方法。這一章還介紹了虛擬機(jī),它便于提供保護(hù)、進(jìn)行軟硬件管理,而且在云計(jì)算中也扮演著重要角色。除了介紹SRAM和DRAM技術(shù)之外,這一章還包括了閃存的內(nèi)容。PIAT示例選擇了PMD中使用的ARM Cortex A8和服務(wù)器中使用的Intel Core i7?! 〉?章主要研究高性能處理器中的指令級(jí)并行開發(fā),包括超標(biāo)量執(zhí)行、分支預(yù)測(cè)、推理、動(dòng)態(tài)調(diào)度和多線程。前面曾經(jīng)提到,附錄C是關(guān)于流水線的一個(gè)綜述,以備隨時(shí)查閱之用。第3章還研究了ILP的局限性。和第2章一樣,PIAT示例還是ARM Cortex A8和Intel Core i7。第3版包括大量有關(guān)Itanium和VLIW的材料,現(xiàn)在這些內(nèi)容放在網(wǎng)上的附錄H中,這表明了我們的觀點(diǎn):這種體系結(jié)構(gòu)未能達(dá)到過去所宣稱的效果。  多媒體應(yīng)用程序(比如游戲和視頻處理)的重要性在提高,因此,開發(fā)數(shù)據(jù)級(jí)并行的體系結(jié)構(gòu)也變得更為重要。具體來說,越來越多的人在關(guān)注利用圖形處理器(GPU)執(zhí)行的運(yùn)算,但很少有架構(gòu)師了解GPU到底是如何工作的。我們決定編寫新的一章,主要就是為了揭開這種新型計(jì)算機(jī)體系結(jié)構(gòu)的奧秘。第4章開始介紹向量體系結(jié)構(gòu),對(duì)多媒體SIMD指令集擴(kuò)展和GPU的解釋就是以此為基礎(chǔ)的。(網(wǎng)站上的附錄G深入地討論了向量體系結(jié)構(gòu)。)GPU一節(jié)是本書最難寫的部分,需要多次反復(fù)才能給出一個(gè)既精確又容易理解的描述。一個(gè)重大挑戰(zhàn)就是術(shù)語。我們決定使用我們自己的術(shù)語,然后給出這些術(shù)語與NVIDIA官方術(shù)語之間的對(duì)應(yīng)關(guān)系。這一章介紹了Roofline性能模型,然后用它來對(duì)比Intel Core i7、NVIDIA GTX 280和GTX 480 GPU。這一章還介紹了供PMD使用的Tegra 2 GPU?! 〉?章介紹多核處理器,探討了對(duì)稱、分布式存儲(chǔ)器體系結(jié)構(gòu),考查了組織原理和性能。接下來是有關(guān)同步和存儲(chǔ)器一致性模型的主題,所采用的示例是Intel Core i7。對(duì)片上互連網(wǎng)絡(luò)感興趣的讀者可以閱讀網(wǎng)站上的附錄F,對(duì)更大規(guī)模多處理器和科學(xué)應(yīng)用感興趣的讀者可以閱讀網(wǎng)站上的附錄I。  前面曾經(jīng)提到,第6章介紹了計(jì)算機(jī)體系結(jié)構(gòu)中的最新主題——倉(cāng)庫(kù)級(jí)計(jì)算機(jī)(Warehouse- Scale Computer,WCS)。依靠Amazon Web服務(wù)部門和Google工程師的幫助,本章整合了有關(guān)WSC設(shè)計(jì)、成本與性能的詳細(xì)資料,而以前了解這些內(nèi)容的架構(gòu)師寥寥無幾。在開始描述WSC的體系結(jié)構(gòu)和物理實(shí)現(xiàn)(及成本)之前,首先介紹了MapReduce編程模型。從成本的角度可以解釋為什么會(huì)有云計(jì)算,以及為何在云中使用WSC進(jìn)行計(jì)算的成本要低于在本地?cái)?shù)據(jù)中心的計(jì)算成本。PIAT實(shí)例是對(duì)Google WSC的描述,有些內(nèi)容是首次公開的。  接下來就是附錄A到附錄L。 附錄A介紹ISA的原理,包括MIPS64,附錄K介紹Alpha、MIPS、PowerPC和SPARC的64位版本及其多媒體擴(kuò)展。其中還包括一些經(jīng)典體系結(jié)構(gòu)(80x86、VAX和IBM 360/370)和流行的嵌入指令集(ARM、Thumb、SuperH、MIPS16和Mitsubishi M32R)。附錄H與其相關(guān),介紹了VLIW ISA的體系結(jié)構(gòu)和編譯器?! ∏懊嬖?jīng)提到,附錄B和附錄C是緩存與流水線基本概念的教程。建議對(duì)緩存不夠熟悉的讀者在閱讀第2章之前先閱讀附錄B,新接觸流水線的讀者在閱讀第3章之前先閱讀附錄C。  附錄D“存儲(chǔ)系統(tǒng)”包括:進(jìn)一步討論可靠性和可用性,以RAID 6方案介紹為主體的RAID教程,非常珍貴的真實(shí)系統(tǒng)故障統(tǒng)計(jì)信息。接下來介紹了排隊(duì)理論和I/O性能基準(zhǔn)測(cè)試。我們?cè)u(píng)估了一個(gè)真實(shí)集群Internet Archive的成本、性能和可靠性?!叭跁?huì)貫通”部分以NetApp FAS6000文件管理程序?yàn)槔??! 「戒汦由Thomas M. Conte撰寫,匯總了嵌入式系統(tǒng)的相關(guān)內(nèi)容?! 「戒汧討論網(wǎng)絡(luò)互連,由Timothy M. Pinkston和José Duato進(jìn)行了修訂。附錄G最初由Krste Asanovi·撰寫,其中詳細(xì)介紹了向量處理器。就我們所知,這兩個(gè)附錄是其各自相關(guān)主題的最好材料?! 「戒汬詳細(xì)介紹了VLIW和EPIC,也就是Itanium采用的體系結(jié)構(gòu)?! 「戒汭詳細(xì)介紹了大規(guī)模共享存儲(chǔ)器多處理方面用到的并行處理應(yīng)用和一致性協(xié)議。附錄J由David Goldberg撰寫,詳細(xì)介紹了計(jì)算機(jī)算法?! 「戒汱將第3版每一章中的“歷史回顧與參考文獻(xiàn)”部分集中在一起。對(duì)于各章介紹的思想,它盡量給予一個(gè)恰當(dāng)?shù)脑u(píng)價(jià),并讓讀者了解這些創(chuàng)造性思想背后的歷史。我們希望以此來展現(xiàn)人類在計(jì)算機(jī)設(shè)計(jì)方面的戲劇性發(fā)展過程。這個(gè)附錄還提供了一些參考文獻(xiàn),主修體系結(jié)構(gòu)的學(xué)生可能會(huì)非常喜歡它們。其中提到了本領(lǐng)域的一些經(jīng)典論文,如果時(shí)間允許,建議讀者閱讀這些論文。直接聽原創(chuàng)者講述他們的思想,在深受教育的同時(shí),也是一種享受。而“歷史回顧”是以前版本中最受歡迎的章節(jié)之一?! ?nèi)容導(dǎo)讀  所有讀者都應(yīng)當(dāng)從第1章開始閱讀,除此之外并不存在什么唯一的最佳順序。如果你不想閱讀全部?jī)?nèi)容,可以參考下面這些順序。  · 存儲(chǔ)器層次結(jié)構(gòu):附錄B、第2章、附錄D?!  ?指令級(jí)并行:附錄C、第3章、附錄H?!  ?數(shù)據(jù)級(jí)并行:第4章、第6章、附錄G?!  ?線程級(jí)并行:第5章、附錄F、附錄I?!  ?請(qǐng)求級(jí)并行:第6章?!  ?ISA:附錄A、附錄K?! 「戒汦可以隨時(shí)閱讀,但在ISA和緩存序列之后閱讀,效果可能會(huì)更好一些。附錄J可以在涉及運(yùn)算時(shí)閱讀。附錄L的各部分內(nèi)容應(yīng)當(dāng)在讀完正文中相應(yīng)章節(jié)后閱讀?! ≌鹿?jié)安排  我們根據(jù)一種統(tǒng)一的框架安排內(nèi)容,使各章在結(jié)構(gòu)方面保持一致。首先會(huì)介紹一章的主題思想,然后是“交叉問題”部分,說明本章介紹的思想與其他各章有什么相互關(guān)系。接下來是“融會(huì)貫通”部分,通過展示如何在實(shí)際計(jì)算機(jī)中應(yīng)用這些思想,將它們串在一起?! ≡傧旅媸恰爸囌撆c易犯錯(cuò)誤”,讓讀者從他人的錯(cuò)誤中汲取教訓(xùn)。我們將舉例說明一些常見誤解與體系結(jié)構(gòu)陷阱,要避免犯錯(cuò)是非常困難的,哪怕你明明知道它們就在前面等著你。“謬論與易犯錯(cuò)誤”部分是本書最受歡迎的內(nèi)容。每一章都以一個(gè)“結(jié)語”節(jié)結(jié)束?! “咐芯颗c練習(xí)  每一章的最后都有案例研究和練習(xí)。這些案例研究由業(yè)內(nèi)和學(xué)術(shù)界的專家編撰而成,通過難度逐漸增大的練習(xí)來探討該章的關(guān)鍵概念,檢驗(yàn)讀者的理解程度。教師們會(huì)發(fā)現(xiàn)這些案例研究都非常詳盡和完善,完全可以針對(duì)它們?cè)O(shè)計(jì)出一些練習(xí)。  每個(gè)練習(xí)中用尖括號(hào)括起的內(nèi)容()指明了做這道題應(yīng)該閱讀哪部分正文內(nèi)容。我們這樣做的目的,一方面是為了提供復(fù)習(xí)內(nèi)容,另一方面是希望幫助讀者避免在還沒有閱讀相應(yīng)正文的情況下去做一些練習(xí)。為了使讀者大致了解完成一道題需要多長(zhǎng)時(shí)間,我們?yōu)檫@些練習(xí)劃定了不同等級(jí):  [10]  短于5分鐘(閱讀和理解時(shí)間);  [15]  5~15分鐘給出完整答案;  [20]  15~20分鐘給出完整答案;  [25]  在1小時(shí)內(nèi)給出完整的書面答案;  [30]  小型編程項(xiàng)目:時(shí)間短于1整天;  [40]  大型編程項(xiàng)目:耗時(shí)2周;  [討論]  與他人一起討論的主題?! ≡趖extbooks.elsevier.com注冊(cè)的老師可以得到案例研究與習(xí)題的解答。  我們會(huì)定期補(bǔ)充新材料和網(wǎng)上其他可用資源的鏈接?! 椭倪M(jìn)本書  如果你閱讀后面的“致謝”部分,將會(huì)看到我們已經(jīng)下了很大的功夫來糾正錯(cuò)誤。由于一本書會(huì)進(jìn)行多次印刷,所以我們有機(jī)會(huì)進(jìn)行更多的校訂。如果你發(fā)現(xiàn)了任何遺留錯(cuò)誤,請(qǐng)通過電子郵件聯(lián)系出版商。  結(jié)語  本書仍然是一本真正的合著作品,我們每人編寫的章節(jié)和附錄各占一半。如果沒有對(duì)方完成另一半工作,如果沒有對(duì)方在任務(wù)似乎無望完成時(shí)給予鼓勵(lì),如果沒有對(duì)方點(diǎn)透某個(gè)難以表述的復(fù)雜概念,如果沒有對(duì)方花費(fèi)周末時(shí)間來審閱書稿,又如果沒有對(duì)方在自己因?yàn)槠渌敝芈氊?zé)而難以提筆時(shí)給予寬慰(從簡(jiǎn)歷可以看出,這些職責(zé)是隨著本書的版本號(hào)以指數(shù)形式增加的),我們無法想象這本書要花費(fèi)多長(zhǎng)時(shí)間才能完成。當(dāng)然,對(duì)于你將要讀到的內(nèi)容,其中若有不當(dāng)之處,我們也負(fù)有同等責(zé)任?! ohn Hennessy  David Patterson

內(nèi)容概要

  《計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法(第5版)》是最權(quán)威的計(jì)算機(jī)體系結(jié)構(gòu)著作,是久負(fù)盛名的經(jīng)典作品。書中系統(tǒng)地介紹了計(jì)算機(jī)系統(tǒng)的設(shè)計(jì)基礎(chǔ)、指令集系統(tǒng)結(jié)構(gòu)、流水線和指令集并行技術(shù)、層次化存儲(chǔ)系統(tǒng)與存儲(chǔ)設(shè)備、互連網(wǎng)絡(luò)以及多處理器系統(tǒng)等重要內(nèi)容。在這個(gè)最新版中,作者增加了當(dāng)前炙手可熱的云計(jì)算和手機(jī)客戶端技術(shù)等相關(guān)內(nèi)容,探討了在手機(jī)、平板電腦、筆記本電腦和其他移動(dòng)計(jì)算設(shè)備上云計(jì)算的軟硬件實(shí)現(xiàn)方式。  《計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法(第5版)》可作為高等院校計(jì)算機(jī)專業(yè)本科生或研究生教材,也可作為從事計(jì)算機(jī)體系結(jié)構(gòu)或計(jì)算機(jī)系統(tǒng)設(shè)計(jì)的工程技術(shù)人員的參考書。

作者簡(jiǎn)介

  John L. Hennessy
是斯坦福大學(xué)的第10任校長(zhǎng),從1977年開始在該校電子工程與計(jì)算機(jī)系任教。Hennessy是IEEE和ACM會(huì)士,美國(guó)國(guó)家工程院、國(guó)家科學(xué)院和美國(guó)哲學(xué)院院士,美國(guó)藝術(shù)與科學(xué)院院士。他獲得過眾多獎(jiǎng)項(xiàng),如2001年度Eckert-Mauchly獎(jiǎng),表彰他對(duì)RISC技術(shù)的貢獻(xiàn);2001年度Seymour
Cray計(jì)算機(jī)工程獎(jiǎng);與David
Patterson共同獲得的2000年度約翰?馮?諾依曼獎(jiǎng)?wù)?。他還擁有7個(gè)榮譽(yù)博士學(xué)位。
  1981年,John L.
Hennessy帶領(lǐng)幾位研究生在斯坦福開始MIPS項(xiàng)目的研究。1984年完成該項(xiàng)目之后,他暫時(shí)離開大學(xué),與他人共同籌建MIPS計(jì)算機(jī)系統(tǒng)公司(也就是現(xiàn)在的MIPS技術(shù)公司),這家公司開發(fā)了最早的商用RISC微處理器之一。到2006年,已經(jīng)有20多億個(gè)MIPS微處理器被用于視頻游戲、掌上電腦、激光打印機(jī)和網(wǎng)絡(luò)交換機(jī)等各種設(shè)備中。Hennessy后來領(lǐng)導(dǎo)了DASH(Director
Architecture for Shared
Memory,共享存儲(chǔ)器控制體系結(jié)構(gòu))項(xiàng)目,這一項(xiàng)目設(shè)計(jì)了第一個(gè)可擴(kuò)展緩存一致性多處理器原型,其中的許多重要思想都在現(xiàn)代多處理器中得到了應(yīng)用。除了參與科研活動(dòng)、履行學(xué)校職責(zé)之外,他仍作為前期顧問和投資者參與了無數(shù)的創(chuàng)業(yè)項(xiàng)目。
  David A.
Patterson自1977年進(jìn)入加州大學(xué)伯克利分校執(zhí)教以來,一直講授計(jì)算機(jī)體系結(jié)構(gòu)課程,擁有該校計(jì)算機(jī)科學(xué)Pardee講座教授職位。他因?yàn)榻虒W(xué)成果顯著而榮獲了加州大學(xué)的杰出教學(xué)獎(jiǎng)、ACM的Karlstrom獎(jiǎng)、IEEE的Mulligan教育獎(jiǎng)?wù)潞捅究粕虒W(xué)獎(jiǎng)。因?yàn)樵赗ISC方面的貢獻(xiàn)而獲得了IEEE技術(shù)成就獎(jiǎng)和ACM
Eckert-Mauchly獎(jiǎng),他還因?yàn)樵赗AID方面的貢獻(xiàn)而分享了IEEE Johnson信息存儲(chǔ)獎(jiǎng),并與John
Hennessy共同獲得了IEEE約翰?馮?諾依曼獎(jiǎng)?wù)潞虲 & C獎(jiǎng)金。和John
Hennessy相似,Patterson也是美國(guó)藝術(shù)與科學(xué)院院士、美國(guó)計(jì)算機(jī)歷史博物館院士、ACM和IEEE會(huì)士。他還被選入美國(guó)國(guó)家工程院、美國(guó)國(guó)家科學(xué)院和硅谷工程名人堂。Patterson身為美國(guó)總統(tǒng)信息技術(shù)顧問委員會(huì)委員,同時(shí)也是伯克利電子工程與計(jì)算機(jī)科學(xué)系計(jì)算機(jī)科學(xué)分部主任、計(jì)算機(jī)研究協(xié)會(huì)主席和ACM主席。這一履歷使他榮獲了ACM和CRA頒發(fā)的杰出服務(wù)獎(jiǎng)。
  在加州大學(xué)伯克利分校,Patterson領(lǐng)導(dǎo)了RISCI的設(shè)計(jì)與實(shí)現(xiàn)工作,這可能是第一臺(tái)VLSI精簡(jiǎn)指令集計(jì)算機(jī),為商業(yè)SPARC體系結(jié)構(gòu)奠定了基礎(chǔ)。他曾是廉價(jià)磁盤冗余陣列(Redundant
Arrays of Inexpensive
Disks,RAID)項(xiàng)目的領(lǐng)導(dǎo)者之一,正是由于這一項(xiàng)目,才有了后來許多公司出品的可靠存儲(chǔ)系統(tǒng)。他還參與了工作站網(wǎng)絡(luò)(Network
of
Workstations,NOW)項(xiàng)目,因?yàn)檫@一項(xiàng)目而有了因特網(wǎng)公司使用的集群技術(shù)和后來的云計(jì)算。這些項(xiàng)目獲得了ACM頒發(fā)的三個(gè)論文獎(jiǎng)。作為“算法-機(jī)器-人類”(AMP)實(shí)驗(yàn)室和并行計(jì)算實(shí)驗(yàn)室的主管,他目前在這里開展自己的研究項(xiàng)目。AMP實(shí)驗(yàn)室的目標(biāo)是開發(fā)可擴(kuò)展的機(jī)器學(xué)習(xí)算法、適用于倉(cāng)庫(kù)級(jí)計(jì)算機(jī)的編程模型、能夠快速洞悉云中海量數(shù)據(jù)的眾包(Crowd-Sourcing)工具。并行計(jì)算實(shí)驗(yàn)室的目標(biāo)是研發(fā)先進(jìn)技術(shù),為并行個(gè)人移動(dòng)設(shè)備提供可擴(kuò)展、可移植、方便快捷的效率軟件。

書籍目錄

第1章 量化設(shè)計(jì)與分析基礎(chǔ) 
1.1 引言 
1.2 計(jì)算機(jī)的分類 
1.2.1 個(gè)人移動(dòng)設(shè)備 
1.2.2 桌面計(jì)算 
1.2.3 服務(wù)器 
1.2.4 集群/倉(cāng)庫(kù)級(jí)計(jì)算機(jī) 
1.2.5 嵌入式計(jì)算機(jī) 
1.2.6 并行度與并行體系結(jié)構(gòu)的分類 
1.3 計(jì)算機(jī)體系結(jié)構(gòu)的定義 
1.3.1 指令集體系結(jié)構(gòu):計(jì)算機(jī)體系結(jié)構(gòu)的近距離審視 
1.3.2 真正的計(jì)算機(jī)體系結(jié)構(gòu):設(shè)計(jì)滿足目標(biāo)和功能需求的組成和硬件 
1.4 技術(shù)趨勢(shì) 
1.4.1 性能趨勢(shì):帶寬勝過延遲 
1.4.2 晶體管性能與連線的發(fā)展 
1.5 集成電路中的功率和能耗趨勢(shì) 
1.5.1 功率和能耗:系統(tǒng)觀點(diǎn) 
1.5.2 微處理器內(nèi)部的能耗和功率 
1.6 成本趨勢(shì) 
1.6.1 時(shí)間、產(chǎn)量和大眾化的影響 
1.6.2 集成電路的成本 
1.6.3 成本與價(jià)格 
1.6.4 制造成本與運(yùn)行成本 
1.7 可信任度 
1.8 性能的測(cè)量、報(bào)告和匯總 
1.8.1 基準(zhǔn)測(cè)試 
1.8.2 報(bào)告性能測(cè)試結(jié)果 
1.8.3 性能結(jié)果匯總 
1.9 計(jì)算機(jī)設(shè)計(jì)的量化原理 
1.9.1 充分利用并行 
1.9.2 局域性原理 
1.9.3 重點(diǎn)關(guān)注常見情形 
1.9.4 Amdahl定律 
1.9.5 處理器性能公式 
1.10 融會(huì)貫通:性能、價(jià)格和功耗 
1.11 謬論與易犯錯(cuò)誤 
1.12 結(jié)語 
1.13 歷史回顧與參考文獻(xiàn) 
第2章 存儲(chǔ)器層次結(jié)構(gòu)設(shè)計(jì) 
2.1 引言 
2.2 緩存性能的10種高級(jí)優(yōu)化方法 
2.2.1 第一種優(yōu)化:小而簡(jiǎn)單的第一級(jí)緩存,用以縮短命中時(shí)間、降低功率 
2.2.2 第二種優(yōu)化:采用路預(yù)測(cè)以縮短命中時(shí)間 
2.2.3 第三種優(yōu)化:實(shí)現(xiàn)緩存訪問的流水化,以提高緩存帶寬 
2.2.4 第四種優(yōu)化:采用無阻塞緩存,以提高緩存帶寬 
2.2.5 第五種優(yōu)化:采用多種緩存以提高緩存帶寬 
2.2.6 第六種優(yōu)化:關(guān)鍵字優(yōu)先和提前重啟動(dòng)以降低缺失代價(jià) 
2.2.7 第七種優(yōu)化:合并寫緩沖區(qū)以降低缺失代價(jià) 
2.2.8 第八種優(yōu)化:采用編譯器優(yōu)化以降低缺失率 
2.2.9 第九種優(yōu)化:對(duì)指令和數(shù)據(jù)進(jìn)行硬件預(yù)取,以降低缺失代價(jià)或缺失率 
2.2.10 第十種優(yōu)化:用編譯器控制預(yù)取,以降低缺失代價(jià)或缺失率 
2.2.11 緩存優(yōu)化小結(jié) 
2.3 存儲(chǔ)器技術(shù)與優(yōu)化 
2.3.1 SRAM技術(shù) 
2.3.2 DRAM技術(shù) 
2.3.3 提高DRAM芯片內(nèi)部的存儲(chǔ)器性能 
2.3.4 降低SDRAM中的功耗 
2.3.5 閃存 
2.3.6 提高存儲(chǔ)器系統(tǒng)的可靠性 
2.4 保護(hù):虛擬存儲(chǔ)器和虛擬機(jī) 
2.4.1 通過虛擬存儲(chǔ)器提供保護(hù) 
2.4.2 通過虛擬機(jī)提供保護(hù) 
2.4.3 對(duì)虛擬機(jī)監(jiān)視器的要求 
2.4.4 虛擬機(jī)(缺少)的指令集體系結(jié)構(gòu)支持 
2.4.5 虛擬機(jī)對(duì)虛擬存儲(chǔ)器和I/O的影響 
2.4.6 VMM實(shí)例:Xen虛擬機(jī) 
2.5 交叉問題:存儲(chǔ)器層次結(jié)構(gòu)的設(shè)計(jì) 
2.5.1 保護(hù)和指令集體系結(jié)構(gòu) 
2.5.2 緩存數(shù)據(jù)的一致性 
2.6 融會(huì)貫通:ARM Cortex-A8和Intel Core i7中的存儲(chǔ)器層次結(jié)構(gòu) 
2.6.1 ARM Cortex-A8 
2.6.2 Intel Core i7 
2.7 謬論與易犯錯(cuò)誤 
2.8 結(jié)語:展望 
2.9 歷史回顧與參考文獻(xiàn) 
第3章 指令級(jí)并行及其開發(fā) 
3.1 指令級(jí)并行:概念與挑戰(zhàn) 
3.1.1 什么是指令級(jí)并行 
3.1.2 數(shù)據(jù)相關(guān)與冒險(xiǎn) 
3.1.3 控制相關(guān) 
3.2 揭示ILP的基本編譯器技術(shù) 
3.2.1 基本流水線調(diào)度和循環(huán)展開 
3.2.2 循環(huán)展開與調(diào)度小結(jié) 
3.3 用高級(jí)分支預(yù)測(cè)降低分支成本 
3.3.1 競(jìng)賽預(yù)測(cè)器:局部預(yù)測(cè)器與全局預(yù)測(cè)器的自適應(yīng)聯(lián)合 
3.3.2 Intel Core i7分支預(yù)測(cè)器 
3.4 用動(dòng)態(tài)調(diào)度克服數(shù)據(jù)冒險(xiǎn) 
3.4.1 動(dòng)態(tài)調(diào)度:思想 
3.4.2 使用Tomasulo算法進(jìn)行動(dòng)態(tài)調(diào)度 
3.5 動(dòng)態(tài)調(diào)度:示例和算法 
3.5.1 Tomasulo算法:細(xì)節(jié) 
3.5.2 Tomasulo算法:基于循環(huán)的示例 
3.6 基于硬件的推測(cè) 
3.7 以多發(fā)射和靜態(tài)調(diào)度來開發(fā)ILP 
3.8 以動(dòng)態(tài)調(diào)度、多發(fā)射和推測(cè)來開發(fā)ILP 
3.9 用于指令傳送和推測(cè)的高級(jí)技術(shù) 
3.9.1 提高指令提取帶寬 
3.9.2 推測(cè):實(shí)現(xiàn)問題與擴(kuò)展 
3.10 ILP局限性的研究 
3.10.1 硬件模型 
3.10.2 可實(shí)現(xiàn)處理器上ILP的局限性 
3.10.3 超越本研究的局限 
3.11 交叉問題:ILP方法與存儲(chǔ)器系統(tǒng) 
3.11.1 硬件推測(cè)與軟件推測(cè) 
3.11.2 推測(cè)執(zhí)行與存儲(chǔ)器系統(tǒng) 
3.12 多線程:開發(fā)線程級(jí)并行提高單處理器吞吐量 
3.12.1 細(xì)粒度多線程在Sun T1上的效果 
3.12.2 同時(shí)多線程在超標(biāo)量處理器上的效果 
3.13 融會(huì)貫通:Intel Core i7和ARMCortex-A8 
3.13.1 ARM Cortex-A8 
3.13.2 Intel Core i7 
3.14 謬論與易犯錯(cuò)誤 
3.15 結(jié)語:前路何方 
3.16 歷史回顧與參考文獻(xiàn) 
第4章 向量、SIMD和GPU體系結(jié)構(gòu)中的數(shù)據(jù)級(jí)并行 
4.1 引言 
4.2 向量體系結(jié)構(gòu) 
4.2.1 VMIPS 
4.2.2 向量處理器如何工作:一個(gè)示例 
4.2.3 向量執(zhí)行時(shí)間 
4.2.4 多條車道:每個(gè)時(shí)鐘周期超過一個(gè)元素 
4.2.5 向量長(zhǎng)度寄存器:處理不等于64的循環(huán) 
4.2.6 向量遮罩寄存器:處理向量循環(huán)中的IF語句 
4.2.7 內(nèi)存組:為向量載入/存儲(chǔ)單元提供帶寬 
4.2.8 步幅:處理向量體系結(jié)構(gòu)中的多維數(shù)組 
4.2.9 集中-分散:在向量體系結(jié)構(gòu)中處理稀疏矩陣 
4.2.10 向量體系結(jié)構(gòu)編程 
4.3 SIMD指令集多媒體擴(kuò)展 
4.3.1 多媒體SIMD體系結(jié)構(gòu)編程 
4.3.2 Roofline可視性能模型 
4.4 圖形處理器 
4.4.1 GPU編程 
4.4.2 NVIDIA GPU計(jì)算結(jié)構(gòu) 
4.4.3 NVIDA GPU指令集體系結(jié)構(gòu) 
4.4.4 GPU中的條件分支 
4.4.5 NVIDIA GPU存儲(chǔ)器結(jié)構(gòu) 
4.4.6 Fermi GPU體系結(jié)構(gòu)中的創(chuàng)新 
4.4.7 向量體系結(jié)構(gòu)與GPU的相似與不同 
4.4.8 多媒體SIMD計(jì)算機(jī)與GPU之間的相似與不同 
4.4.9 小結(jié) 
4.5 檢測(cè)與增強(qiáng)循環(huán)強(qiáng)并行 
4.5.1 查找相關(guān) 
4.5.2 消除相關(guān)計(jì)算 
4.6 交叉問題 
4.6.1 能耗與DLP:慢而寬與快而窄 
4.6.2 分組存儲(chǔ)器和圖形存儲(chǔ)器 
4.6.3 步幅訪問和TLB缺失 
4.7 融會(huì)貫通:移動(dòng)與服務(wù)器GPU、Tesla與Core i7 
4.8 謬論與易犯錯(cuò)誤 
4.9 結(jié)語 
4.10 歷史回顧與參考文獻(xiàn) 
第5章 線程級(jí)并行 
5.1 引言 
5.1.1 多處理器體系結(jié)構(gòu):?jiǎn)栴}與方法 
5.1.2 并行處理的挑戰(zhàn) 
5.2 集中式共享存儲(chǔ)器體系結(jié)構(gòu) 
5.2.1 什么是多處理器緩存一致性 
5.2.2 一致性的基本實(shí)現(xiàn)方案 
5.2.3 監(jiān)聽一致性協(xié)議 
5.2.4 基本實(shí)現(xiàn)技術(shù) 
5.2.5 示例協(xié)議 
5.2.6 基本一致性協(xié)議的擴(kuò)展 
5.2.7 對(duì)稱共享存儲(chǔ)器多處理器與監(jiān)聽協(xié)議的局限性 
5.2.8 實(shí)施監(jiān)聽緩存一致性 
5.3 對(duì)稱共享存儲(chǔ)器多處理器的性能 
5.3.1 商業(yè)工作負(fù)載 
5.3.2 商業(yè)工作負(fù)載的性能測(cè)量 
5.3.3 多重編程和操作系統(tǒng)工作負(fù)載 
5.3.4 多重編程和操作系統(tǒng)工作負(fù)載的性能 
5.4 分布式共享存儲(chǔ)器和目錄式一致性 
5.4.1 目錄式緩存一致性協(xié)議:基礎(chǔ)知識(shí) 
5.4.2 目錄式協(xié)議舉例 
5.5 同步:基礎(chǔ)知識(shí) 
5.5.1 基本硬件原語 
5.5.2 使用一致性實(shí)現(xiàn)鎖 
5.6 存儲(chǔ)器連貫性模型:簡(jiǎn)介 
5.6.1 程序員的觀點(diǎn) 
5.6.2 寬松連貫性模型:基礎(chǔ)知識(shí) 
5.6.3 關(guān)于連貫性模型的最后說明 
5.7 交叉問題 
5.7.1 編譯器優(yōu)化與連貫性模型 
5.7.2 利用推測(cè)來隱藏嚴(yán)格連貫性模型中的延遲 
5.7.3 包含性及其實(shí)現(xiàn) 
5.7.4 利用多重處理和多線程的性能增益 
5.8 融會(huì)貫通:多核處理器及其性能 
5.9 謬論與易犯錯(cuò)誤 
5.10 結(jié)語 
5.11 歷史回顧與參考文獻(xiàn) 
第6章 以倉(cāng)庫(kù)級(jí)計(jì)算機(jī)開發(fā)請(qǐng)求級(jí)、數(shù)據(jù)級(jí)并行 
6.1 引言 
6.2 倉(cāng)庫(kù)級(jí)計(jì)算機(jī)的編程模型與工作負(fù)載 
6.3 倉(cāng)庫(kù)級(jí)計(jì)算機(jī)的計(jì)算機(jī)體系結(jié)構(gòu) 
6.3.1 存儲(chǔ) 
6.3.2 陣列交換機(jī) 
6.3.3 WSC存儲(chǔ)器層次結(jié)構(gòu) 
6.4 倉(cāng)庫(kù)級(jí)計(jì)算機(jī)的物理基礎(chǔ)設(shè)施與成本 
6.4.1 測(cè)量WSC的效率 
6.4.2 WSC的成本 
6.5 云計(jì)算:公用計(jì)算的回報(bào) 
6.6 交叉問題 
6.6.1 成為瓶頸的WSC網(wǎng)絡(luò) 
6.6.2 在服務(wù)器內(nèi)部高效利用能量 
6.7 融會(huì)貫通:Google倉(cāng)庫(kù)級(jí)計(jì)算機(jī) 
6.7.1 集裝箱 
6.7.2 Google WSC中的冷卻與供電 
6.7.3 Google WSC中的服務(wù)器 
6.7.4 Google WSC中的聯(lián)網(wǎng) 
6.7.5 Google WSC的監(jiān)控與修復(fù) 
6.7.6 小結(jié) 
6.8 謬論與易犯錯(cuò)誤 
6.9 結(jié)語 
6.10 歷史回顧與參考文獻(xiàn) 
附錄A 指令集基本原理 
A.1 引言 
A.2 指令集體系結(jié)構(gòu)的分類 
A.3 存儲(chǔ)器尋址 
A.4 操作數(shù)的類型與大小 
A.5 指令集中的操作 
A.6 控制流指令 
A.7 指令集編碼 
A.8 交叉問題:編譯器的角色 
A.9 融會(huì)貫通:MIPS體系結(jié)構(gòu) 
A.10 謬論和易犯錯(cuò)誤 
A.11 結(jié)語 
A.12 歷史回顧與參考文獻(xiàn) 
附錄B 存儲(chǔ)器層次結(jié)構(gòu)回顧 
B.1 引言 
B.2 緩存性能 
B.3 6種基本的緩存優(yōu)化 
B.4 虛擬存儲(chǔ)器 
B.5 虛擬存儲(chǔ)器的保護(hù)與示例 
B.6 謬論與易犯錯(cuò)誤 
B.7 結(jié)語 
B.8 歷史回顧與參考文獻(xiàn) 
附錄C 流水線:基礎(chǔ)與中級(jí)概念 
C.1 引言 
C.2 流水化的主要阻礙——流水線冒險(xiǎn) 
C.3 如何實(shí)現(xiàn)流水化 
C.4 妨礙流水線實(shí)現(xiàn)的難題 
C.5 擴(kuò)展MIPS流水線,以處理多周期操作 
C.6 融會(huì)貫通:MIPS R4000流水線 
C.7 交叉問題 
C.8 謬論與易犯錯(cuò)誤 
C.9 結(jié)語 
C.10 歷史回顧與參考文獻(xiàn) 
參考文獻(xiàn) 
索引

章節(jié)摘錄

版權(quán)頁(yè):   插圖:   遺憾的是,在對(duì)比計(jì)算機(jī)性能時(shí)并非總是使用時(shí)間這一度量標(biāo)準(zhǔn)。我們的觀點(diǎn)是:唯一穩(wěn)定、可靠的性能度量就是實(shí)際程序的執(zhí)行時(shí)間,以任意其他度量代替時(shí)間或者以任意其他被測(cè)項(xiàng)目代替實(shí)際程序,最終都會(huì)在計(jì)算機(jī)設(shè)計(jì)中產(chǎn)生誤導(dǎo),甚至是錯(cuò)誤。 即使是執(zhí)行時(shí)間,也可以根據(jù)我們的測(cè)量?jī)?nèi)容采用不同的定義方式。最直接的時(shí)間定義被稱為掛鐘時(shí)間,響應(yīng)時(shí)間或已用時(shí)間,也就是完成一項(xiàng)任務(wù)的延遲,包括磁盤訪問、存儲(chǔ)器訪問、輸人/輸出活動(dòng)、操作系統(tǒng)開銷等所有相關(guān)時(shí)間。在同時(shí)運(yùn)行多個(gè)程序的情況下,處理器在等待I/O時(shí)處理另一個(gè)程序,不一定使某一程序的已用時(shí)問縮至最短。因此,我們需要有一個(gè)術(shù)語來表達(dá)這一行為。CPU時(shí)間可以區(qū)分這種不同,它是指處理器執(zhí)行計(jì)算的時(shí)間,不包括等待I/O或運(yùn)行其他程序的時(shí)間。(顯然,用戶觀測(cè)到的響應(yīng)時(shí)間是程序的已用時(shí)間,而不是CPU時(shí)間。) 那些定期運(yùn)行相同程序的計(jì)算機(jī)用戶當(dāng)然是評(píng)估新計(jì)算機(jī)性能的最佳候選人。如果他們要評(píng)估一個(gè)新系統(tǒng)的性能,只需要比較其工作負(fù)載的執(zhí)行時(shí)問就行了(其工作負(fù)載就是在計(jì)算機(jī)上運(yùn)行的程序和操作系統(tǒng)命令)。但很少有用戶具備這種得天獨(dú)厚的條件。大多數(shù)用戶必須依賴其他方法來評(píng)價(jià)計(jì)算機(jī)的性能,還經(jīng)常需要使用評(píng)估軟件,希望這些方法能夠預(yù)測(cè)自己在使用新計(jì)算機(jī)時(shí)的性能。 1.8.1 基準(zhǔn)測(cè)試 測(cè)量性能的最佳基準(zhǔn)測(cè)試方法就是采用實(shí)際應(yīng)用程序,比如1.1節(jié)的Google Goggles。人們?cè)?jīng)嘗試運(yùn)行一些遠(yuǎn)比實(shí)際應(yīng)用程序簡(jiǎn)單的程序,但這種做法已經(jīng)導(dǎo)致了性能隱患。這些簡(jiǎn)單程序的示例包括: 程序內(nèi)核,即實(shí)際應(yīng)用程序中的短小、關(guān)鍵部分; 玩具程序,為了完成編程入門作業(yè)而編寫的小程序,通常不超過100行,比如快速排序; 合成基準(zhǔn)測(cè)試程序,為了匹配實(shí)際應(yīng)用程序的特征和行為而編寫的虛擬程序,比如Dhrystone。 今天,所有這三種方法都沒有什么好名聲,主要是因?yàn)榫幾g器的編寫人員和架構(gòu)師可以串通起來,使計(jì)算機(jī)在執(zhí)行這些替代程序時(shí)能夠比運(yùn)行實(shí)際應(yīng)用程序時(shí)顯得更快一些。令本書作者感到沮喪的是,合成程序Dhrystone仍然是應(yīng)用最為廣泛的嵌入式處理器基準(zhǔn)測(cè)試程序!

媒體關(guān)注與評(píng)論

  “《計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法(第5版)》繼續(xù)發(fā)揚(yáng)傳統(tǒng),為學(xué)習(xí)計(jì)算機(jī)體系結(jié)構(gòu)的學(xué)生提供了當(dāng)前計(jì)算平臺(tái)的最新信息,使他們能夠洞悉體系結(jié)構(gòu),便于設(shè)計(jì)未來系統(tǒng)。這一版的亮點(diǎn)在于大幅修訂了數(shù)據(jù)級(jí)并行那一章,用傳統(tǒng)的體系結(jié)構(gòu)術(shù)語清晰地解讀了GPU體系結(jié)構(gòu)?!薄  狵rste Asanovi·,加州大學(xué)伯克利分?!  啊队?jì)算機(jī)體系結(jié)構(gòu):量化研究方法》是一部經(jīng)典,猶如美酒,歷久而彌醇。我在本科畢業(yè)時(shí)第一次購(gòu)買了本書,它到現(xiàn)在仍然是我最經(jīng)常參考的書籍之一。第4版問世時(shí),我發(fā)現(xiàn)其中包含了如此之多的新材料,為了跟上這一領(lǐng)域的最新趨勢(shì),我必須得再買一本。而當(dāng)審閱第5版時(shí),我發(fā)現(xiàn)Hennessy和Patterson再現(xiàn)神奇。全書內(nèi)容都進(jìn)行了大量更新,對(duì)于希望真正理解云和倉(cāng)庫(kù)級(jí)計(jì)算的人們來說,單憑第6章的內(nèi)容,這個(gè)新版本就值得一讀。只有Hennessy和Patterson才可能接觸到谷歌、微軟等云計(jì)算與互聯(lián)網(wǎng)規(guī)模的應(yīng)用提供商的內(nèi)部人士,對(duì)這一重要領(lǐng)域,業(yè)內(nèi)的介紹材料無出其右?!薄  狫ames Hamilton  “Hennessy和Patterson撰寫本書的第一版時(shí),研究生們是在用50 000個(gè)晶體管組裝計(jì)算機(jī)。今天,倉(cāng)庫(kù)級(jí)的計(jì)算機(jī)集群會(huì)包含50 000個(gè)服務(wù)器,每個(gè)服務(wù)器中包含數(shù)十個(gè)處理器和數(shù)十億個(gè)晶體管。計(jì)算機(jī)體系結(jié)構(gòu)一直在不停地快速發(fā)展,而《計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法》緊跟它的步伐,每個(gè)版本都準(zhǔn)確地解釋和分析了這一領(lǐng)域激動(dòng)人心的最新重要思想。”  ——James Larus,微軟研究院  “這一版新增加了一章非常豐富的內(nèi)容,用來討論向量、SIMD和GPU體系結(jié)構(gòu)中的數(shù)據(jù)級(jí)并行技術(shù)。它解釋了應(yīng)用于大眾市場(chǎng)的GPU內(nèi)部的關(guān)鍵體系結(jié)構(gòu)概念,給出這些概念與傳統(tǒng)術(shù)語的對(duì)應(yīng)關(guān)系,并與向量和SIMD體系結(jié)構(gòu)進(jìn)行了對(duì)比。這一內(nèi)容非常及時(shí),與業(yè)內(nèi)轉(zhuǎn)向GPU并行計(jì)算的潮流相適應(yīng)?!队?jì)算機(jī)體系結(jié)構(gòu):量化研究方法》繼續(xù)獨(dú)領(lǐng)風(fēng)騷,全面地介紹了體系結(jié)構(gòu)方面的重大新進(jìn)展!”  ——John Nickolls,NVIDIA  “本書已經(jīng)成為一本經(jīng)典教科書了,這一版突出介紹了各種顯式并行技術(shù)(數(shù)據(jù)、線程、請(qǐng)求)的興起,各用整整一章來描述。數(shù)據(jù)并行一章尤為奪目:通過向量SIMD、指令級(jí)SIMD和GPU的對(duì)比,避開每種體系結(jié)構(gòu)的專用術(shù)語,揭示了這些體系結(jié)構(gòu)之間的相似與區(qū)別?!薄  狵unle Olukotun,斯坦福大學(xué)  “《計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法(第5版)》探討了各種并行概念和它們各自的技術(shù)權(quán)衡。和過去的幾個(gè)版本一樣,這一新版本中同樣涵蓋了最新的技術(shù)發(fā)展趨勢(shì)。兩個(gè)重點(diǎn)是個(gè)人移動(dòng)設(shè)備(PMD)和倉(cāng)庫(kù)級(jí)計(jì)算(WSC)的爆炸性增長(zhǎng)——與原來一味追求性能相比,這里的焦點(diǎn)已經(jīng)轉(zhuǎn)為更全面地尋求性能與能效之間的平衡。這些趨勢(shì)刺激了人們不斷追求更強(qiáng)勁的處理能力,而這種追求又推動(dòng)人們?cè)诓⑿械缆飞献叩酶h(yuǎn)?!薄  狝ndrew N. Sloss,實(shí)施顧問,ARM公司 ARM System Developer’s Guide一書的作者

編輯推薦

《計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法(第5版)》可作為高等院校計(jì)算機(jī)專業(yè)本科生或研究生教材,也可作為從事計(jì)算機(jī)體系結(jié)構(gòu)或計(jì)算機(jī)系統(tǒng)設(shè)計(jì)的工程技術(shù)人員的參考書。

名人推薦

“本書之所以會(huì)成為不朽的經(jīng)典之作,是因?yàn)槊看卧侔娑疾粌H僅是一次更新補(bǔ)充,而是全面修訂,針對(duì)這個(gè)激動(dòng)人心且快速變化的領(lǐng)域,給予我們最及時(shí)的信息和權(quán)威的解讀。即便對(duì)于我這樣已從業(yè)二十多年的人來說,再次閱讀本書時(shí),依舊自覺學(xué)無止境,感佩于兩位卓越大師的淵博學(xué)識(shí)和深厚功底?!?——Luiz Andre Barroso,Google公司 “《計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法》是一部經(jīng)典,猶如美酒,歷久而彌醇。只有Hennessy和Patterson才可能接觸到谷歌、亞馬遜、微軟等云計(jì)算與互聯(lián)網(wǎng)規(guī)模的應(yīng)用提供商的內(nèi)部人士,對(duì)這一重要領(lǐng)域,業(yè)內(nèi)的介紹材料無出其右?!?——James Hamilton,Amazon web服務(wù)部 “《計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法(第5版)》繼續(xù)發(fā)揚(yáng)傳統(tǒng),為學(xué)習(xí)計(jì)算機(jī)體系結(jié)構(gòu)的學(xué)生提供了當(dāng)前計(jì)算平臺(tái)的最新信息,使他們能夠洞悉體系結(jié)構(gòu),便于設(shè)計(jì)未來系統(tǒng)。這一版的亮點(diǎn)在于大幅修訂了數(shù)據(jù)級(jí)并行那一章,用傳統(tǒng)的體系結(jié)構(gòu)術(shù)語清晰地解讀了GPU體系結(jié)構(gòu)?!?——Krste Asanovic,加州大學(xué)伯克利分校 “Hennessy和Patterson撰寫本書的第一版時(shí),研究生們是在用50000個(gè)晶體管組裝計(jì)算機(jī)。今天,倉(cāng)庫(kù)級(jí)的計(jì)算機(jī)集群會(huì)包含50000個(gè)服務(wù)器,每個(gè)服務(wù)器中包含數(shù)十個(gè)處理器和數(shù)十億個(gè)晶體管。計(jì)算機(jī)體系結(jié)構(gòu)一直在不停地快速發(fā)展,而《計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法》緊跟它的步伐,每個(gè)版本都準(zhǔn)確地解釋和分析了這一領(lǐng)域激動(dòng)人心的最新重要思想?!?——James Larus,微軟研究院

圖書封面

圖書標(biāo)簽Tags

評(píng)論、評(píng)分、閱讀與下載


    計(jì)算機(jī)體系結(jié)構(gòu) PDF格式下載


用戶評(píng)論 (總計(jì)39條)

 
 

  •   與《計(jì)算機(jī)組成與設(shè)計(jì):硬件、軟件接口》-第4版 乃絕配,研習(xí)計(jì)算機(jī)組成與體系結(jié)構(gòu)的童鞋們,兩本書配合足矣。
  •   帕特森的兩本經(jīng)典名作之一,計(jì)算機(jī)體系結(jié)構(gòu)的經(jīng)典
  •   不錯(cuò),閱讀此書可以對(duì)計(jì)算機(jī)體系結(jié)構(gòu)有透徹理解!
  •   很經(jīng)典的講述計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的書,作者也是大牛
  •   經(jīng)典無需多說,適合體系結(jié)構(gòu)相關(guān)的硬件人員。
  •   先備貨, 以后再慢慢看。 對(duì)體系結(jié)構(gòu)了解多都不是多。
  •   “圣經(jīng)”與時(shí)俱進(jìn)的教科書
  •   不廢話!經(jīng)典!讀書用的第三版!實(shí)習(xí)買了第四版!第五版,哈哈
  •   很全面 很透徹 可以作為設(shè)計(jì)標(biāo)準(zhǔn)
  •   這本書是本領(lǐng)域權(quán)威,值得一讀。
  •   真的很不錯(cuò),這一版更新了很多新的知識(shí)
  •   是經(jīng)典教材,推薦
  •   經(jīng)典課本,紙質(zhì)不錯(cuò),適合學(xué)習(xí)~
  •   厲害真厲害,所以有的時(shí)候買點(diǎn)教材是很好的
  •   與時(shí)俱進(jìn)的教科書,太有用了,經(jīng)典,值得收藏。
  •   發(fā)貨速度慢得不忍直視,整整一周才到,
  •   書是好書,就是速度太慢?;?天時(shí)間才拿到。
  •   每次 送貨 送來的書 就沒讓人舒服過。你就不能給弄個(gè)好包裝啊。。。臥槽
  •   書是經(jīng)典。紙張質(zhì)量差。小心收藏著
  •   有的地方翻譯的真的很難懂,感覺就是google翻譯等翻譯工具翻譯的的,硬邦邦的,最好還是看英文版吧,漢語版只做參考,還發(fā)現(xiàn)第四版和第五版不是一個(gè)人翻譯的,也難怪??!
  •   翻譯的實(shí)在太差,語句都不通,嚴(yán)重懷疑譯者的漢語水平,英語好的還是直接看原版好了
  •   “圣經(jīng)"第5版比第4版強(qiáng)太多了,整個(gè)書拿在手里就有種厚重感,而且這版的翻譯質(zhì)量也有很大提高
  •   可以,推薦買翻譯質(zhì)量很好
  •   書很好!?。±蠋熒险n要求的課程書籍
  •   送貨很快,這本大牛寫的書,拜讀一下
  •   書翻譯的還行,送貨也快。
  •   足足看了兩個(gè)月才搞定,內(nèi)容非常豐富,但理解的過程也困難重重。這本書對(duì)于理解計(jì)算機(jī)系統(tǒng)很有幫助,并且介紹了微處理器設(shè)計(jì)的未來10年的發(fā)展方向,著重介紹了數(shù)據(jù)級(jí)并行
  •   隨機(jī)翻開幾頁(yè),我敢說這書的翻譯過程一定是:譯者不需要知道任何術(shù)語,復(fù)制粘貼到google翻譯,翻譯成中文,譯者覺得通順,于是就出書了。本來想拿一本和英文對(duì)著看,還是直接英文吧。
  •   可惜買來準(zhǔn)備考試不合適
  •   書是好書,就是內(nèi)容看不太懂。跟老師的課件不大一樣,不過可以當(dāng)工具書用
  •   書很好,可是看不懂,心里面還是比較難過的。
  •   很多句子都不通順。。。。
  •   這本書是我看過的最好的課本之一了,即使不是學(xué)這門課的也可以看看
  •   經(jīng)典中的經(jīng)典,難得是與時(shí)俱進(jìn),都是比較新的內(nèi)容,尤其是和云計(jì)算聯(lián)系起來,多核、眾核、GPU計(jì)算都有,值得學(xué)習(xí)
  •   紙張質(zhì)量很好,比機(jī)工社的大理石書強(qiáng)多了。還沒開始讀,讀完再評(píng)價(jià)內(nèi)容。
  •   翻譯質(zhì)量差了點(diǎn)
  •   翻譯簡(jiǎn)直嚴(yán)重影響對(duì)內(nèi)容的理解
  •   系統(tǒng)架構(gòu)的全解
  •   價(jià)格便宜、送貨快、方便
 

250萬本中文圖書簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7