計算機體系結構

出版時間:2003-12-1  出版社:機械工業(yè)出版社  作者:John L.Hennessy,David A.Patterson  頁數(shù):883  
Tag標簽:無  

內(nèi)容概要

The third edition of Computer Architecture: A Quantitative Approach should have been easy to write. After all, our quantitative approach hasn't changed, and we sought to continue our focus on the basic principles of computer design through two editions. The examples had to be updated, of course, just as we did for the second edition. The dramatic and ongoing advances in the field as well as the creation of new markets for computers and new approaches for those markets, however, led us to rewrite almost the entire book. The pace of innovation in computer architecture continued unabated in the six years since the second edition. As when we wrote the second edition, we found that numerous new concepts needed to be introduced, and other material designated as more basic. Although this is officially the third edition of Computer Architecture: A Quantitative Approach, it is really our fifth book in a series that began with the first edition, continued with Computer Organization and Design:The Hardware/Software Interface (COD:HSI), and then the second edition of both books. Over time ideas that were once found here have moved to COD:HSI or to background tutorials in the appendices. This migration, combined with our goal to present concepts in the context of the most recent computers, meant there was remarkably little from the second edition that could be preserved intact, and practically nothing is left from the first edition.

書籍目錄

Chapter 1 Fundamentals of Computer Design1.1 Introduction1.2 The Changing Face of Computing and the Task of the Computer Designer1.3 Technology Trends1.4 Cost, Price, and Their Trends1.5 Measuring and Reporting Performance1.6 Quantitative Principles of Computer Design1.7 Putting It All Together: Performance and Price-Performance1.8 Another View: Power Consumption and Efficiency as the Matric1.9 Fallacies and Pitfalls1.10 Concluding Remarks1.11 Historical Perspective and References ExercisesChapter 2 InStruction Set Prindples and Examples2.1 Introduction2.2 Classifying Instruction Set Architectures2.3 Memory Addressing2.4 Addressing Modes for Signal Processing2.5 Type and Size of Operands2.6 Operands for Media and Signal Processing2.7 Operations in the Instruction Set2.8 Operations for Media and Signal Processing2.9 Instructions for Control Flow2.10 Encoding an Instruction Set2.11 Crosscutting lssues:The Role of Compilers2.12 Putting It All Together:The MIPS Architecture2.1 3 Another View: The Trimedia TM32 CPU2.14 Fallacies and Pitfalls2.15 Concluding Remarks2.16 Historical Perspective and ReferencesExercisesChapter 3 Instruction-Level Parallelism and Its Dynamic Exploitation3.1 Instruction-Level Parallelism:Concepts and Challenges3.2 Overcoming Data Hazards with Dynamic Scheduling3.3 Dynamic Scheduling: Examples and the Algorithm3.4 Reducing Branch Costs with Dynamic Hardware Prediction3.5 High-Performance Instruction Delivery3.6 Taking Advantage of More ILP with Multiple Issue3.7 Hardware-Based Speculation3.8 Studies of the Limitations of ILP3.9 Limitations on ILP for Realizable Processors3.10 Putting It All Together: The P6 Microarchitecture3.11 Another View: Thread-Level Parallelism3.12 Crosscutting lssues: Using an ILP Data Path to Exploit TLP3.13 Fallacies and Pitfalls3.14 Concluding Remarks3.15 Historical Perspective and ReferencesExercisesChapter 4 Exploiting Instruction-Level Parallelism with Software Approaches4.1 Basic Compiler Techniques for Exposing ILP4.2 Static Branch Prediction4.3 Static Multiple Issue: The VLIW Approach4.4 Advanced Compiler Support for Exposing and Exploiting ILP4.5 Hardware Support for Exposing More Parallelism at Compile Time4.6 Crosscutting Issues: Hardware versus SoftwareSpeculation Mechanisms4.7 Putting It All Together:The Intel IA-64 Architecture and Itanium Processor4.8 AnotherView: ILP in the Embedded and Mobile Markets4.9 Fallacies and Pitfalls4.10 Concluding Remarks4.11 Historical Perspective and ReferencesExercisesChapter 5 Memory Hierarchy Design5.1 Introduction5.2 Review of the ABCs of Caches5.3 Cache Performance5.4 Reducing Cache Miss Penalty5.5 Reducing Miss Rate5.6 Reducing Cache Miss Penalty or Miss Rate via Parallelism5.7 Reducing Hit Time5.8 Main Memory and Organizations for Improving Performance5.9 Memory Technology5.10 Virtual Memory5.11 Protection and Examples of Virtual Memory5.12 Crosscutting Issues: The Design of Memory Hierarchies5.13 Putting It All Together: Alpha 21264 Memory Hierarchy5.14 Another View: The Emotion Engine of the Sony Playstation 25.15 Another View: The Sun Fire 6800 Server5.16 Fallacies and Pitfalls5.17 Concluding Remarks5.18 Historical Perspective and ReferencesExercisesChapter 6 Multiprocessors and Thread-Level Parallelism6.1 Introduction6.2 Characteristics of Application Domains6.3 Symmetric Shared-Memory Architectures6.4 Performance of Symmetric Shared-Memory Multiprocessors6.5 Distributed Shared-Memory Architectures6.6 Performance of Distributed Shared-Memory Multiprocessors6.7 Synchronization6.8 Models of Memory Consistency: An Introduction6.9 Multithreading: Exploiting Thread-Level Parallelism within a Processor6.10 Crosscutting Issues6.11 Putting It All Together: Sun's Wildfire Prototype6.12 Another View Multithreading in a Commercial Server6.13 Another View f Embedded Multiprocessors6.14 Fallacies and Pitfalls6.15 Concluding Remarks6.16 Historical Perspective and ReferencesExercisesChapter 7 Storage Systems7.1 Introduction7.2 Types of Storage Devices7.3 Buses--Connecting I/O Devices to CPU/Memory7.4 Reliability, Avai1ability, and Dependability7.5 RAlD: Redundant Arrays of Inexpensive Disks7.6 Errors and Failures in Real Systems7.7 I/O Performance Measures7.8 A Little Queuing Theory7.9 Benchmarks of Storage Performance and Availability7.10 Crosscutting Issues7.11 Designing an I/O System in Five Easy Pieces7.12 Putting It All Together: EMC Symmetrix and Celerra7.13 Another View: Sanyo VPC-SX500 Digital Camera7.14 Fallacies and Pitfalls7.15 Concluding Remarks7.16 Historical Perspective and ReferencesExercisesChapter 8 Interconnection Networks and Clusters8.1 Introduction8.2 A Simple Network8.3 Interconnection Network Media8.4 Connecting More Than Two Computers8.5 Network Topology8.6 Practical Issues for Commercial Interconnection Networks8.7 Examp1es of Interconnection Networks8.8 Internetworking8.9 Crosscutting Issues for Interconnection Networks8.10 Clusters8.11 Designing a C1uster8.12 Putting It All Together: The Google Cluster of PCs8.13 Another View: Inside a Cell Phone8.14 Fallacies and Pitfalls8.15 Concluding Remarks8.16 Historical Perspective and ReferencesExercisesAppendix A Pipelining: Basic and Intermediate ConceptsA.1 IntroductionA.2 The Major Hurdle of Pipelining--Pipeline HazardsA.3 How Is Pipelining Implemented?A.4 What Makes Pipelining Hard to Implement?A.5 Extending the MIPS Pipeline to Handle Multicycle OperationsA.6 Putting It All Together: The MIPS R4000 PipelineA.7 Another View: The MIPS R4300 PipelineA.8 Crosscutting IssuesA.9 Fallacies and PitfallsA.10 Concluding RemarksA.11 Historical Perspective and ReferencesExercisesAppendix B Solutions to Selected ExercisesIntroductionB.1 Chapter 1 SolutionsB.2 Chapter 2 SolutionsB.3 Chapter 3 SolutionsB.4 Chapter 4 SolutionsB.5 Chapter 5 SolutionsB.6 Chapter 6 SolutionsB.7 Chapter 7 SolutionsB.8 Chapter 8 SolutionsB.9 Appendix A SolutionsOnline Appendices (www.mkp.com/CA3/)Appendix C A Survey of RISC Architectures for Desktop, Server,and Embedded ComputersAppendix D An Alternative to RISC:The Intel 80X86Appendix E Another Alternative to RISC:The VAX ArchitectureAppendix F The IBM 360/370 Architecture for Mainframe ComputerAppendix G Vector ProcessorsRevised by Krste AsanovicAppendix H Computer Arithmoticby David GoldbergAppendix I Implementing Coherence ProtocolsReferencesIndex

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    計算機體系結構 PDF格式下載


用戶評論 (總計24條)

 
 

  •   已購版本4,再收藏版本3,版本3主要講ILP,版本4主要講TLP,所以感覺版本3對于ILP的論述更到位。
  •   令人滿意的書!
  •   真的太好了
  •      大學接觸過計算機組成原理,但基本和那玩意兒沒啥關系。這本書算是緊跟潮流,例子基本符合當前水準,會有不少core i7的例子。對于之前對體系結構不熟悉的人來說,閱讀起來非常吃力。還好我基本當做床頭書過了一遍,就當是給自己掃盲了。
       這本書的翻譯不敢恭維,對于英語還ok的推薦閱讀原版,還有再次強調(diào),這本書并不適合新手閱讀...
  •     為了圖速度,就買了中文,太坑了,翻譯完全沒邏輯,請翻譯的老師不要找你的學生翻譯這種經(jīng)典書籍了。還得網(wǎng)上下載原版英文看,更浪費時間,建議直接買英文版,如果英語不太好,那也別買中文版,漢字你是認識,但放在一起,那句子。。。fk 把我整的很凌亂。計算機類的經(jīng)典書籍建議全部看原著,國人翻譯很沒道德,這些教授哪有時間搞翻譯,全是研究生做的 UML那個經(jīng)典也是。。。
  •     翻譯太差,漢字是認識,但句子沒邏輯,很多翻譯 是錯的。還得看原版,浪費時間,教授們沒時間自己翻譯,都是研究生做的。書絕對是經(jīng)典,一定要買原版,不要看翻譯,太坑了。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
  •     每一個搞計算機的必讀之一,如果想讓你的程序運行的快,那么你就讀完這本書。
      這本書會讓你真正的理解什么是cache, cache并不是對程序員是透明的,在編程的時候是需要考慮到的。
      這本書需要讀至少兩遍才能真正體會其中的奧秘。
      這本書是我們公司人手必讀的一本書之一。
  •     我個人認為任何一個學計算機的,你可以不把自己的研究方向設在架構,編譯器等等,但你必須要懂架構,編譯器,操作系統(tǒng)。我個人認為這些東西對于一個CS的人來說不亞于結構,算法,以及標準庫的重要。
      
      我一直覺得英文書比中文書好懂,因為中文書喜歡咬文嚼字裝專業(yè),也或者是譯者害怕出現(xiàn)歧義,字對字翻譯。比如我記得這本書有一個地方說一個什么的好處的時候說的是the attractive of xxx is xxxx, 中文版寫的是xxx的吸引力是xxxx。勺子的吸引力是它比筷子更適合喝湯...這是人類說法的方式嗎?還有更多的例子我記不清了,反正很極品,屬于光讀中文你完全不知道他在說什么,一看英文恍然大悟,給人一種 “你有什么事=U have what thing?”的感覺。。。
      
      架構這種東西其實和工業(yè)界距離很大,貌似從很久很久以前RISC就以統(tǒng)治性的支持率壓倒CISC,學術界一邊倒的全部支持MIPS,蛋似這么多年統(tǒng)領天下的居然是CISC的X86。大家總是酸溜溜的說其實在X86內(nèi)部其實有模仿RISC的翻譯層。但X86和MIPS的差距還是異常的大。如今智能手機和平板幫助ARM打下半邊天下,還算看到點希望,真想知道10年前學架構的人是什么心情。
      
      RISC確實是大勢所趨,一直以為萎的快要死掉的AMD推出個APU大出了風頭,CPU和GPU統(tǒng)一尋址也算加固了NV的陣營,讓從前的X86大戰(zhàn)ARM同時加上了thread level vs data level。
      
      X86自古就問題不少,但Intel瘦死的駱駝比馬大,撐個三年沒什么問題,而且誰知這幾年還會發(fā)生什么,ARM現(xiàn)在這么火不用多說。thread level parallelism還是data level誰優(yōu)誰弱還言之過早。CUDA這幾年如日中天,AMD的APU也來湊熱鬧,但美國國家實驗室的超級計算機還都是thread level的并行,data level僅僅是局部的加速器。冷戰(zhàn)時期的超級計算機都是vector machine,后來發(fā)展出了thread level的并行,然后又跳回的data level。根本問題還是沒解決,就是你究竟有多少部分of 你的code可以做到SIMD。
      
      CUDA雖然火,但我個人認為僅僅是NV宣傳做的好,是個商品不是個好產(chǎn)品,事實上它僅僅是個半成品。舉個最簡單的例子,在thread level并行,我們遇到任何困難,得到的答案都是硬件上的技巧,而在CUDA中,我們遇到任何問題,得到的答案都是一個API。When you face a problem you can not solve, make it someone else's problem. 這就是CUDA。傳統(tǒng)架構中出現(xiàn)問題,會在架構中自省,而在CUDA中出現(xiàn)問題,NV會推給寫軟件的人去解決。
      
      說遠了,這本書很不錯,從最初的pipeline到MIMD再到SIMD。基本所有的技巧都提了,可能會不是很詳細,比如tomasulo,當年我讀了好幾遍都沒讀懂。但人無完人,多搜一搜也就明白了。
  •     “《計算機體系結構:量化研究方法》(第5版)繼續(xù)發(fā)揚傳統(tǒng),為學習計算機體系結構的學生提供了有關當前計算平臺的最新信息,使他們能夠洞悉體系結構,為設計未來系統(tǒng)提供幫助。這一新版本的亮點在于大幅修訂了數(shù)據(jù)級并行章節(jié),用傳統(tǒng)的計算機體系結構術語進行了清晰的解讀,褪去了GPU體系結構的神秘感?!?——Krste Asanovi?,加州大學伯克利校區(qū)
      
      “《計算機體系結構:量化研究方法》是一部經(jīng)典,猶如美酒,久而彌醇。我在本科畢業(yè)時第一次購買了本書,它到現(xiàn)在仍然是我最經(jīng)常參考的書籍之一。當?shù)?版問世時,我發(fā)現(xiàn)其中包含了如此之多的新材料,為了跟上這一領域的最新趨勢,我必須得再買一本。而當我審閱第5版時,我發(fā)現(xiàn)Hennessy和Patterson幾乎是重寫了一遍。全書內(nèi)容都進行了大量更新,對于希望真正理解云和倉庫級計算的人們來說,單憑第6章一章的內(nèi)容,這個新版本就值得一讀。只有Hennessy和Patterson才可能接觸到Google、Amazon、Microsoft、其他云計算與互聯(lián)網(wǎng)級應用提供商的內(nèi)部人士,對這一重要領域,業(yè)內(nèi)再也找不到更出色的介紹材料了。” ——James Hamilton,Amazon Web服務部門
      
      “當研究生們用50000個晶體管制造計算機時,Hennessy和Patterson撰寫了本書的第一版。今天,倉庫級的計算機中包含了許多服務器,每個服務器中包含數(shù)十個獨立處理器和數(shù)十億個晶體管。計算機體系結構一直在不停地快速發(fā)展,而《計算機體系結構:量化研究方法》緊緊跟隨它的步伐,每個版本都準確地解釋和分析了這一領域激動人心的新興重要思想。” ——James Larus,微軟研究院
      
      “這一版新增加了一章非常豐富的內(nèi)容,用來討論向量、SIMD和GPU體系結構中的數(shù)據(jù)級并行。它解釋了暢銷GPU內(nèi)部的關鍵體系結構概念,給出這些概念與傳統(tǒng)術語的對應關系,并與向量和SIMD體系結構進行了對比。這一內(nèi)容非常及時,與業(yè)內(nèi)向GPU并行計算的普遍轉向相適應?!队嬎銠C體系結構:量化研究方法》繼續(xù)發(fā)揚了自己的優(yōu)點——全面地介紹了體系結構方面的重大新進展!” ——John Nickolls,NVIDIA
      
      “本書現(xiàn)在已經(jīng)成為一本經(jīng)典教科書了,這一版突出介紹了顯式并行(數(shù)據(jù)、線程、請求)的優(yōu)勢,用整整一章來描述每一種類型。數(shù)據(jù)并行一章尤為奪目:通過向量SIMD、指令級SIMD和GPU的對比,避開每種體系結構的專用術語,揭示了這些體系結構之間的相似與區(qū)別?!?——Kunle Olukotun,斯坦福大學
      
      “《計算機體系結構:量化研究方法》(第5版)探討了各種并行概念和它們各自在不同方面做出的權衡。和過去的幾個版本一樣,這一新版本中同樣涵蓋了最新的技術發(fā)展趨勢。兩個重點是個人移動設備(PMD)和倉庫級計算(WSC)的爆炸性增長——與原來的性能相比,這里的焦點已經(jīng)轉為尋求在更高層次上達到性能與能效之間的平衡。這些趨勢刺激了人們對更強勁處理功能的需求,而這種需求又推動人們在并行道路上走得更遠?!?——Andrew N. Sloss, Consultant Engineer, ARM ARM System Developer’s Guide一書的作者
  •     看第三版是因為家里已經(jīng)有了。因為實在太厚(比喬布斯傳還厚),拿起來太不方便,于是在網(wǎng)上尋找電子版。結果找到的大都是第4版的了,也挺好的。
      
      第三版是2002年的,第四版這是2006年出版的。從封面的照片上就可以看出不同了:從一根柱子,變成了一堆柱子。
      
      這真是一本與時俱進的教材。由于書的內(nèi)容在不斷增加,作者把前一版的很多內(nèi)容放到附錄中,并且把附錄中的一半部分又都放在了網(wǎng)上。這一版把ISA挪到了附錄中,因為作者認為ISA已經(jīng)不像90年代初那么重要了,從實現(xiàn)方式上講各種ISA的具體實施已經(jīng)非常相似了,都是RISC的做法了。主流的處理器實例則選擇了AMD Athlon, Intel Pentium4, Itanium 2 和Power 5. 在線程級并行中,則對Sun T1 Niagara做了細致的分析。Cache的優(yōu)化仍然是主要內(nèi)容,但加入了虛擬機來表明最新的進展。(也如此得知IBM在虛擬機技術上的領先地位)。
      
      片上多核已經(jīng)是這一版本的主流了,封面上的一堆柱子也反映了這種趨勢。
      
      但是,當我試圖通過作者的主頁發(fā)現(xiàn)更多的進展時,赫然發(fā)現(xiàn),第五版已經(jīng)在2011年下半年發(fā)行了。我也要與時俱進了。
      
  •     最近在關注多核計算機體系結構方面的內(nèi)容,頗感當年讀書不用功,很多基本的東西都忘記了。好在當你讀書記住的東西不多,書倒是不少。于是翻箱倒柜的把這本體系結構的圣經(jīng)給翻了出來。
      
      《計算機體系結構:量化研究方法》不愧是此中的經(jīng)典,把體系結構層次化的展現(xiàn)出來,同時把各種優(yōu)化方法也仔細的介紹,更重要的是用量化的方法來評估各種結構優(yōu)化方法的差異以及適用場景。這種場景對于初學者來說,其方法學的教育意義頗為重要,可以說色奠定了研究的基礎。對于我這種補課的人來說,對被研究的細節(jié)也可以有更加深入細致的了解。
      
      指令集(ISA)和指令集平行(ILP)是基本的內(nèi)容,memory的層次結構下最關注的是Cache,線程級別的并行也是提上日程的技術。從實例處理器來說,集中于MIPS R4K, IA-64, P6。Google的集群也有所涉及。
      
      不過第三版是2002年出版的,對于多核的內(nèi)容實在是比較少,更多的關注與傳統(tǒng)的單核體系結構方向。另外,這書也是在是厚了些,一定要上網(wǎng)找本電子版看看。
      
  •     Computer Architecture的另一個名字是Trade-off??粗麄€體系結構的發(fā)展歷程中種種新技術的使用,無不體現(xiàn)了Trade-off的設計思想。硬件一直都是并行工作的,不管是pipeline, out-of-order, superscale, VLIW, Instruction Level Parallelism抑或是現(xiàn)在的Multicore,硬件的發(fā)展都是為了追求更優(yōu)的性能。整本書的閱讀過程就像是在經(jīng)歷一次冒險,你會被一個個絕妙的新點子、新技術所深深折服。 為了榨干硬件的每一分性能而不懈努力的一群人,他們被稱為Architect。
  •     我只是剛剛開始讀, 但是已經(jīng)明白為什么L1Cache有ICache和DCache之分,為什么有N-way Cache, 為什么Pipeline讓CPU更快, CPU的Pipeline的風險以及解決之道... 總之這本書讓我大開眼界!
  •     書籍說明
      
      計算機體系結構領域最經(jīng)典著作
      
      兩位作者都是該領域的大牛
      
      特別是附錄部分,對計算機硬件的基礎知識有一個全面介紹
      
      適合基礎不好的同學認真閱讀(比如我。。。)
      
      閱讀建議
      
      計算機體系結構最經(jīng)典書籍,適合和第四章結合起來閱讀
      
      另外:
      
      還是英文原版比較靠譜。。。
  •     這本書能夠很全面的介紹計算機體系結構方面的知識,對于有興趣在計算機體系結構,編譯原理等方面進行發(fā)展的學生來說,個人覺得是必看的書。即使你的興趣不在體系結構這個方面,讀這本書對你也會有很大的幫助。
      不過現(xiàn)在已經(jīng)出到第四版了,建議大家還是參考最新的文獻。
  •   白躍彬翻譯的實在是爛透了
  •   到底何為架構?各種架構,惑!
  •   我的理解 control flow+data flow
  •   第五版的中文版將在1月中旬上市
  •   圖靈即將出版這本書的中文版,一月中旬可上市!http://www.ituring.com.cn/book/888
  •   這本書是Hennessy的經(jīng)典之作,權威性毋庸置疑。
    該書是第四版最新版,內(nèi)容“與時俱進”,做了些修正,絕大部分經(jīng)典內(nèi)容當然還是做了保留。
    與前一版不同的是,這一版把一些不是基礎性的內(nèi)容收進了光盤之中,這樣減小了塊頭,便于攜帶和閱讀,挺不錯的。
    推薦該書的一個在線學習中心:http://bbs.theithome.com/thread-htm-fid-112.html
  •   暈,ls給的學習中心毫無人氣呀。。。
  •   我只記得里面的八卦了,看來要重新翻翻才行。
  •   這本書我也大致的瀏覽了一下,發(fā)現(xiàn)還不錯,可惜只有英文原版的電子書,狠了一下心就直接讀英文的了。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7