面向千萬(wàn)億次計(jì)算的算法與應(yīng)用

出版時(shí)間：2008-8-1 出版社：清華大學(xué)出版社作者：（美）巴德?tīng)?nbsp; 頁(yè)數(shù)：356 譯者：都志輝等
Tag標(biāo)簽：無(wú)

前言

在過(guò)去的幾十年內(nèi)，在高性能計(jì)算應(yīng)用、算法和體系結(jié)構(gòu)的支持下，在科學(xué)、工程和社會(huì)領(lǐng)域發(fā)生了許多突破性的進(jìn)展。這些強(qiáng)有力的工具為研究人員、教育工作者和實(shí)踐工作者提供了這樣的能力，就是通過(guò)計(jì)算，可以把從全球收集獲得的數(shù)據(jù)，轉(zhuǎn)換為解決我們社會(huì)最具有挑戰(zhàn)性問(wèn)題的解決方案。持續(xù)推動(dòng)高性能計(jì)算發(fā)展的一支重要的力量是針對(duì)“前沿性里程碑”問(wèn)題產(chǎn)生的一些社團(tuán)聯(lián)盟，比如它們會(huì)提出代表這一領(lǐng)域下一階段進(jìn)展的技術(shù)目標(biāo)。在19世紀(jì)90年代，高性能計(jì)算組織希望實(shí)現(xiàn)萬(wàn)億次（每秒1012的浮點(diǎn)操作）的計(jì)算能力，萬(wàn)億次計(jì)算導(dǎo)致了一些新的發(fā)現(xiàn)，比如設(shè)計(jì)新的藥物來(lái)對(duì)抗艾滋病和其他的疾?。粚?duì)自然現(xiàn)象的仿真可以達(dá)到前所未有的精度，比如地震和颶風(fēng)；對(duì)大系統(tǒng)，比如宇宙，和小系統(tǒng)，比如比細(xì)胞還小的一些系統(tǒng)有了更好的理解；現(xiàn)在我們將要在于萬(wàn)億次（每秒1015的浮點(diǎn)操作）級(jí)別的機(jī)器上進(jìn)行計(jì)算。一些研究組織正在考慮億億次（每秒1018的浮點(diǎn)操作）級(jí)別的計(jì)算將會(huì)是什么樣子，他們處在這一研究的早期階段。在走向“下一個(gè)前沿計(jì)算”的過(guò)程中，一個(gè)假設(shè)就是高性能計(jì)算體系結(jié)構(gòu)的下一個(gè)研究前沿將會(huì)提供新的極大的容量和能力，這將使得以前需要大量資源但是又得不到滿足的用戶直接受益，同時(shí)對(duì)其他的用戶將帶來(lái)長(zhǎng)期的裨益。但是大規(guī)模高性能計(jì)算用戶都知道，高效使用前沿超級(jí)計(jì)算系統(tǒng)能力，同不斷增加系統(tǒng)容量和能力相比，如果不是同等重要，就是重要性更高，我們需要投入大量的時(shí)間、人力、軟件和硬件基礎(chǔ)設(shè)施來(lái)充分利用這些非同尋常的系統(tǒng)。經(jīng)驗(yàn)表明，通過(guò)開(kāi)發(fā)可擴(kuò)展的算法，模型，仿真，分析，庫(kù)和應(yīng)用組件，可以充分利用這些前沿系統(tǒng)所提供的容量和能力，因此它與建造和部署該前沿系統(tǒng)本身一樣，是非常具有挑戰(zhàn)性的工作。對(duì)于未來(lái)幾年內(nèi)可以支持千萬(wàn)億次操作的應(yīng)用程序代碼，不管用什么樣的處理器技術(shù)，將會(huì)需要幾十萬(wàn)個(gè)甚至更多的處理器核心。目前，幾乎還沒(méi)有可以很容易擴(kuò)展到這種規(guī)模的高性能計(jì)算程序代碼，大量的程序代碼開(kāi)發(fā)工作對(duì)于挖掘新的千萬(wàn)億次系統(tǒng)的潛能是非常重要的。擴(kuò)展到千萬(wàn)億次系統(tǒng)涉及的工作包括：提高物理模型，數(shù)學(xué)抽象，近似和其他的應(yīng)用組件。我們需要提高各種解決方案的算法來(lái)增加結(jié)果的準(zhǔn)確性。輸入數(shù)據(jù)集需要在分辨率上進(jìn)行提高（產(chǎn)生更多的數(shù)據(jù)），或者是用于測(cè)量的輸入數(shù)據(jù)的精度需要提高。每一個(gè)應(yīng)用或者算法的提高都會(huì)給開(kāi)發(fā)千萬(wàn)億次代碼帶來(lái)實(shí)質(zhì)性的挑戰(zhàn)，會(huì)從新應(yīng)用執(zhí)行得到的領(lǐng)域結(jié)果中推動(dòng)新的計(jì)算機(jī)科學(xué)的發(fā)現(xiàn)。本書(shū)是那些在千萬(wàn)億次計(jì)算領(lǐng)域前沿性研究成果的結(jié)晶。作者試圖通過(guò)匯集在高性能計(jì)算和計(jì)算科學(xué)領(lǐng)域最成熟和已積累豐富經(jīng)驗(yàn)的應(yīng)用的最新成果，來(lái)解決在開(kāi)發(fā)千萬(wàn)億次系統(tǒng)應(yīng)用代碼中的一些挑戰(zhàn)性問(wèn)題，這些應(yīng)用能夠在新的千萬(wàn)億次系統(tǒng)產(chǎn)生和部署之前，就提前針對(duì)其體系結(jié)構(gòu)的特點(diǎn)來(lái)進(jìn)行開(kāi)發(fā)。開(kāi)發(fā)千萬(wàn)億次應(yīng)用將會(huì)需要豐富的關(guān)于千萬(wàn)億次系統(tǒng)硬件和系統(tǒng)軟件方面的知識(shí)，我們需要大量的時(shí)間來(lái)做擴(kuò)展，測(cè)試，評(píng)估以及優(yōu)化千萬(wàn)億次代碼、庫(kù)、算法、系統(tǒng)軟件的工作，所有這些工作都將基于即將構(gòu)建的新系統(tǒng)來(lái)進(jìn)行。

內(nèi)容概要

在過(guò)去的幾十年內(nèi)，在高性能計(jì)算應(yīng)用、算法和體系結(jié)構(gòu)的支持下，科學(xué)、工程和社會(huì)領(lǐng)域發(fā)生了許多突破性的進(jìn)展。本書(shū)是那些在千萬(wàn)億次計(jì)算領(lǐng)域前沿性研究成果的結(jié)晶。作者試圖通過(guò)匯集在高性能計(jì)算和計(jì)算科學(xué)領(lǐng)域最成熟和已積累豐富經(jīng)驗(yàn)的應(yīng)用的最新成果，來(lái)解決在開(kāi)發(fā)千萬(wàn)億次系統(tǒng)應(yīng)用代碼中的一些挑戰(zhàn)性應(yīng)用，這些應(yīng)用能夠在新的千萬(wàn)億次系統(tǒng)產(chǎn)生和部署之前，就提前針對(duì)其體系結(jié)構(gòu)的特點(diǎn)來(lái)進(jìn)行開(kāi)發(fā)。開(kāi)發(fā)千萬(wàn)億次應(yīng)用需要豐富的關(guān)于千萬(wàn)億次系統(tǒng)硬件和系統(tǒng)軟件方面的知識(shí)，需要大量的時(shí)間來(lái)做擴(kuò)展、測(cè)試、評(píng)估以及優(yōu)化千萬(wàn)億次代碼、庫(kù)、算法、系統(tǒng)軟件的工作。所有這些工作都將基于即將構(gòu)建的新系統(tǒng)來(lái)進(jìn)行。    對(duì)于高性能計(jì)算來(lái)說(shuō)，這是一個(gè)激動(dòng)人心的時(shí)代，這個(gè)時(shí)代將會(huì)在一個(gè)新的規(guī)模和尺度上產(chǎn)生大量史無(wú)前例的新發(fā)現(xiàn)，這些發(fā)現(xiàn)將會(huì)對(duì)科學(xué)和社會(huì)帶來(lái)切實(shí)的好處。本書(shū)可以讓你對(duì)千萬(wàn)億次應(yīng)用和算法前沿性挑戰(zhàn)性研究工作的第一次浪潮有一個(gè)概觀，為目前和未來(lái)的千萬(wàn)億次研究提供非常必要的基礎(chǔ)。

作者簡(jiǎn)介

David A Bader是高性能計(jì)算所的所長(zhǎng)，教授，長(zhǎng)期從事計(jì)算科學(xué)與工程領(lǐng)域研究，該研究所隸屬于佐治亞理工學(xué)院計(jì)算學(xué)部。他在1996年從馬里蘭大學(xué)（University of Ma ryland）獲得博士學(xué)位，后贏得美國(guó)國(guó)家自然科學(xué)基金支持在實(shí)驗(yàn)計(jì)算機(jī)科學(xué)方面從事博士后研究。他獲得了美國(guó)自然科學(xué)基金CAREER支持，是IEEE計(jì)算機(jī)學(xué)會(huì)優(yōu)秀訪問(wèn)人員計(jì)劃中的杰出演講者，是IBM PERCS組DARPA高吞吐率計(jì)算機(jī)系統(tǒng)計(jì)劃項(xiàng)目組的成員，佐治亞理工學(xué)院sony-Toshlba-IBM  CeII處理器中心的主任。他還是Internet2研究顧問(wèn)委員會(huì)的成員，是IPDPS和HiPC會(huì)議指導(dǎo)委員會(huì)的成員，作為主席組織了很多高性能計(jì)算以及計(jì)算科學(xué)與工程方面的會(huì)議。Bader博士是許多高級(jí)重要出版物的編輯，包括IEEE Transactions on Parallel and Distributed Systems，ACM Journal of Experimental Algorithmics，IEEE DSOnline，以及Parallel Computing。他是IEEE計(jì)算機(jī)協(xié)會(huì)的資深會(huì)員，ACM會(huì)員。     
    Bader博士在用高性能計(jì)算解決生物信息學(xué)以及計(jì)算基因問(wèn)題方面是取得前沿性研究成果的科學(xué)家。他作為聯(lián)合主席主持了高性能計(jì)算生物學(xué)IEEE International Workshop on High-Performance ComDurational Biology（HiCOMB）的系列會(huì)議，曾為幾本書(shū)撰寫了部分章節(jié)，聯(lián)合編輯Journal of Parallel and Distributed Computing（JPDC）和IEEE Transactions on Parallel and Distributed Systems（TPD5）在高性能計(jì)算生物學(xué)方面研究的專刊。他還是80余篇被同行審閱過(guò)的期刊論文、會(huì)議論文的作者，他的主要研究領(lǐng)域是并行算法，組合優(yōu)化，計(jì)算生物學(xué)與計(jì)算基因?qū)W。

書(shū)籍目錄

第1章  千萬(wàn)億次計(jì)算科學(xué)應(yīng)用的性能特征  1.1  介紹  1.2  測(cè)試的各種體系結(jié)構(gòu)  1.3  科學(xué)應(yīng)用概述  1.4  GTC：Particle-in-Cell磁融解  1.5  ELBM3D：晶格玻耳茲曼流體動(dòng)力學(xué)  1.6  Cactus：通用的相對(duì)天體物理學(xué)  1.7  PARATEC：材料科學(xué)的第一原理  1.8  HyperCLaw：雙曲AMR氣體動(dòng)力學(xué)  1.9  總結(jié)與結(jié)論  1.10  致謝  參考文獻(xiàn)第2章  千萬(wàn)億次的計(jì)算對(duì)NASA未來(lái)使命的影響  2.1  介紹  2.2  Columbia超級(jí)計(jì)算機(jī)  2.3  航空宇宙分析及計(jì)算    2.3.1  方法論    2.3.2  結(jié)果    2.3.3  NASA使用千萬(wàn)億次計(jì)算的好處  2.4  推進(jìn)子系統(tǒng)分析    2.4.1  方法    2.4.2  結(jié)果    2.4.3  千萬(wàn)億次計(jì)算給NASA帶來(lái)的益處  2.5  颶風(fēng)預(yù)測(cè)    2.5.1  方法    2.5.2  結(jié)果    2.5.3  千萬(wàn)億計(jì)算對(duì)NASA的益處  2.6  瓶頸  2.7  總結(jié)  參考文獻(xiàn)第3章  多物理模擬與千萬(wàn)億次計(jì)算  3.1  引言  3.2  下一代超級(jí)計(jì)算機(jī)  3.3  適用于大規(guī)模并行機(jī)的編程模型    3.3.1  新型并行語(yǔ)言    3.3.2  MPI-2    3.3.3  協(xié)作式并行    3.3.4  協(xié)作式并行的應(yīng)用實(shí)例  3.4  多尺度算法    3.4.1  并行的多重網(wǎng)格方法    3.4.2  ALE-AMR離散化    3.4.3  離散-連續(xù)統(tǒng)混合算法  3.5  目前及將來(lái)的應(yīng)用    3.5.1  萬(wàn)億次仿真的技術(shù)現(xiàn)狀    3.5.2  通過(guò)協(xié)作并行進(jìn)行多物理模擬  3.6  未來(lái)展望  3.7  致謝  參考文獻(xiàn)第4章  針對(duì)Uintah多物理程序代碼的可擴(kuò)展并行AMR算法研究  4.1  前言  4.2  自適應(yīng)格網(wǎng)優(yōu)化  4.3  Uintah程序框架    4.3.1  仿真組件    4.3.2  負(fù)載均衡器    4.3.3  調(diào)度器  4.4  格網(wǎng)重構(gòu)器  4.5  提高性能  4.6  將來(lái)的工作  4.7  致謝  參考文獻(xiàn)第5章  使用Enzo對(duì)宇宙進(jìn)化進(jìn)行仿真  5.1  宇宙結(jié)構(gòu)的形成  5.2  Enzo的編碼    5.2.1  物理層建模和數(shù)值算法    5.2.2  自適應(yīng)格網(wǎng)細(xì)化    5.2.3  實(shí)現(xiàn)    5.2.4  并行化    5.2.5  快速的鄰居格網(wǎng)搜索    5.2.6  Enzo的I/O  5.3  在萬(wàn)億次平臺(tái)上的性能和可擴(kuò)展性    5.3.1  單格網(wǎng)應(yīng)用    5.3.2  AMR應(yīng)用    5.3.3  并行展  5.4  將Enzo運(yùn)行在萬(wàn)億次計(jì)算機(jī)平臺(tái)上    5.4.1  新的AMR數(shù)據(jù)結(jié)構(gòu)    5.4.2  混合型并行    5.4.3  天體運(yùn)動(dòng)和宇宙射線之間的隱性關(guān)聯(lián)    5.4.4  內(nèi)部數(shù)據(jù)關(guān)系分析工具  5.5  致謝  參考文獻(xiàn)第6章  重大影響天氣現(xiàn)象數(shù)值預(yù)測(cè)：千萬(wàn)億次計(jì)算的重要?jiǎng)恿? 6.1  引言  6.2  計(jì)算方法和工具    6.2.1  區(qū)域性天氣預(yù)測(cè)模型    6.2.2  千萬(wàn)億系統(tǒng)中的內(nèi)存和性能問(wèn)題    6.2.3  分布式內(nèi)存并行和消息傳遞    6.2.4  負(fù)載均衡    6.2.5  時(shí)間消耗和可擴(kuò)展性    6.2.6  NWP系統(tǒng)中其他重要的組件    6.2.7  其他問(wèn)題  6.3  NWP實(shí)際應(yīng)用例子    6.3.1  大規(guī)模的天氣預(yù)報(bào)    6.3.2  高分辨率的龍卷風(fēng)仿真    6.3.3  通過(guò)觀測(cè)現(xiàn)象對(duì)龍卷風(fēng)進(jìn)行預(yù)測(cè)  6.4  數(shù)值天氣預(yù)報(bào)的挑戰(zhàn)和需求  6.5  總結(jié)  6.6  致謝  參考文獻(xiàn)第7章  千萬(wàn)億次氣象科學(xué)應(yīng)用的軟件設(shè)計(jì)  7.1  介紹  7.2  氣象科學(xué)  7.3  千萬(wàn)億次計(jì)算機(jī)的體系結(jié)構(gòu)  7.4  區(qū)域氣象系統(tǒng)模型CCSM(Community Climate System Model)    7.4.1  當(dāng)前CCSM概述    7.4.2  區(qū)域大氣模型CAM(CommunityAtmosphere Model)    7.4.3  并行海洋程序POP(Parallel Ocean Program)    7.4.4  區(qū)域陸地模型    7.4.5  社區(qū)海洋冰川模型    7.4.6  模型的耦合  7.5  總結(jié)  7.6  致謝  參考文獻(xiàn)第8章  邁向分布式千萬(wàn)億次計(jì)算  8.1  引言  8.2  網(wǎng)格計(jì)算  8.3  基于網(wǎng)格的千萬(wàn)億次計(jì)算  8.4  虛擬銀河    8.4.1  銀河的多物理學(xué)模型    8.4.2  銀河仿真的性能模型    8.4.3  千萬(wàn)億次虛擬銀河仿真  8.5  討論與總結(jié)  參考文獻(xiàn)第9章  千萬(wàn)億次計(jì)算時(shí)代的生物分子建模  9.1  引言  9.2  NAMD的設(shè)計(jì)    9.2.1  混合分解    9.2.2  動(dòng)態(tài)負(fù)載平衡  9.3  面對(duì)千萬(wàn)億次的挑戰(zhàn)與所需的改進(jìn)    9.3.1  目前的性能    9.3.2  在未來(lái)千萬(wàn)億次機(jī)器上的性能    9.3.3  協(xié)處理器加速  9.4  生物分子應(yīng)用    9.4.1  水通道蛋白    9.4.2  鉀通道    9.4.3  病毒    9.4.4  核糖體    9.4.5  色素體    9.4.6  BAR域囊泡  9.5  總結(jié)  9.6  致謝  參考文獻(xiàn)第10章  用于分子動(dòng)力學(xué)模擬的千萬(wàn)億次計(jì)算機(jī)  10.1  介紹  10.2  MDGRAPE-3的硬件  10.3  MDGRAPE-3進(jìn)行的計(jì)算  10.4  MDGRAPE-3的芯片    10.4.1  力計(jì)算流水線    10.4.2  粒子j的內(nèi)存和控制單元    10.4.3  芯片說(shuō)明  10.5  系統(tǒng)結(jié)構(gòu)  10.6  MDGRAPE-3的軟件  10.7  MDGRAPE-3的性能  10.8  總結(jié)和展望  10.9  致謝  參考文獻(xiàn)第11章  在千萬(wàn)億次超級(jí)計(jì)算機(jī)上進(jìn)行生物分子仿真  11.1  引言  11.2  機(jī)遇    11.2.1  研究更大生物分子系統(tǒng)的能力    11.2.2  研究更長(zhǎng)時(shí)間范圍的能力    11.2.3  混合量子與經(jīng)典仿真    11.2.4  更精確的仿真  11.3  挑戰(zhàn)    11.3.1  在大于100K數(shù)量的處理器上擴(kuò)大生物分子模擬代碼的規(guī)模    11.3.2  適應(yīng)硬件的變化    11.3.3  容錯(cuò)性    11.3.4  包含可配置計(jì)算的多范型硬件    11.3.5  千萬(wàn)億次計(jì)算帶來(lái)的新的仿真方法  11.4  總結(jié)和展望  11.5  致謝  參考文獻(xiàn)第12章  處理大規(guī)模圖的多線程算法  12.1  引言    12.1.1  圖運(yùn)算中的問(wèn)題    12.1.2  分布式存儲(chǔ)圖運(yùn)算的擴(kuò)展局限性  12.2  Cray MTA-2平臺(tái)    12.2.1  并行性表示    12.2.2  對(duì)細(xì)粒度同步的支持  12.3  案例分析：最短路徑算法    12.3.1  初步分析    12.3.2  △-分步算法    12.3.3  Thorup算法    12.3.4  實(shí)驗(yàn)結(jié)果  12.4  案例分析：連通分量    12.4.1  傳統(tǒng)PRAM算法    12.4.2  Kahan的多層次算法    12.4.3  性能比較  12.5  結(jié)論  12.6  致謝  參考文獻(xiàn)第13章  千萬(wàn)億次計(jì)算中的災(zāi)難恢復(fù)算法研究  13.1  FT-MPI：一個(gè)實(shí)現(xiàn)容錯(cuò)功能的MPI    13.1.1  FT-MPI概述    13.1.2  FT-MPI：一個(gè)實(shí)現(xiàn)容錯(cuò)功能的MPI    13.1.3  FT-MPI的使用  13.2  應(yīng)用級(jí)的無(wú)盤檢查點(diǎn)技術(shù)    13.2.1  基于鄰居的檢查點(diǎn)方案    13.2.2  基于校驗(yàn)和的檢查點(diǎn)方案    13.2.3  基于加權(quán)校驗(yàn)和的檢查點(diǎn)方案  13.3  一種容錯(cuò)的遞歸方程求解器    13.3.1  有條件的共軛梯度算法    13.3.2  將容錯(cuò)機(jī)制添加到PCG算法中  13.4  實(shí)驗(yàn)評(píng)估    13.4.1  使用不同MPI實(shí)現(xiàn)的PCG算法的性能    13.4.2  設(shè)置檢查點(diǎn)的性能開(kāi)銷    13.4.3  執(zhí)行恢復(fù)操作的性能開(kāi)銷    13.4.4  恢復(fù)操作中的舍入錯(cuò)誤所帶來(lái)的數(shù)值影響  13.5  討論  13.6  結(jié)論和未來(lái)工作  參考文獻(xiàn)第14章  TSUBAME的研制與未來(lái)發(fā)展  14.1  引言-2通向TSUBAME之路  14.2  TSUBAME的架構(gòu)需求  14.3  TSUBAME一瞥  14.4  TSUBAME之旅——使世人皆能超級(jí)計(jì)算的性能和操作  14.5  結(jié)論和展望—TSUBAME 2.0  參考文獻(xiàn)第15章  通過(guò)SMP模塊構(gòu)造千萬(wàn)億次的性能  15.1  引言  15.2  OpenMP編程體系結(jié)構(gòu)  15.3  通過(guò)OpenMP實(shí)現(xiàn)的循環(huán)級(jí)并行  15.4  C++與OpenMP    15.4.1  迭代循環(huán)    15.4.2  ccNUMA的關(guān)鍵問(wèn)題    15.4.3  并行化面向?qū)ο蟠a    15.4.4  線程安全性  15.5  應(yīng)用OpenMe實(shí)現(xiàn)嵌套并行化    15.5.1  目前OpenMP規(guī)范中的嵌套并行化    15.5.2  FIRE的基于目錄圖像修復(fù)    15.5.3  多塊CFD數(shù)據(jù)集中3D關(guān)鍵點(diǎn)的計(jì)算    15.5.4  TFS流體求解器  15.6  結(jié)論與展望參考文獻(xiàn)第16章  千萬(wàn)億次系統(tǒng)的性能及其復(fù)雜性分析  16.1  引言  16.2  千萬(wàn)億次系統(tǒng)體系結(jié)構(gòu)的發(fā)展趨勢(shì)及其并發(fā)度  16.3  性能特征和基準(zhǔn)測(cè)試的現(xiàn)狀    16.3.1  基準(zhǔn)測(cè)試創(chuàng)新    16.3.2  應(yīng)用程序的性能特征    16.3.3  性能復(fù)雜性和性能效能的測(cè)量  16.4  APEX-MAIP    16.4.1  APEX-Map的設(shè)計(jì)原則    16.4.2  并行編程范式與APEX-MAP的對(duì)比  16.5  性能復(fù)雜性特征描述    16.5.1  性能復(fù)雜度定義    16.5.2  性能模型選擇    16.5.3  若干并行系統(tǒng)的性能復(fù)雜性分析  16.6  小結(jié)  參考文獻(xiàn)第17章  高度可擴(kuò)展的性能分析工具  17.1  引言  17.2  性能分析概念回顧  17.3  Paradyn  17.4  SCAlASCA  17.5  Vampir Next Generation  17.6  Periscope    17.6.1  體系結(jié)構(gòu)    17.6.2  ASL性能屬性描述    17.6.3  Periscope結(jié)點(diǎn)代理    17.6.4  性能屬性搜索    17.6.5  Peirscope高層代理    17.6.6  代理通信基礎(chǔ)構(gòu)造    17.6.7  評(píng)價(jià)  17.7  工具對(duì)比和未來(lái)研究  參考文獻(xiàn)第18章  面向千萬(wàn)億次計(jì)算規(guī)模的多級(jí)有限元求解器  18.1  引言    18.1.1  概述    18.1.2  千萬(wàn)億次架構(gòu)示例  18.2  設(shè)計(jì)范例    18.2.1  分層混合格網(wǎng)    18.2.2  ParExPDE  18.3  評(píng)估與比較  18.4  結(jié)論  參考文獻(xiàn)第19章  高效有限元代碼開(kāi)發(fā)的混合方法  19.1  簡(jiǎn)介  19.2  高級(jí)應(yīng)用代碼  19.3  代碼生成    19.3.1  元編程    19.3.2  變分問(wèn)題的實(shí)時(shí)編譯    19.3.3  FFC    19.3.4  SyFi  19.4  有限元集成的統(tǒng)一框架    19.4.1  有限元集成    19.4.2  UFC接口    19.4.3  實(shí)現(xiàn)UFC接口  19.5  總結(jié)  19.6  致謝  參考文獻(xiàn)第20章  使用Charm++編寫千萬(wàn)億次應(yīng)用程序  20.1  動(dòng)機(jī)  20.2  Charm++和AMPI：編程模型    20.2.1  動(dòng)態(tài)負(fù)載均衡    20.2.2  投影    20.2.3  其他特性概述  20.3   Charm++應(yīng)用程序    20.3.1  NAMD    20.3.2  LeanCP    20.3.3  ChaNGa    20.3.4  其他應(yīng)用  20.4  大型系統(tǒng)仿真  20.5  新型并行語(yǔ)言  20.6  總結(jié)  20.7  致謝  參考文獻(xiàn)第21章  基于注解的高產(chǎn)出率和性能移植性  21.1  引言  21.2  實(shí)現(xiàn)    21.2.1  總體設(shè)計(jì)    21.2.2  注解語(yǔ)法    21.2.3  系統(tǒng)擴(kuò)展    21.2.4  代碼生成模塊  21.3  性能研究    21.3.1  STREAM基準(zhǔn)測(cè)試    21.3.2  AXPY操作  21.4  相關(guān)工作    21.4.1  自調(diào)節(jié)的庫(kù)和代碼    21.4.2  編譯器方法    21.4.3  性能相關(guān)的用戶注解  21.5  總結(jié)與未來(lái)的方向  21.6  致謝  參考文獻(xiàn)第22章  高效能編程語(yǔ)言的局部性感知特性  22.1  引言  22.2  Chapel中關(guān)于數(shù)據(jù)并行化的基本概念    22.2.1  域    22.2.2  數(shù)組  22.3  數(shù)據(jù)分布    22.3.1  基本方法    22.3.2  “分布”接口    22.3.3  局部存儲(chǔ)對(duì)象上的分配策略  22.4  實(shí)例與討論    22.4.1  一個(gè)負(fù)載平衡塊分布    22.4.2  一個(gè)稀疏數(shù)據(jù)分布  22.5  實(shí)現(xiàn)    22.5.1  編譯器實(shí)現(xiàn)進(jìn)展    22.5.2  分布實(shí)現(xiàn)策略  22.6  相關(guān)工作  22.7  結(jié)論和未來(lái)展望  22.8  致謝  參考文獻(xiàn)第23章  體系結(jié)構(gòu)與程序設(shè)計(jì)方法對(duì)獲得持續(xù)千萬(wàn)億次計(jì)算性能的影響  23.1  引言  23.2  數(shù)值計(jì)算和計(jì)算機(jī)發(fā)展的歷史簡(jiǎn)介    23.2.1  20世紀(jì)60年代    23.2.2  20世紀(jì)70年代    23.2.3  20世紀(jì)80年代    23.2.4  20世紀(jì)90年代    23.2.5  2000年及以后  23.3  體系結(jié)構(gòu)    23.3.1  處理器發(fā)展    23.3.2  Cell Broad Engine處理器    23.3.3  ClearSpeed卡    23.3.4  類向量體系結(jié)構(gòu)    23.3.5  能耗和成本因素    23.3.6  通信網(wǎng)絡(luò)    23.3.7  通信協(xié)議和并行范式  23.4  超大型計(jì)算機(jī)的算法    23.4.1  大規(guī)模計(jì)算機(jī)    23.4.2  Linpack局限性    23.4.3  選擇算法實(shí)現(xiàn)方法  23.5  其他技術(shù)的影響  參考文獻(xiàn)第24章  Cactus框架：從黑洞到伽瑪射線脈沖  24.1  相對(duì)天體物理學(xué)目前的挑戰(zhàn)和伽瑪射線脈沖問(wèn)題  24.2   Cactus框架  24.3  時(shí)空代碼和流體動(dòng)力學(xué)代碼    24.3.1  Ccatie：時(shí)空進(jìn)化    24.3.2  Whisky：廣義相對(duì)論流體動(dòng)力學(xué)  24.4  并行化的實(shí)現(xiàn)和格網(wǎng)細(xì)化    24.4.1  PUGH    24.4.2  使用Carpet實(shí)現(xiàn)自適應(yīng)格網(wǎng)細(xì)化    24.4.3  I/O  24.5  當(dāng)前機(jī)器的擴(kuò)展性    24.5.1  浮點(diǎn)性能    24.5.2  I/O性能  24.6  在千萬(wàn)億次計(jì)算上的發(fā)展    24.6.1  物理學(xué)：輻射傳輸    24.6.2  擴(kuò)展性    24.6.3工具  24.7  致謝  參考文獻(xiàn)

章節(jié)摘錄

1.5　ELBM3D：晶格玻耳茲曼流體動(dòng)力學(xué)LBM：（Lattice-Boltzmann methods）晶格玻耳茲曼方法已經(jīng)證明是傳統(tǒng)數(shù)值方法的一種很好的替代，也可以用于模擬流體以及對(duì)流動(dòng)物理學(xué)進(jìn)行建模[29]。其基本的想法就是開(kāi)發(fā)一個(gè)簡(jiǎn)單的動(dòng)力學(xué)模型，結(jié)合內(nèi)在的物理過(guò)程，可以重新產(chǎn)生正確的宏觀平均特性。從19世紀(jì)80年代中期以來(lái)，這些算法得到了廣泛的應(yīng)用，用于模擬Navier-Stokes流，最近擴(kuò)展到可以處理多項(xiàng)流、反作用流、擴(kuò)散過(guò)程和磁發(fā)電機(jī)流體力學(xué)。正像從顯式算法中可以得到的那樣，當(dāng)一個(gè)算法推向更高的雷諾數(shù)的時(shí)候，LBM趨向于數(shù)值非線性不穩(wěn)態(tài)。這些數(shù)值不穩(wěn)態(tài)會(huì)上升，因?yàn)闆](méi)有強(qiáng)加的約束會(huì)促使分布函數(shù)保持非負(fù)。熵LBM算法可以保持分布函數(shù)的非負(fù)性，即使在任意小的傳輸系數(shù)約束的情況下也是這樣，該算法已被用于Navier-Stokes湍流[2]，而且已經(jīng)被結(jié)合到了最近開(kāi)發(fā)的代碼之中［30］。LBM方式使得很困難的邊界幾何（比如通過(guò)使用邊界返回的策略來(lái)模擬沒(méi)有滑動(dòng)墻的情況）的實(shí)現(xiàn)變得比較容易。這里我們介紹周期邊界條件下的三維模擬情況，其空間格網(wǎng)和相空間向量格子相互重疊在一起。每一個(gè)格子點(diǎn)和一些mesoscopic變量關(guān)聯(lián)在一起，其值與流方向數(shù)量成比例，并且存儲(chǔ)在向量中。該格子被劃分到一個(gè)三維笛卡兒處理器網(wǎng)狀拓?fù)浣Y(jié)構(gòu)上，用MPI來(lái)實(shí)現(xiàn)通信，圖1-3（a）展示的是一個(gè)通信拓?fù)涞那闆r，重點(diǎn)強(qiáng)調(diào)了相對(duì)稀疏的通信模式。對(duì)這種情況的大多數(shù)模擬，都是通過(guò)擴(kuò)展邊界區(qū)域空間來(lái)存儲(chǔ)從鄰居處理器獲得的數(shù)據(jù)拷貝。對(duì)于ELBM3D，為了使得碰撞過(guò)程滿足一定的約束條件，需要在每一個(gè)迭代步對(duì)每一個(gè)格網(wǎng)點(diǎn)求解一個(gè)非線性方程。由于這一方程需要對(duì)分布函數(shù)的各個(gè)組成部分求對(duì)數(shù)，因此整個(gè)算法的性能就特別受限于log（）函數(shù)的性能。圖1-3（a）展示的ELBM3D的連接關(guān)系，在結(jié)構(gòu)上與Cactus非常接近，但是由于代碼周期性邊界條件的不同，其通信模式上就有細(xì)微的差異。從同構(gòu)性的角度看，該拓?fù)渑c格網(wǎng)或者環(huán)互連拓?fù)溆泻艽蟛煌?，但是?duì)于胖樹(shù)或者互連開(kāi)關(guān)這樣的全互連網(wǎng)絡(luò)，它對(duì)可得的對(duì)分帶寬的占用非常有限。圖1.3（c）表明，和]Cactus一樣，ELBM3D主要的通信形式是點(diǎn)到點(diǎn)通信，但是圖1.3（b）表明點(diǎn)到點(diǎn)消息緩沖區(qū)的空間很大，因此它受帶寬的限制很大。

編輯推薦

對(duì)于高性能計(jì)算來(lái)說(shuō)，這是一個(gè)激動(dòng)人心的時(shí)代，這個(gè)時(shí)代將會(huì)在一個(gè)新的規(guī)模和尺度上產(chǎn)生大量史無(wú)前例的新發(fā)現(xiàn)，這些發(fā)現(xiàn)將會(huì)對(duì)科學(xué)和社會(huì)帶來(lái)切實(shí)的好處?！睹嫦蚯f(wàn)億次計(jì)算的算法與應(yīng)用》可以讓你對(duì)千萬(wàn)億次應(yīng)用和算法前沿性挑戰(zhàn)性研究工作的第一次浪潮有一個(gè)概觀，為目前和未來(lái)的千萬(wàn)億次研究提供非常必要的基礎(chǔ)。

圖書(shū)封面

圖書(shū)標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載

還沒(méi)讀過(guò)(49)
勉強(qiáng)可看(360)
一般般(615)
內(nèi)容豐富(2550)
強(qiáng)力推薦(209)

面向千萬(wàn)億次計(jì)算的算法與應(yīng)用 PDF格式下載

用戶評(píng)論 (總計(jì)2條)

翻譯了會(huì)議論文，從應(yīng)用的角度講解千萬(wàn)億，翻譯的還可以。作為擴(kuò)展知識(shí)的課外閱讀不錯(cuò)。
是一些會(huì)議選集，細(xì)節(jié)并不清楚，老實(shí)說(shuō)，對(duì)我?guī)椭淮?，也許對(duì)更專業(yè)一些的會(huì)好一些。

面向千萬(wàn)億次計(jì)算的算法與應(yīng)用

用戶評(píng)論 (總計(jì)2條)

推薦圖書(shū)

相關(guān)圖書(shū)