面向千萬億次計(jì)算的算法與應(yīng)用

出版時(shí)間:2008-8-1  出版社:清華大學(xué)出版社  作者:(美)巴德爾  頁數(shù):356  譯者:都志輝 等  
Tag標(biāo)簽:無  

前言

在過去的幾十年內(nèi),在高性能計(jì)算應(yīng)用、算法和體系結(jié)構(gòu)的支持下,在科學(xué)、工程和社會領(lǐng)域發(fā)生了許多突破性的進(jìn)展。這些強(qiáng)有力的工具為研究人員、教育工作者和實(shí)踐工作者提供了這樣的能力,就是通過計(jì)算,可以把從全球收集獲得的數(shù)據(jù),轉(zhuǎn)換為解決我們社會最具有挑戰(zhàn)性問題的解決方案。持續(xù)推動高性能計(jì)算發(fā)展的一支重要的力量是針對“前沿性里程碑”問題產(chǎn)生的一些社團(tuán)聯(lián)盟,比如它們會提出代表這一領(lǐng)域下一階段進(jìn)展的技術(shù)目標(biāo)。在19世紀(jì)90年代,高性能計(jì)算組織希望實(shí)現(xiàn)萬億次(每秒1012的浮點(diǎn)操作)的計(jì)算能力,萬億次計(jì)算導(dǎo)致了一些新的發(fā)現(xiàn),比如設(shè)計(jì)新的藥物來對抗艾滋病和其他的疾??;對自然現(xiàn)象的仿真可以達(dá)到前所未有的精度,比如地震和颶風(fēng);對大系統(tǒng),比如宇宙,和小系統(tǒng),比如比細(xì)胞還小的一些系統(tǒng)有了更好的理解;現(xiàn)在我們將要在于萬億次(每秒1015的浮點(diǎn)操作)級別的機(jī)器上進(jìn)行計(jì)算。一些研究組織正在考慮億億次(每秒1018的浮點(diǎn)操作)級別的計(jì)算將會是什么樣子,他們處在這一研究的早期階段。在走向“下一個(gè)前沿計(jì)算”的過程中,一個(gè)假設(shè)就是高性能計(jì)算體系結(jié)構(gòu)的下一個(gè)研究前沿將會提供新的極大的容量和能力,這將使得以前需要大量資源但是又得不到滿足的用戶直接受益,同時(shí)對其他的用戶將帶來長期的裨益。但是大規(guī)模高性能計(jì)算用戶都知道,高效使用前沿超級計(jì)算系統(tǒng)能力,同不斷增加系統(tǒng)容量和能力相比,如果不是同等重要,就是重要性更高,我們需要投入大量的時(shí)間、人力、軟件和硬件基礎(chǔ)設(shè)施來充分利用這些非同尋常的系統(tǒng)。經(jīng)驗(yàn)表明,通過開發(fā)可擴(kuò)展的算法,模型,仿真,分析,庫和應(yīng)用組件,可以充分利用這些前沿系統(tǒng)所提供的容量和能力,因此它與建造和部署該前沿系統(tǒng)本身一樣,是非常具有挑戰(zhàn)性的工作。對于未來幾年內(nèi)可以支持千萬億次操作的應(yīng)用程序代碼,不管用什么樣的處理器技術(shù),將會需要幾十萬個(gè)甚至更多的處理器核心。目前,幾乎還沒有可以很容易擴(kuò)展到這種規(guī)模的高性能計(jì)算程序代碼,大量的程序代碼開發(fā)工作對于挖掘新的千萬億次系統(tǒng)的潛能是非常重要的。擴(kuò)展到千萬億次系統(tǒng)涉及的工作包括:提高物理模型,數(shù)學(xué)抽象,近似和其他的應(yīng)用組件。我們需要提高各種解決方案的算法來增加結(jié)果的準(zhǔn)確性。輸入數(shù)據(jù)集需要在分辨率上進(jìn)行提高(產(chǎn)生更多的數(shù)據(jù)),或者是用于測量的輸入數(shù)據(jù)的精度需要提高。每一個(gè)應(yīng)用或者算法的提高都會給開發(fā)千萬億次代碼帶來實(shí)質(zhì)性的挑戰(zhàn),會從新應(yīng)用執(zhí)行得到的領(lǐng)域結(jié)果中推動新的計(jì)算機(jī)科學(xué)的發(fā)現(xiàn)。本書是那些在千萬億次計(jì)算領(lǐng)域前沿性研究成果的結(jié)晶。作者試圖通過匯集在高性能計(jì)算和計(jì)算科學(xué)領(lǐng)域最成熟和已積累豐富經(jīng)驗(yàn)的應(yīng)用的最新成果,來解決在開發(fā)千萬億次系統(tǒng)應(yīng)用代碼中的一些挑戰(zhàn)性問題,這些應(yīng)用能夠在新的千萬億次系統(tǒng)產(chǎn)生和部署之前,就提前針對其體系結(jié)構(gòu)的特點(diǎn)來進(jìn)行開發(fā)。開發(fā)千萬億次應(yīng)用將會需要豐富的關(guān)于千萬億次系統(tǒng)硬件和系統(tǒng)軟件方面的知識,我們需要大量的時(shí)間來做擴(kuò)展,測試,評估以及優(yōu)化千萬億次代碼、庫、算法、系統(tǒng)軟件的工作,所有這些工作都將基于即將構(gòu)建的新系統(tǒng)來進(jìn)行。

內(nèi)容概要

在過去的幾十年內(nèi),在高性能計(jì)算應(yīng)用、算法和體系結(jié)構(gòu)的支持下,科學(xué)、工程和社會領(lǐng)域發(fā)生了許多突破性的進(jìn)展。本書是那些在千萬億次計(jì)算領(lǐng)域前沿性研究成果的結(jié)晶。作者試圖通過匯集在高性能計(jì)算和計(jì)算科學(xué)領(lǐng)域最成熟和已積累豐富經(jīng)驗(yàn)的應(yīng)用的最新成果,來解決在開發(fā)千萬億次系統(tǒng)應(yīng)用代碼中的一些挑戰(zhàn)性應(yīng)用,這些應(yīng)用能夠在新的千萬億次系統(tǒng)產(chǎn)生和部署之前,就提前針對其體系結(jié)構(gòu)的特點(diǎn)來進(jìn)行開發(fā)。開發(fā)千萬億次應(yīng)用需要豐富的關(guān)于千萬億次系統(tǒng)硬件和系統(tǒng)軟件方面的知識,需要大量的時(shí)間來做擴(kuò)展、測試、評估以及優(yōu)化千萬億次代碼、庫、算法、系統(tǒng)軟件的工作。所有這些工作都將基于即將構(gòu)建的新系統(tǒng)來進(jìn)行。    對于高性能計(jì)算來說,這是一個(gè)激動人心的時(shí)代,這個(gè)時(shí)代將會在一個(gè)新的規(guī)模和尺度上產(chǎn)生大量史無前例的新發(fā)現(xiàn),這些發(fā)現(xiàn)將會對科學(xué)和社會帶來切實(shí)的好處。本書可以讓你對千萬億次應(yīng)用和算法前沿性挑戰(zhàn)性研究工作的第一次浪潮有一個(gè)概觀,為目前和未來的千萬億次研究提供非常必要的基礎(chǔ)。

作者簡介

David A Bader是高性能計(jì)算所的所長,教授,長期從事計(jì)算科學(xué)與工程領(lǐng)域研究,該研究所隸屬于佐治亞理工學(xué)院計(jì)算學(xué)部。他在1996年從馬里蘭大學(xué)(University of Ma ryland)獲得博士學(xué)位,后贏得美國國家自然科學(xué)基金支持在實(shí)驗(yàn)計(jì)算機(jī)科學(xué)方面從事博士后研究。他獲得了美國自然科學(xué)基金CAREER支持,是IEEE計(jì)算機(jī)學(xué)會優(yōu)秀訪問人員計(jì)劃中的杰出演講者,是IBM PERCS組DARPA高吞吐率計(jì)算機(jī)系統(tǒng)計(jì)劃項(xiàng)目組的成員,佐治亞理工學(xué)院sony-Toshlba-IBM  CeII處理器中心的主任。他還是Internet2研究顧問委員會的成員,是IPDPS和HiPC會議指導(dǎo)委員會的成員,作為主席組織了很多高性能計(jì)算以及計(jì)算科學(xué)與工程方面的會議。Bader博士是許多高級重要出版物的編輯,包括IEEE Transactions on Parallel and Distributed Systems,ACM Journal of Experimental Algorithmics,IEEE DSOnline,以及Parallel Computing。他是IEEE計(jì)算機(jī)協(xié)會的資深會員,ACM會員。     
Bader博士在用高性能計(jì)算解決生物信息學(xué)以及計(jì)算基因問題方面是取得前沿性研究成果的科學(xué)家。他作為聯(lián)合主席主持了高性能計(jì)算生物學(xué)IEEE International Workshop on High-Performance ComDurational Biology(HiCOMB)的系列會議,曾為幾本書撰寫了部分章節(jié),聯(lián)合編輯Journal of Parallel and Distributed Computing(JPDC)和IEEE Transactions on Parallel and Distributed Systems(TPD5)在高性能計(jì)算生物學(xué)方面研究的???。他還是80余篇被同行審閱過的期刊論文、會議論文的作者,他的主要研究領(lǐng)域是并行算法,組合優(yōu)化,計(jì)算生物學(xué)與計(jì)算基因?qū)W。

書籍目錄

第1章  千萬億次計(jì)算科學(xué)應(yīng)用的性能特征  1.1  介紹  1.2  測試的各種體系結(jié)構(gòu)  1.3  科學(xué)應(yīng)用概述  1.4  GTC:Particle-in-Cell磁融解  1.5  ELBM3D:晶格玻耳茲曼流體動力學(xué)  1.6  Cactus:通用的相對天體物理學(xué)  1.7  PARATEC:材料科學(xué)的第一原理  1.8  HyperCLaw:雙曲AMR氣體動力學(xué)  1.9  總結(jié)與結(jié)論  1.10  致謝  參考文獻(xiàn)第2章  千萬億次的計(jì)算對NASA未來使命的影響  2.1  介紹  2.2  Columbia超級計(jì)算機(jī)  2.3  航空宇宙分析及計(jì)算    2.3.1  方法論    2.3.2  結(jié)果    2.3.3  NASA使用千萬億次計(jì)算的好處  2.4  推進(jìn)子系統(tǒng)分析    2.4.1  方法    2.4.2  結(jié)果    2.4.3  千萬億次計(jì)算給NASA帶來的益處  2.5  颶風(fēng)預(yù)測    2.5.1  方法    2.5.2  結(jié)果    2.5.3  千萬億計(jì)算對NASA的益處  2.6  瓶頸  2.7  總結(jié)  參考文獻(xiàn)第3章  多物理模擬與千萬億次計(jì)算  3.1  引言  3.2  下一代超級計(jì)算機(jī)  3.3  適用于大規(guī)模并行機(jī)的編程模型    3.3.1  新型并行語言    3.3.2  MPI-2    3.3.3  協(xié)作式并行    3.3.4  協(xié)作式并行的應(yīng)用實(shí)例  3.4  多尺度算法    3.4.1  并行的多重網(wǎng)格方法    3.4.2  ALE-AMR離散化    3.4.3  離散-連續(xù)統(tǒng)混合算法  3.5  目前及將來的應(yīng)用    3.5.1  萬億次仿真的技術(shù)現(xiàn)狀    3.5.2  通過協(xié)作并行進(jìn)行多物理模擬  3.6  未來展望  3.7  致謝  參考文獻(xiàn)第4章  針對Uintah多物理程序代碼的可擴(kuò)展并行AMR算法研究  4.1  前言  4.2  自適應(yīng)格網(wǎng)優(yōu)化  4.3  Uintah程序框架    4.3.1  仿真組件    4.3.2  負(fù)載均衡器    4.3.3  調(diào)度器  4.4  格網(wǎng)重構(gòu)器  4.5  提高性能  4.6  將來的工作  4.7  致謝  參考文獻(xiàn)第5章  使用Enzo對宇宙進(jìn)化進(jìn)行仿真  5.1  宇宙結(jié)構(gòu)的形成  5.2  Enzo的編碼    5.2.1  物理層建模和數(shù)值算法    5.2.2  自適應(yīng)格網(wǎng)細(xì)化    5.2.3  實(shí)現(xiàn)    5.2.4  并行化    5.2.5  快速的鄰居格網(wǎng)搜索    5.2.6  Enzo的I/O  5.3  在萬億次平臺上的性能和可擴(kuò)展性    5.3.1  單格網(wǎng)應(yīng)用    5.3.2  AMR應(yīng)用    5.3.3  并行展  5.4  將Enzo運(yùn)行在萬億次計(jì)算機(jī)平臺上    5.4.1  新的AMR數(shù)據(jù)結(jié)構(gòu)    5.4.2  混合型并行    5.4.3  天體運(yùn)動和宇宙射線之間的隱性關(guān)聯(lián)    5.4.4  內(nèi)部數(shù)據(jù)關(guān)系分析工具  5.5  致謝  參考文獻(xiàn)第6章  重大影響天氣現(xiàn)象數(shù)值預(yù)測:千萬億次計(jì)算的重要?jiǎng)恿? 6.1  引言  6.2  計(jì)算方法和工具    6.2.1  區(qū)域性天氣預(yù)測模型    6.2.2  千萬億系統(tǒng)中的內(nèi)存和性能問題    6.2.3  分布式內(nèi)存并行和消息傳遞    6.2.4  負(fù)載均衡    6.2.5  時(shí)間消耗和可擴(kuò)展性    6.2.6  NWP系統(tǒng)中其他重要的組件    6.2.7  其他問題  6.3  NWP實(shí)際應(yīng)用例子    6.3.1  大規(guī)模的天氣預(yù)報(bào)    6.3.2  高分辨率的龍卷風(fēng)仿真    6.3.3  通過觀測現(xiàn)象對龍卷風(fēng)進(jìn)行預(yù)測  6.4  數(shù)值天氣預(yù)報(bào)的挑戰(zhàn)和需求  6.5  總結(jié)  6.6  致謝  參考文獻(xiàn)第7章  千萬億次氣象科學(xué)應(yīng)用的軟件設(shè)計(jì)  7.1  介紹  7.2  氣象科學(xué)  7.3  千萬億次計(jì)算機(jī)的體系結(jié)構(gòu)  7.4  區(qū)域氣象系統(tǒng)模型CCSM(Community Climate System Model)    7.4.1  當(dāng)前CCSM概述    7.4.2  區(qū)域大氣模型CAM(CommunityAtmosphere Model)    7.4.3  并行海洋程序POP(Parallel Ocean Program)    7.4.4  區(qū)域陸地模型    7.4.5  社區(qū)海洋冰川模型    7.4.6  模型的耦合  7.5  總結(jié)  7.6  致謝  參考文獻(xiàn)第8章  邁向分布式千萬億次計(jì)算  8.1  引言  8.2  網(wǎng)格計(jì)算  8.3  基于網(wǎng)格的千萬億次計(jì)算  8.4  虛擬銀河    8.4.1  銀河的多物理學(xué)模型    8.4.2  銀河仿真的性能模型    8.4.3  千萬億次虛擬銀河仿真  8.5  討論與總結(jié)  參考文獻(xiàn)第9章  千萬億次計(jì)算時(shí)代的生物分子建模  9.1  引言  9.2  NAMD的設(shè)計(jì)    9.2.1  混合分解    9.2.2  動態(tài)負(fù)載平衡  9.3  面對千萬億次的挑戰(zhàn)與所需的改進(jìn)    9.3.1  目前的性能    9.3.2  在未來千萬億次機(jī)器上的性能    9.3.3  協(xié)處理器加速  9.4  生物分子應(yīng)用    9.4.1  水通道蛋白    9.4.2  鉀通道    9.4.3  病毒    9.4.4  核糖體    9.4.5  色素體    9.4.6  BAR域囊泡  9.5  總結(jié)  9.6  致謝  參考文獻(xiàn)第10章  用于分子動力學(xué)模擬的千萬億次計(jì)算機(jī)  10.1  介紹  10.2  MDGRAPE-3的硬件  10.3  MDGRAPE-3進(jìn)行的計(jì)算  10.4  MDGRAPE-3的芯片    10.4.1  力計(jì)算流水線    10.4.2  粒子j的內(nèi)存和控制單元    10.4.3  芯片說明  10.5  系統(tǒng)結(jié)構(gòu)  10.6  MDGRAPE-3的軟件  10.7  MDGRAPE-3的性能  10.8  總結(jié)和展望  10.9  致謝  參考文獻(xiàn)第11章  在千萬億次超級計(jì)算機(jī)上進(jìn)行生物分子仿真  11.1  引言  11.2  機(jī)遇    11.2.1  研究更大生物分子系統(tǒng)的能力    11.2.2  研究更長時(shí)間范圍的能力    11.2.3  混合量子與經(jīng)典仿真    11.2.4  更精確的仿真  11.3  挑戰(zhàn)    11.3.1  在大于100K數(shù)量的處理器上擴(kuò)大生物分子模擬代碼的規(guī)模    11.3.2  適應(yīng)硬件的變化    11.3.3  容錯(cuò)性    11.3.4  包含可配置計(jì)算的多范型硬件    11.3.5  千萬億次計(jì)算帶來的新的仿真方法  11.4  總結(jié)和展望  11.5  致謝  參考文獻(xiàn)第12章  處理大規(guī)模圖的多線程算法  12.1  引言    12.1.1  圖運(yùn)算中的問題    12.1.2  分布式存儲圖運(yùn)算的擴(kuò)展局限性  12.2  Cray MTA-2平臺    12.2.1  并行性表示    12.2.2  對細(xì)粒度同步的支持  12.3  案例分析:最短路徑算法    12.3.1  初步分析    12.3.2  △-分步算法    12.3.3  Thorup算法    12.3.4  實(shí)驗(yàn)結(jié)果  12.4  案例分析:連通分量    12.4.1  傳統(tǒng)PRAM算法    12.4.2  Kahan的多層次算法    12.4.3  性能比較  12.5  結(jié)論  12.6  致謝  參考文獻(xiàn)第13章  千萬億次計(jì)算中的災(zāi)難恢復(fù)算法研究  13.1  FT-MPI:一個(gè)實(shí)現(xiàn)容錯(cuò)功能的MPI    13.1.1  FT-MPI概述    13.1.2  FT-MPI:一個(gè)實(shí)現(xiàn)容錯(cuò)功能的MPI    13.1.3  FT-MPI的使用  13.2  應(yīng)用級的無盤檢查點(diǎn)技術(shù)    13.2.1  基于鄰居的檢查點(diǎn)方案    13.2.2  基于校驗(yàn)和的檢查點(diǎn)方案    13.2.3  基于加權(quán)校驗(yàn)和的檢查點(diǎn)方案  13.3  一種容錯(cuò)的遞歸方程求解器    13.3.1  有條件的共軛梯度算法    13.3.2  將容錯(cuò)機(jī)制添加到PCG算法中  13.4  實(shí)驗(yàn)評估    13.4.1  使用不同MPI實(shí)現(xiàn)的PCG算法的性能    13.4.2  設(shè)置檢查點(diǎn)的性能開銷    13.4.3  執(zhí)行恢復(fù)操作的性能開銷    13.4.4  恢復(fù)操作中的舍入錯(cuò)誤所帶來的數(shù)值影響  13.5  討論  13.6  結(jié)論和未來工作  參考文獻(xiàn)第14章  TSUBAME的研制與未來發(fā)展  14.1  引言-2通向TSUBAME之路  14.2  TSUBAME的架構(gòu)需求  14.3  TSUBAME一瞥  14.4  TSUBAME之旅——使世人皆能超級計(jì)算的性能和操作  14.5  結(jié)論和展望—TSUBAME 2.0  參考文獻(xiàn)第15章  通過SMP模塊構(gòu)造千萬億次的性能  15.1  引言  15.2  OpenMP編程體系結(jié)構(gòu)  15.3  通過OpenMP實(shí)現(xiàn)的循環(huán)級并行  15.4  C++與OpenMP    15.4.1  迭代循環(huán)    15.4.2  ccNUMA的關(guān)鍵問題    15.4.3  并行化面向?qū)ο蟠a    15.4.4  線程安全性  15.5  應(yīng)用OpenMe實(shí)現(xiàn)嵌套并行化    15.5.1  目前OpenMP規(guī)范中的嵌套并行化    15.5.2  FIRE的基于目錄圖像修復(fù)    15.5.3  多塊CFD數(shù)據(jù)集中3D關(guān)鍵點(diǎn)的計(jì)算    15.5.4  TFS流體求解器  15.6  結(jié)論與展望參考文獻(xiàn)第16章  千萬億次系統(tǒng)的性能及其復(fù)雜性分析  16.1  引言  16.2  千萬億次系統(tǒng)體系結(jié)構(gòu)的發(fā)展趨勢及其并發(fā)度  16.3  性能特征和基準(zhǔn)測試的現(xiàn)狀    16.3.1  基準(zhǔn)測試創(chuàng)新    16.3.2  應(yīng)用程序的性能特征    16.3.3  性能復(fù)雜性和性能效能的測量  16.4  APEX-MAIP    16.4.1  APEX-Map的設(shè)計(jì)原則    16.4.2  并行編程范式與APEX-MAP的對比  16.5  性能復(fù)雜性特征描述    16.5.1  性能復(fù)雜度定義    16.5.2  性能模型選擇    16.5.3  若干并行系統(tǒng)的性能復(fù)雜性分析  16.6  小結(jié)  參考文獻(xiàn)第17章  高度可擴(kuò)展的性能分析工具  17.1  引言  17.2  性能分析概念回顧  17.3  Paradyn  17.4  SCAlASCA  17.5  Vampir Next Generation  17.6  Periscope    17.6.1  體系結(jié)構(gòu)    17.6.2  ASL性能屬性描述    17.6.3  Periscope結(jié)點(diǎn)代理    17.6.4  性能屬性搜索    17.6.5  Peirscope高層代理    17.6.6  代理通信基礎(chǔ)構(gòu)造    17.6.7  評價(jià)  17.7  工具對比和未來研究  參考文獻(xiàn)第18章  面向千萬億次計(jì)算規(guī)模的多級有限元求解器  18.1  引言    18.1.1  概述    18.1.2  千萬億次架構(gòu)示例  18.2  設(shè)計(jì)范例    18.2.1  分層混合格網(wǎng)    18.2.2  ParExPDE  18.3  評估與比較  18.4  結(jié)論  參考文獻(xiàn)第19章  高效有限元代碼開發(fā)的混合方法  19.1  簡介  19.2  高級應(yīng)用代碼  19.3  代碼生成    19.3.1  元編程    19.3.2  變分問題的實(shí)時(shí)編譯    19.3.3  FFC    19.3.4  SyFi  19.4  有限元集成的統(tǒng)一框架    19.4.1  有限元集成    19.4.2  UFC接口    19.4.3  實(shí)現(xiàn)UFC接口  19.5  總結(jié)  19.6  致謝  參考文獻(xiàn)第20章  使用Charm++編寫千萬億次應(yīng)用程序  20.1  動機(jī)  20.2  Charm++和AMPI:編程模型    20.2.1  動態(tài)負(fù)載均衡    20.2.2  投影    20.2.3  其他特性概述  20.3   Charm++應(yīng)用程序    20.3.1  NAMD    20.3.2  LeanCP    20.3.3  ChaNGa    20.3.4  其他應(yīng)用  20.4  大型系統(tǒng)仿真  20.5  新型并行語言  20.6  總結(jié)  20.7  致謝  參考文獻(xiàn)第21章  基于注解的高產(chǎn)出率和性能移植性  21.1  引言  21.2  實(shí)現(xiàn)    21.2.1  總體設(shè)計(jì)    21.2.2  注解語法    21.2.3  系統(tǒng)擴(kuò)展    21.2.4  代碼生成模塊  21.3  性能研究    21.3.1  STREAM基準(zhǔn)測試    21.3.2  AXPY操作  21.4  相關(guān)工作    21.4.1  自調(diào)節(jié)的庫和代碼    21.4.2  編譯器方法    21.4.3  性能相關(guān)的用戶注解  21.5  總結(jié)與未來的方向  21.6  致謝  參考文獻(xiàn)第22章  高效能編程語言的局部性感知特性  22.1  引言  22.2  Chapel中關(guān)于數(shù)據(jù)并行化的基本概念    22.2.1  域    22.2.2  數(shù)組  22.3  數(shù)據(jù)分布    22.3.1  基本方法    22.3.2  “分布”接口    22.3.3  局部存儲對象上的分配策略  22.4  實(shí)例與討論    22.4.1  一個(gè)負(fù)載平衡塊分布    22.4.2  一個(gè)稀疏數(shù)據(jù)分布  22.5  實(shí)現(xiàn)    22.5.1  編譯器實(shí)現(xiàn)進(jìn)展    22.5.2  分布實(shí)現(xiàn)策略  22.6  相關(guān)工作  22.7  結(jié)論和未來展望  22.8  致謝  參考文獻(xiàn)第23章  體系結(jié)構(gòu)與程序設(shè)計(jì)方法對獲得持續(xù)千萬億次計(jì)算性能的影響  23.1  引言  23.2  數(shù)值計(jì)算和計(jì)算機(jī)發(fā)展的歷史簡介    23.2.1  20世紀(jì)60年代    23.2.2  20世紀(jì)70年代    23.2.3  20世紀(jì)80年代    23.2.4  20世紀(jì)90年代    23.2.5  2000年及以后  23.3  體系結(jié)構(gòu)    23.3.1  處理器發(fā)展    23.3.2  Cell Broad Engine處理器    23.3.3  ClearSpeed卡    23.3.4  類向量體系結(jié)構(gòu)    23.3.5  能耗和成本因素    23.3.6  通信網(wǎng)絡(luò)    23.3.7  通信協(xié)議和并行范式  23.4  超大型計(jì)算機(jī)的算法    23.4.1  大規(guī)模計(jì)算機(jī)    23.4.2  Linpack局限性    23.4.3  選擇算法實(shí)現(xiàn)方法  23.5  其他技術(shù)的影響  參考文獻(xiàn)第24章  Cactus框架:從黑洞到伽瑪射線脈沖  24.1  相對天體物理學(xué)目前的挑戰(zhàn)和伽瑪射線脈沖問題  24.2   Cactus框架  24.3  時(shí)空代碼和流體動力學(xué)代碼    24.3.1  Ccatie:時(shí)空進(jìn)化    24.3.2  Whisky:廣義相對論流體動力學(xué)  24.4  并行化的實(shí)現(xiàn)和格網(wǎng)細(xì)化    24.4.1  PUGH    24.4.2  使用Carpet實(shí)現(xiàn)自適應(yīng)格網(wǎng)細(xì)化    24.4.3  I/O  24.5  當(dāng)前機(jī)器的擴(kuò)展性    24.5.1  浮點(diǎn)性能    24.5.2  I/O性能  24.6  在千萬億次計(jì)算上的發(fā)展    24.6.1  物理學(xué):輻射傳輸    24.6.2  擴(kuò)展性    24.6.3工具  24.7  致謝  參考文獻(xiàn)

章節(jié)摘錄

1.5 ELBM3D:晶格玻耳茲曼流體動力學(xué)LBM:(Lattice-Boltzmann methods)晶格玻耳茲曼方法已經(jīng)證明是傳統(tǒng)數(shù)值方法的一種很好的替代,也可以用于模擬流體以及對流動物理學(xué)進(jìn)行建模[29]。其基本的想法就是開發(fā)一個(gè)簡單的動力學(xué)模型,結(jié)合內(nèi)在的物理過程,可以重新產(chǎn)生正確的宏觀平均特性。從19世紀(jì)80年代中期以來,這些算法得到了廣泛的應(yīng)用,用于模擬Navier-Stokes流,最近擴(kuò)展到可以處理多項(xiàng)流、反作用流、擴(kuò)散過程和磁發(fā)電機(jī)流體力學(xué)。正像從顯式算法中可以得到的那樣,當(dāng)一個(gè)算法推向更高的雷諾數(shù)的時(shí)候,LBM趨向于數(shù)值非線性不穩(wěn)態(tài)。這些數(shù)值不穩(wěn)態(tài)會上升,因?yàn)闆]有強(qiáng)加的約束會促使分布函數(shù)保持非負(fù)。熵LBM算法可以保持分布函數(shù)的非負(fù)性,即使在任意小的傳輸系數(shù)約束的情況下也是這樣,該算法已被用于Navier-Stokes湍流[2],而且已經(jīng)被結(jié)合到了最近開發(fā)的代碼之中[30]。LBM方式使得很困難的邊界幾何(比如通過使用邊界返回的策略來模擬沒有滑動墻的情況)的實(shí)現(xiàn)變得比較容易。這里我們介紹周期邊界條件下的三維模擬情況,其空間格網(wǎng)和相空間向量格子相互重疊在一起。每一個(gè)格子點(diǎn)和一些mesoscopic變量關(guān)聯(lián)在一起,其值與流方向數(shù)量成比例,并且存儲在向量中。該格子被劃分到一個(gè)三維笛卡兒處理器網(wǎng)狀拓?fù)浣Y(jié)構(gòu)上,用MPI來實(shí)現(xiàn)通信,圖1-3(a)展示的是一個(gè)通信拓?fù)涞那闆r,重點(diǎn)強(qiáng)調(diào)了相對稀疏的通信模式。對這種情況的大多數(shù)模擬,都是通過擴(kuò)展邊界區(qū)域空間來存儲從鄰居處理器獲得的數(shù)據(jù)拷貝。對于ELBM3D,為了使得碰撞過程滿足一定的約束條件,需要在每一個(gè)迭代步對每一個(gè)格網(wǎng)點(diǎn)求解一個(gè)非線性方程。由于這一方程需要對分布函數(shù)的各個(gè)組成部分求對數(shù),因此整個(gè)算法的性能就特別受限于log()函數(shù)的性能。圖1-3(a)展示的ELBM3D的連接關(guān)系,在結(jié)構(gòu)上與Cactus非常接近,但是由于代碼周期性邊界條件的不同,其通信模式上就有細(xì)微的差異。從同構(gòu)性的角度看,該拓?fù)渑c格網(wǎng)或者環(huán)互連拓?fù)溆泻艽蟛煌?,但是對于胖樹或者互連開關(guān)這樣的全互連網(wǎng)絡(luò),它對可得的對分帶寬的占用非常有限。圖1.3(c)表明,和]Cactus一樣,ELBM3D主要的通信形式是點(diǎn)到點(diǎn)通信,但是圖1.3(b)表明點(diǎn)到點(diǎn)消息緩沖區(qū)的空間很大,因此它受帶寬的限制很大。

編輯推薦

對于高性能計(jì)算來說,這是一個(gè)激動人心的時(shí)代,這個(gè)時(shí)代將會在一個(gè)新的規(guī)模和尺度上產(chǎn)生大量史無前例的新發(fā)現(xiàn),這些發(fā)現(xiàn)將會對科學(xué)和社會帶來切實(shí)的好處?!睹嫦蚯f億次計(jì)算的算法與應(yīng)用》可以讓你對千萬億次應(yīng)用和算法前沿性挑戰(zhàn)性研究工作的第一次浪潮有一個(gè)概觀,為目前和未來的千萬億次研究提供非常必要的基礎(chǔ)。

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    面向千萬億次計(jì)算的算法與應(yīng)用 PDF格式下載


用戶評論 (總計(jì)2條)

 
 

  •   翻譯了會議論文,從應(yīng)用的角度講解千萬億,翻譯的還可以。作為擴(kuò)展知識的課外閱讀不錯(cuò)。
  •   是一些會議選集,細(xì)節(jié)并不清楚,老實(shí)說,對我?guī)椭淮螅苍S對更專業(yè)一些的會好一些。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號-7