出版時(shí)間:2012-11 出版社:余文華、李文興、 張泳 哈爾濱工業(yè)大學(xué)出版社 (2012-11出版) 作者:余文華,李文興,張泳 著 頁數(shù):202
內(nèi)容概要
《“十二五”國家重點(diǎn)圖書·電子與信息工程系列:并行時(shí)域有限差分方法的VALU加速技術(shù)》是關(guān)于使用計(jì)算機(jī)處理器中的矢量運(yùn)算單元(Vector Arithmetic Logic Unit,UALU)加速并行時(shí)域有限差分方法的著作,介紹了如何使用SSE指令集通過VALU加速并行的時(shí)域有限差分方法,并通過對一個(gè)具有矢量運(yùn)算單元加速的三維高性能并行時(shí)域有限差分程序的詳細(xì)分析,說明了具體應(yīng)用方法和技術(shù),這個(gè)程序的高性能已經(jīng)在許多實(shí)際應(yīng)用中對于不同的硬件平臺得到過驗(yàn)證。與GPU、IBMCell處理器和FPGA加速技術(shù)相比,矢量運(yùn)算單元加速更加有效并且不需要增加任何額外的硬件設(shè)備?! 丁笆濉眹抑攸c(diǎn)圖書·電子與信息工程系列:并行時(shí)域有限差分方法的VALU加速技術(shù)》對于當(dāng)前最熱門的研究方向之一的云計(jì)算,也介紹了一些基本概念以及在工程計(jì)算中的應(yīng)用?! 丁笆濉眹抑攸c(diǎn)圖書·電子與信息工程系列:并行時(shí)域有限差分方法的VALU加速技術(shù)》適合用于電磁場與微波技術(shù)專業(yè)及其他工程計(jì)算專業(yè)的高年級本科生與研究生的參考書,也可以用作電磁場與微波技術(shù)專業(yè)及其他工程計(jì)算專業(yè)老師、研究人員和電氣工程師的參考書。
作者簡介
余文華,為賓夕法尼亞州立大學(xué)電磁通訊實(shí)驗(yàn)室訪問教授,哈爾濱工程大學(xué)特聘教授,博士生導(dǎo)師。發(fā)表論文150多篇,出版專著7部,開發(fā)了世界上第一個(gè)商業(yè)并行電磁仿真軟件,創(chuàng)造并保持著商業(yè)電磁仿真軟件4000個(gè)計(jì)算機(jī)90%并行效率的世界紀(jì)錄。目前為IEEE高級會員、和中國電波科學(xué)學(xué)報(bào)外籍等編委。 李文興,為哈爾濱工程大學(xué)艦船電磁兼容學(xué)科和電磁場與微波技術(shù)學(xué)科帶頭人,先后主持和參加20余項(xiàng)軍用和民用項(xiàng)目,獲部級科技進(jìn)步二等獎1項(xiàng)、部級三等獎3項(xiàng)和黑龍江省第二屆青年科技獎,省級精品課2項(xiàng),主持開發(fā)的產(chǎn)品被確定為國家重點(diǎn)新產(chǎn)品5項(xiàng)、國家重點(diǎn)火炬計(jì)劃2項(xiàng),發(fā)表論文30余篇,現(xiàn)為中國電子學(xué)會高級會員,IEEE學(xué)會會員。
書籍目錄
第1章時(shí)域有限差分方法 1.1時(shí)域有限差分方法 1.1.1時(shí)域有限差分遞推方程 1.1.2時(shí)域有限差分穩(wěn)定性分析 1.1.3吸收邊界條件 1.2并行FDTD方法 參考文獻(xiàn) 第2章VALU加速技術(shù) 2.1SSE指令集 2.2c和c++中的SSE應(yīng)用 2.3SSE編程實(shí)例 2.3.1SSE類型 2.3.2編程實(shí)例 2.4VALU在FDTD方法中的應(yīng)用 2.4.1磁場Hx的計(jì)算方法 2.4.2磁場Hy的計(jì)算方法 2.4.3磁場Hz的計(jì)算方法 2.4.4電場Ex的計(jì)算方法 2.4.5電場Ey的計(jì)算方法 2.4.6電場Ez的計(jì)算方法 2.5VALU性能分析 2.5.1空盒子標(biāo)準(zhǔn)測試 2.5.2電偶極子天線 2.5.3貼片天線 參考文獻(xiàn) 第3章PML加速技術(shù) 3.1PML區(qū)域中場的遞推方程 3.2SSE加速技術(shù)在PML遞推中的應(yīng)用 參考文獻(xiàn) 第4章并行處理技術(shù) 4.1單指令單數(shù)據(jù) 4.2單指令多數(shù)據(jù)指令集 4.3OpenMP 4.4MPI 4.5三級并行架構(gòu) 參考文獻(xiàn) 第5章工程應(yīng)用實(shí)例 5.1硬件平臺描述 5.2實(shí)際問題的性能考察 5.3表面電流分布計(jì)算技術(shù) 5.4螺旋天線陣列 5.5平板介質(zhì)透鏡 5.6汽車電磁分析 5.7飛機(jī)電磁分析 5.8有限大小頻率選擇結(jié)構(gòu)分析 5.9彎曲頻率選擇結(jié)構(gòu)分析 5.10微帶低通濾波器分析 5.11微波混響室 5.12波音737WIFI分析 5.13波導(dǎo)縫隙天線陣 參考文獻(xiàn) 第6章云計(jì)算技術(shù) 6.1云計(jì)算中的基本技術(shù)術(shù)語 6.2電磁云計(jì)算舉例 6.2.1電磁云計(jì)算實(shí)例 6.2.2Rocks集群管理軟件 6.3科學(xué)云計(jì)算 6.3.1引論 6.3.2云計(jì)算服務(wù) 6.3.3科學(xué)云計(jì)算的特點(diǎn) 6.3.4云計(jì)算中先進(jìn)技術(shù) 6.4云計(jì)算和網(wǎng)格計(jì)算 參考文獻(xiàn) 附錄三維并行FDTD源代碼 附錄1輸入?yún)?shù) 附錄2輸出參數(shù) 附錄3程序功能 附錄4程序要求 附錄5子程序列表 附錄6源代碼 參考文獻(xiàn) 索引
章節(jié)摘錄
版權(quán)頁: 插圖: 當(dāng)今各類高性能計(jì)算機(jī)工作站和服務(wù)器的主流處理器(CPU)都是由AMD或者Intel提供的。無論是工程仿真計(jì)算程序的開發(fā)者還是應(yīng)用者,都十分關(guān)心如何提高計(jì)算機(jī)工作站和服務(wù)器的性能。很難準(zhǔn)確比較AMD處理器和Intel處理器的性能,因?yàn)槲覀儧]有辦法在一個(gè)給定平臺上得到一個(gè)絕對的比較指標(biāo)。無論是AMD處理器還是Intel處理器,通常我們關(guān)心如下可能影響到電磁仿真性能的重要指標(biāo)。 ①主頻:它是影響電磁仿真性能的一個(gè)重要指標(biāo),計(jì)算機(jī)主頻與仿真速度成正比。就仿真性能來說,主頻越高電磁仿真的速度就越快。 ②核數(shù):它是一個(gè)重要指標(biāo)并決定VALU的數(shù)量。一般來說,核數(shù)越多,VALU的數(shù)量越多,電磁仿真的速度就越快。 ③制造工藝:制造工藝越高、功耗越小,性能越好。例如,對于32 nm工藝和45 nm工藝的處理器,如果其他指標(biāo)相同,32 nm工藝處理器的性能要好得多。 ④L1緩存:它的數(shù)量直接影響電磁仿真的速度。緩存的數(shù)量越大電磁仿真速度就越快。每個(gè)核都有自己的L1緩存。 ⑤L2緩存:L2緩存比L1緩存慢,它的數(shù)量也影響電磁仿真的速度。緩存的數(shù)量越大電磁仿真速度就越快?,F(xiàn)在的L2緩存都是所有的核共享的。 ⑥Hyper Transport(AMD)/Quick Path Interconnect(Intel):是為了提高多處理器工作站內(nèi)存帶寬特性而設(shè)計(jì)的,它要求程序是并行的,可以把每一個(gè)處理器要求的數(shù)據(jù)存放在自己的本地內(nèi)存。 ⑦內(nèi)存:它的速度和帶寬直接影響電磁仿真的速度。內(nèi)存的速度越快、帶寬越寬,電磁仿真的速度就越快。 ⑧SMP兼容性:決定可以安裝多少個(gè)處理器在一個(gè)主板上。 ⑨平均CPU功耗(AMD)/熱設(shè)計(jì)功耗(Intel):消耗在處理器上的能量。 對于一個(gè)程序開發(fā)者或者使用者,熟悉計(jì)算機(jī)的內(nèi)部結(jié)構(gòu)和程序執(zhí)行過程是十分重要的。當(dāng)一個(gè)FDTD程序開始運(yùn)行時(shí),F(xiàn)DTD程序首先在內(nèi)存中為每一個(gè)變量和數(shù)組分配所需的內(nèi)存,然后開始按程序順序執(zhí)行程序,或者按編譯器優(yōu)化過的順序執(zhí)行代碼。FDTD的數(shù)據(jù)主要存放在內(nèi)存中,然而,為了提高速度,最近所需要的數(shù)據(jù)則要存放在L1和L2緩存中。
編輯推薦
《并行時(shí)域有限差分方法的VALU加速技術(shù)》對于當(dāng)前最熱門的研究方向之一的云計(jì)算,也介紹了一些基本概念以及在工程計(jì)算中的應(yīng)用?!恫⑿袝r(shí)域有限差分方法的VALU加速技術(shù)》適合用于電磁場與微波技術(shù)專業(yè)及其他工程計(jì)算專業(yè)的高年級本科生與研究生的參考書,也可以用作電磁場與微波技術(shù)專業(yè)及其他工程計(jì)算專業(yè)老師、研究人員和電氣工程師的參考書。
圖書封面
評論、評分、閱讀與下載
并行時(shí)域有限差分方法的VALU加速技術(shù) PDF格式下載