并行時域有限差分方法的VALU加速技術(shù)

出版時間:2012-11  出版社:余文華、李文興、 張泳 哈爾濱工業(yè)大學出版社 (2012-11出版)  作者:余文華,李文興,張泳 著  頁數(shù):202  

內(nèi)容概要

  《“十二五”國家重點圖書·電子與信息工程系列:并行時域有限差分方法的VALU加速技術(shù)》是關于使用計算機處理器中的矢量運算單元(Vector Arithmetic Logic Unit,UALU)加速并行時域有限差分方法的著作,介紹了如何使用SSE指令集通過VALU加速并行的時域有限差分方法,并通過對一個具有矢量運算單元加速的三維高性能并行時域有限差分程序的詳細分析,說明了具體應用方法和技術(shù),這個程序的高性能已經(jīng)在許多實際應用中對于不同的硬件平臺得到過驗證。與GPU、IBMCell處理器和FPGA加速技術(shù)相比,矢量運算單元加速更加有效并且不需要增加任何額外的硬件設備。  《“十二五”國家重點圖書·電子與信息工程系列:并行時域有限差分方法的VALU加速技術(shù)》對于當前最熱門的研究方向之一的云計算,也介紹了一些基本概念以及在工程計算中的應用。  《“十二五”國家重點圖書·電子與信息工程系列:并行時域有限差分方法的VALU加速技術(shù)》適合用于電磁場與微波技術(shù)專業(yè)及其他工程計算專業(yè)的高年級本科生與研究生的參考書,也可以用作電磁場與微波技術(shù)專業(yè)及其他工程計算專業(yè)老師、研究人員和電氣工程師的參考書。

作者簡介

余文華,為賓夕法尼亞州立大學電磁通訊實驗室訪問教授,哈爾濱工程大學特聘教授,博士生導師。發(fā)表論文150多篇,出版專著7部,開發(fā)了世界上第一個商業(yè)并行電磁仿真軟件,創(chuàng)造并保持著商業(yè)電磁仿真軟件4000個計算機90%并行效率的世界紀錄。目前為IEEE高級會員、和中國電波科學學報外籍等編委。 李文興,為哈爾濱工程大學艦船電磁兼容學科和電磁場與微波技術(shù)學科帶頭人,先后主持和參加20余項軍用和民用項目,獲部級科技進步二等獎1項、部級三等獎3項和黑龍江省第二屆青年科技獎,省級精品課2項,主持開發(fā)的產(chǎn)品被確定為國家重點新產(chǎn)品5項、國家重點火炬計劃2項,發(fā)表論文30余篇,現(xiàn)為中國電子學會高級會員,IEEE學會會員。

書籍目錄

第1章時域有限差分方法 1.1時域有限差分方法 1.1.1時域有限差分遞推方程 1.1.2時域有限差分穩(wěn)定性分析 1.1.3吸收邊界條件 1.2并行FDTD方法 參考文獻 第2章VALU加速技術(shù) 2.1SSE指令集 2.2c和c++中的SSE應用 2.3SSE編程實例 2.3.1SSE類型 2.3.2編程實例 2.4VALU在FDTD方法中的應用 2.4.1磁場Hx的計算方法 2.4.2磁場Hy的計算方法 2.4.3磁場Hz的計算方法 2.4.4電場Ex的計算方法 2.4.5電場Ey的計算方法 2.4.6電場Ez的計算方法 2.5VALU性能分析 2.5.1空盒子標準測試 2.5.2電偶極子天線 2.5.3貼片天線 參考文獻 第3章PML加速技術(shù) 3.1PML區(qū)域中場的遞推方程 3.2SSE加速技術(shù)在PML遞推中的應用 參考文獻 第4章并行處理技術(shù) 4.1單指令單數(shù)據(jù) 4.2單指令多數(shù)據(jù)指令集 4.3OpenMP 4.4MPI 4.5三級并行架構(gòu) 參考文獻 第5章工程應用實例 5.1硬件平臺描述 5.2實際問題的性能考察 5.3表面電流分布計算技術(shù) 5.4螺旋天線陣列 5.5平板介質(zhì)透鏡 5.6汽車電磁分析 5.7飛機電磁分析 5.8有限大小頻率選擇結(jié)構(gòu)分析 5.9彎曲頻率選擇結(jié)構(gòu)分析 5.10微帶低通濾波器分析 5.11微波混響室 5.12波音737WIFI分析 5.13波導縫隙天線陣 參考文獻 第6章云計算技術(shù) 6.1云計算中的基本技術(shù)術(shù)語 6.2電磁云計算舉例 6.2.1電磁云計算實例 6.2.2Rocks集群管理軟件 6.3科學云計算 6.3.1引論 6.3.2云計算服務 6.3.3科學云計算的特點 6.3.4云計算中先進技術(shù) 6.4云計算和網(wǎng)格計算 參考文獻 附錄三維并行FDTD源代碼 附錄1輸入?yún)?shù) 附錄2輸出參數(shù) 附錄3程序功能 附錄4程序要求 附錄5子程序列表 附錄6源代碼 參考文獻 索引

章節(jié)摘錄

版權(quán)頁:   插圖:   當今各類高性能計算機工作站和服務器的主流處理器(CPU)都是由AMD或者Intel提供的。無論是工程仿真計算程序的開發(fā)者還是應用者,都十分關心如何提高計算機工作站和服務器的性能。很難準確比較AMD處理器和Intel處理器的性能,因為我們沒有辦法在一個給定平臺上得到一個絕對的比較指標。無論是AMD處理器還是Intel處理器,通常我們關心如下可能影響到電磁仿真性能的重要指標。 ①主頻:它是影響電磁仿真性能的一個重要指標,計算機主頻與仿真速度成正比。就仿真性能來說,主頻越高電磁仿真的速度就越快。 ②核數(shù):它是一個重要指標并決定VALU的數(shù)量。一般來說,核數(shù)越多,VALU的數(shù)量越多,電磁仿真的速度就越快。 ③制造工藝:制造工藝越高、功耗越小,性能越好。例如,對于32 nm工藝和45 nm工藝的處理器,如果其他指標相同,32 nm工藝處理器的性能要好得多。 ④L1緩存:它的數(shù)量直接影響電磁仿真的速度。緩存的數(shù)量越大電磁仿真速度就越快。每個核都有自己的L1緩存。 ⑤L2緩存:L2緩存比L1緩存慢,它的數(shù)量也影響電磁仿真的速度。緩存的數(shù)量越大電磁仿真速度就越快?,F(xiàn)在的L2緩存都是所有的核共享的。 ⑥Hyper Transport(AMD)/Quick Path Interconnect(Intel):是為了提高多處理器工作站內(nèi)存帶寬特性而設計的,它要求程序是并行的,可以把每一個處理器要求的數(shù)據(jù)存放在自己的本地內(nèi)存。 ⑦內(nèi)存:它的速度和帶寬直接影響電磁仿真的速度。內(nèi)存的速度越快、帶寬越寬,電磁仿真的速度就越快。 ⑧SMP兼容性:決定可以安裝多少個處理器在一個主板上。 ⑨平均CPU功耗(AMD)/熱設計功耗(Intel):消耗在處理器上的能量。 對于一個程序開發(fā)者或者使用者,熟悉計算機的內(nèi)部結(jié)構(gòu)和程序執(zhí)行過程是十分重要的。當一個FDTD程序開始運行時,F(xiàn)DTD程序首先在內(nèi)存中為每一個變量和數(shù)組分配所需的內(nèi)存,然后開始按程序順序執(zhí)行程序,或者按編譯器優(yōu)化過的順序執(zhí)行代碼。FDTD的數(shù)據(jù)主要存放在內(nèi)存中,然而,為了提高速度,最近所需要的數(shù)據(jù)則要存放在L1和L2緩存中。

編輯推薦

《并行時域有限差分方法的VALU加速技術(shù)》對于當前最熱門的研究方向之一的云計算,也介紹了一些基本概念以及在工程計算中的應用?!恫⑿袝r域有限差分方法的VALU加速技術(shù)》適合用于電磁場與微波技術(shù)專業(yè)及其他工程計算專業(yè)的高年級本科生與研究生的參考書,也可以用作電磁場與微波技術(shù)專業(yè)及其他工程計算專業(yè)老師、研究人員和電氣工程師的參考書。

圖書封面

評論、評分、閱讀與下載


    并行時域有限差分方法的VALU加速技術(shù) PDF格式下載


用戶評論 (總計0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7