Ansys:如何減少有限元分析計算時間?
2016-11-28 by:CAE仿真在線 來源:互聯(lián)網(wǎng)
用ANSYS 結(jié)構(gòu)力學(xué)仿真軟件的組織機(jī)構(gòu)希望獲 得盡快產(chǎn)生可靠設(shè)計所需要的精確度、效率與吞 吐量。ANSYS 與英特爾攜手合作,確保此類公司 能夠利用最新Intel® Xeon® E5 v3 處理器與Xeon Phi® 協(xié)處 理器,以處理其仿真任務(wù)。
結(jié)構(gòu)力學(xué)仿真往往需要大量計算資源,包括內(nèi)存、磁盤空 間和I/O。這會影響到計算所用的時間。由于CPU 時鐘頻率的 提高速度不如10 年前那么快,保持這種計算速度無法依賴更 快速的CPU。新的性能模式是并行計算,其可以利用每隔幾 年數(shù)量都會猛增的CPU 內(nèi)核,以便在每個時鐘周期提供更多 計算。這顯著提高了結(jié)構(gòu)仿真軟件的性能。但是工程師始終在 努力盡可能減少仿真時間,這樣他們就能夠提高模型的復(fù)雜性 (例如,通過提高網(wǎng)格密度或非線性行為),或者在給定時間內(nèi) 執(zhí)行更多仿真。
?基準(zhǔn)套件在兩個極其相似的系統(tǒng)上采用ANSYS 16.0 運行:一個系統(tǒng)包含2 個Intel Xeon E5-2670(Sandy Bridge、2.6GHz、共16 個內(nèi)核)處理器,另一個采用2 個 Intel Xeon E5-2697 v3(Haswell、2.6GHz、共28 個內(nèi)核)處理器。采用1、2、4、 8 和16 個內(nèi)核的基準(zhǔn)套件運行總用時的幾何平均值,可用于產(chǎn)生上表所示時間。對于 迭代求解器基準(zhǔn),Haswell 系統(tǒng)比E5 v2 系統(tǒng)平均快20%,而對于直接求解器基準(zhǔn), Haswell 系統(tǒng)比E5 v2 快40%。
加速結(jié)構(gòu)力學(xué)仿真的一種方法是充分利用可用的最新硬 件。計算機(jī)行業(yè)利用持續(xù)的平臺發(fā)展極大提高了計算性能,包 括每個CPU 搭載更多的計算內(nèi)核、集成型I/O 處理器(產(chǎn)生更 高存儲帶寬)、更快的附加內(nèi)存(通道)、更大的L3 高速緩存 大小、更快的磁盤存儲(如:用于ANSYS Mechanical 的固態(tài) 驅(qū)動器)、更快的互連以及Intel Advanced Vector Extensions 2 (AVX2) 支持。英特爾與ANSYS 一直攜手合作,以便ANSYS 解決方案能夠充分利用這些硬件發(fā)展帶來的優(yōu)勢。
采用INTEL XEON E5 V3 處理器
20 多年來,ANSYS 結(jié)構(gòu)力學(xué)產(chǎn)品一直可支持并行處理,使工程師能夠有效利用多核處理器和/ 或集群加速仿真。隨著16.0 版的發(fā)布, ANSYS 繼續(xù)進(jìn)行投資,添加了能夠利用 最新英特爾處理器技術(shù)的相關(guān)功能。
A N S Y S 用戶利用英特爾的最新 Xeon E5 v3 處理器能夠顯著縮短仿真 運行時間,這主要歸功于更多內(nèi)核(多 達(dá)18 個)、對Intel AVX2 的支持、更大 的L3 高速緩存(多達(dá)35MB)和更高 的存儲速度(多達(dá)2133MHz)。ANSYS Mechanical 16.0 采用英特爾的名為 Haswell 的E5 v3 處理器系列提高了性 能。E5 v3 系統(tǒng)針對迭代求解器基準(zhǔn)(通 常是存儲帶寬速度的良好指標(biāo))比E5 v2 平均快20%,而針對直接求解器基準(zhǔn) (通常是原始計算速度的良好指標(biāo))比 E5 v2 平均快40%。
采用INTEL XEON PHI 協(xié)處理器
為了利用最新硬件發(fā)展實現(xiàn)更快的 工程仿真技術(shù),ANSYS 自發(fā)布ANSYS 13.0 之后就開始與NVIDIA 合作開發(fā)和 推出基于通用圖形處理器(GPU)的并 行求解器執(zhí)行解決方案。GPU 目前能夠加速流體、結(jié)構(gòu)與電磁學(xué)仿真,以提高 ANSYS 高性能計算(HPC)功能的價值。
英特爾最近推出了設(shè)計上與高端 GPU 類似的Xeon Phi 系列協(xié)處理器。 它們是可插入PCI Express 插槽的全高 度卡,需要最低200W 的附加功率。但 是,此類協(xié)處理器并非針對顯卡,并且 不具備圖形顯示輸出連接(例如:HDMI 或顯示器端口)。每個Xeon Phi 協(xié)處理 器都包含大約60 個能夠執(zhí)行1 百萬兆次 浮點運算的內(nèi)核,而且具有8GB~16GB 的G D D R 5 內(nèi)存,以提供大量存儲帶 寬。這種新款硬件加速器能夠加快結(jié)構(gòu) 力學(xué)仿真。
實現(xiàn)方案
在結(jié)構(gòu)力學(xué)產(chǎn)品中開始實施對Xeon Phi 協(xié)處理器的支持之前,ANSYS 需要:
用戶體驗直接簡單。
Xeon Phi 硬件必須永遠(yuǎn)不降低仿真 速度,而且在適用時能夠加速仿真。
Xeon Phi 不會降低求解精確度。
為了利用Xeon Phi 協(xié)處理器加速 ANSYS 結(jié)構(gòu)力學(xué)仿真,相關(guān)軟件可以采 用GPU 加速器功能。雖然Xeon Phi 可 以實現(xiàn)其它執(zhí)行模型,不過GPU 加速器 是引入這種協(xié)處理器的最佳工具。由于稀疏直接求解器是默認(rèn)求解器并且常用 于各種分析,因此這種線性方程求解器 是最佳切入點。
ANSYS 16.0 — 效率與魯棒性
隨著發(fā)布16.0 版,ANSYS 繼續(xù)投資,以提高結(jié)構(gòu) 力學(xué)仿真的效率與魯棒性。 求解器指標(biāo)的關(guān)鍵改進(jìn)可以實現(xiàn)速度更快、更 穩(wěn)健的仿真。
眾多增強(qiáng)功能可以提高非線性分析的收斂。
稀疏求解器的改進(jìn)可以在內(nèi)核執(zhí)行更多任 務(wù),從而提高求解器性能。 在分布式存儲器并行計算方面進(jìn)行了眾多改進(jìn)。
進(jìn)一步改進(jìn)了域分解,從而提高了性能和規(guī) 模,特別在更多內(nèi)核數(shù)量情況下尤為如此。
最新增加的功能包括支持慣性釋放、 QRDAMP 特征值抽取法(模態(tài)分析中)和模 態(tài)疊加法(諧波響應(yīng)與瞬態(tài)分析中)。
?ANSYS Mechanical 16.0 采用Intel Xeon Phi 協(xié)處理器時的整體仿真加速率
ANSYS 用戶利用英特爾的最新Xeon E5 v3 處理器,能夠顯著縮短仿真運行時間。
A N S Y S M e c h a n i c a l 1 5 . 0 僅在 Linux® 平臺支持采用共享存儲器并行的 Xeon Phi 協(xié)處理器。但是,分布式存儲 器并行一般能夠提供比共享存儲器并行更高的加速效果,而且ANSYS 結(jié)構(gòu)力 學(xué)軟件通常在Windows® 平臺上運行。 ANSYS Mechanical 16.0 同時針對Linux 和Windows 平臺支持共享與分布式存儲 器并行。幾乎所有ANSYS 用戶(包括 其中每個計算節(jié)點都包含一個或多個協(xié) 處理器的集群的訪問用戶)都能夠采用 Xeon Phi 協(xié)處理器加速結(jié)構(gòu)力學(xué)仿真。
采用XEON PHI 加速
為了在ANSYS Mechanical 中利 用Xeon Phi 硬件,可以通過在命令行 參數(shù)列表中添加選項-acc intel,從而 在啟動軟件時激活GPU 加速器功能。 此外,您還可以使用-na N 選擇使用的 Xeon Phi 協(xié)處理器數(shù)量,其中N 是大于 0 的整數(shù)。(軟件默認(rèn)值是1,對應(yīng)單個 協(xié)處理器)。
通過修改‘求解過程設(shè)置’的‘高 級屬性’頁面上的G P U 加速選項, ANSYS Workbench 用戶在求解過程中可 以輕松啟用此功能。用戶可以在相關(guān)下 拉框中選擇‘INTEL’,然后選擇仿真過 程中使用的Xeon Phi 協(xié)處理器數(shù)量。啟 用此功能需要每個協(xié)處理器有一個附加 HPC 許可證。
一旦啟用后,此功能在可能的情況 下可以通過自動采用Xeon Phi 硬件加快 求解。無需用戶輸入。在無法加速的情 況下會繼續(xù)采用CPU 內(nèi)核,而Xeon Phi 功能對求解進(jìn)度不產(chǎn)生任何影響。
性能
ANSYS 對ANSYS Mechanical 進(jìn) 行了一系列標(biāo)準(zhǔn)基準(zhǔn)測試,以獲得性能 數(shù)據(jù)。基準(zhǔn)測試采用了運行Windows 7 x 64 SP1、具有128GB RAM、搭載 2 個總共具有16 個CPU 內(nèi)核的Intel E5-2670 (2.6 GHz) 處理器的工作站。在 工作站中使用了2 個Xeon Phi 7120A 協(xié) 處理器。
結(jié)果顯示采用Xeon Phi 通常能實現(xiàn) 一定程度的加速。不過,不同基準(zhǔn)測試 實現(xiàn)的加速程度大相徑庭,而且也取決 于所涉及的CPU 內(nèi)核數(shù)量。與僅采用2 個CPU 內(nèi)核相比,采用2 個CPU 內(nèi)核和1 個Xeon Phi 協(xié)處理器可以使整體仿 真平均加速2.1 倍。在采用16 個CPU 內(nèi)核情況下,增加2 個Xeon Phi 可以使 整體仿真平均加速1.4 倍。由于各基準(zhǔn) 測試性能各異,需要指南才能了解哪些 結(jié)構(gòu)力學(xué)模型能夠在采用Xeon Phi 協(xié)處 理器時實現(xiàn)最大加速。
使用指南
采用Xeon Phi 協(xié)處理器對于不同硬 件和仿真模型所實現(xiàn)的加速大相徑庭。 這些指南有助于確定相關(guān)協(xié)處理器是否 能夠提高性能。
采用更新、更快的CPU 硬件一般會 降低采用Xeon Phi 卡所能實現(xiàn)的加速。 每個Xeon Phi 協(xié)處理器使用更多CPU 內(nèi)核也會降低實現(xiàn)的加速效果。如果請 求一個或更多的協(xié)處理器,則可以使用所有可用的協(xié)處理器。不過,出于性能 原因,每個Xeon Phi 協(xié)處理器的進(jìn)程數(shù) 量被限制到最多8 個。
特定類型的仿真采用X e o n P h i 時能夠?qū)崿F(xiàn)更高加速。對于A N S Y S Mechanical 仿真,在下列情況下可以實 現(xiàn)更高加速:
● 在芯片內(nèi)存儲器模式下運行稀疏求解 器。
● 組合矩陣規(guī)模超過200 萬個方程式。
● 模型是三維,具有更大或更厚的幾何 結(jié)構(gòu),包含更高階的單元類型或者包 含特定類型的邊界條件(如:約束方 程式)。
通過持續(xù)協(xié)作提高價值
隨著硬件廠商提供的計算能力不斷提高,ANSYS 會繼續(xù)發(fā)揮這種新技術(shù) 的全部潛力。隨著廠商提供更多并行硬 件,ANSYS 開發(fā)人員會繼續(xù)在軟件中 并行化更多算法。對于結(jié)構(gòu)力學(xué)仿真而 言,這些工作具有重要意義 - 能夠確保 企業(yè)通過快速執(zhí)行日益復(fù)雜的仿真,而 滿足在市場中推出可靠創(chuàng)新產(chǎn)品的競爭 需求。
英特爾和ANSYS 會繼續(xù)攜手提供 極具價值、經(jīng)過優(yōu)化和測試的解決方 案。對于Xeon Phi 協(xié)處理器等新型硬件 加速器,主要限制是能夠轉(zhuǎn)移到加速器 設(shè)備的計算量。未來Xeon Phi 產(chǎn)品的目 標(biāo)是在能夠加速更多計算同時消除(通 過PCI Express 通道)向設(shè)備傳輸數(shù)據(jù) 的限制。
相關(guān)標(biāo)簽搜索:Ansys:如何減少有限元分析計算時間? Ansys有限元培訓(xùn) Ansys workbench培訓(xùn) ansys視頻教程 ansys workbench教程 ansys APDL經(jīng)典教程 ansys資料下載 ansys技術(shù)咨詢 ansys基礎(chǔ)知識 ansys代做 Fluent、CFX流體分析 HFSS電磁分析 Abaqus培訓(xùn)