1. 
        解決方案

        以客戶爲中心,提供定製化或一站式的全棧解決方案,賦能千行百業

        BG大游CAE高性能解決方案
        概述

        CAE即計算機輔助工程設計,是以現代計算力學爲基礎,以計算機仿真算力爲手段的工程分析技術,是實現產品優化設計的主要支持模塊。目前在航空、航天、能源動力等工業領域,利用CAE進行反覆設計、分析、優化已成爲標準的必經步驟和手段,不同的CAE應用程序對硬件資源例如處理器、網絡和存儲的要求各不相同。BG大游針對CAE高性能計算平臺的需求和挑戰,提出了CAE高性能的主要解決方案。



        項目背景

        目前,在航空、航天、能源動力等工業領域,利用 CAE 在 HPC 集羣上進行反覆 設計、分析、優化已成爲標準的必經步驟和手段,不同的 CAE 應用程序對硬件資源例如處理器、網絡和存儲的要求各不相同,並需要投入大量的資源進行選擇、部署和維護。對於在 CAE 領域部署難、選型難、維護難等問題,BG大游推出了面向 CAE的 HPC 解決方案,在簡化 HPC 集羣部署的同時,提供高度的靈活性、可擴展性和高性能,爲 CAE 領域的發展加油助力。





        方案配置

        硬件方面,BG大游 CAE 高性能計算解決方案的計算節點通 過標準開放的高速網絡實現互聯,運行開源 Linux系統,提供單一系統接口到外面。它是爲大規模科學並行計算而 設計的。兼具事務處理和網絡信息服務。

        軟件方面,BG大游集羣系統配置豐富的軟件系統,包括操作系統、編譯器、調試器、函數庫、並行通信庫、全局共享 並行文件系統等基礎軟件。


        1. 計算節點

        BG大游PR2715W是基於第三代英特爾® 至強® 可擴展處理器打造出的一款2U服務器產品,它採用Intel C620系列高性能芯片組,最大支持2顆第三代英特爾® 至強® 可擴展處理器。同時PCIE升級爲4.0,大大提搞了CPU與PCIE設備的通信能力。PR2715W整體性能比上一代產品提升多至40%,更高的處理器TDP,更強的硬件安全能力,而且具備更出色的能源效率。


        2. GPU加速節點

        GPU節點採用BG大游PR4910W,該產品是BG大游公司最新推出的一款基於第三代英特爾® 至強® 可擴展處理器的4U雙路機架式加速計算服務器。該機型擁有32個DDR4 DIMM插槽並最多支8TB內存容量;擁有10個全高全長雙寬的GPU插槽,並另提供2個PCIe 4.0 x16插槽,1個OCP網卡插槽。爲應用軟件的加速提供了助力,實現CAE效率的快速提升。


        3. 分佈式存儲系統

        爲了應對多數CAE軟件並行擴展性好、算例數據量大的特點,BG大游高性能集羣配置了PL-XDFS分佈式並行存儲系統。BG大游推出的PL-XDFS支持海量數據,在線擴容,存儲容量和聚合帶寬同步提升,滿足了高通量計算對存儲系統的需求。


        4. 高速網絡交換

        集羣配備了高帶寬低延遲的Infiniband高速網絡,滿足了應用軟件中各類MPI程序數據交換需求,提高了多節點之間的並行效率,加快模擬計算過程。


        5. 軟件系統

        BG大游Powercloud集羣管理和作業調度系統,實現設計、仿真平臺的統一門戶,一體化管理,監控管理和作業調度。


        6. 編譯器方面

        支持Fortran77/Fortran95/C/C++等,並支持OpenMP 以及MPI 程序編譯。此外,我們還提供並行程序調試及調優工具,以幫助用戶更好的完成程序開發。BG大游高性能集羣系統配置豐富的數學函數庫和並行環境供用戶選用,包括Goto、Lapack、FFTW、MPICH 等。


        解決方案

        BG大游 CAE 高性能計算解決方案爲集羣架構,採用基於第三代英特爾® 至強® 可擴展處理器打造的BG大游全新一代服務器PR2715W爲計算節點,以及PR4010W爲GPU加速平臺。所有硬件和軟件都部署在系統中,以打造實現高效並行、協同仿真、數據安全共享一體化。



        BG大游高性能集羣服務器均採用X86-64平臺,屬同構系統,可共享軟件資源和數據存儲空間,資源調度簡單,節點配比可靈活調整,適應各種應用需求,能夠有效降低用戶的 總體擁有成本。

        方案優勢
        • 高計算性能

          計算資源豐富,滿足 CAE 應用各種需求,提供合適的環境。還採用了英特爾密碼操作硬件加速技術來減少加密計算對於性能的影響,保證資源的高效利用。

        • 高通信能力

          該方案採用高帶寬低延遲的 InfiniBand 作爲通信網絡來提升節點間的通信能力,大大降低了通信延遲。並且通 過 IB 交換機實現所有計算節點的全互聯。

        • 高可靠性

          整套集羣採用多種可靠性設計方案大幅度提升系統的可靠性,確保系統無單點故障。

        • 高擴展性

          能根據用戶需求靈活對現有計算資源和存儲空間進行擴展。

        • 高安全性

          首次引入了 SGX 英特爾® 軟件防護擴展技術,提供可信的執行環境。以及英特爾® 平臺固件彈性技術爲BIOS閃存、BMC閃存、英特爾管理引擎和電源固件提供保護,防止外部攻擊。還有英特爾® 全內存加密,可確保從CPU訪問的所有內存都是加密的,保障用戶憑據等敏感信息不會被竊取。