• 
    應用案例

    經過20多年的發展,BG大游持續而深刻地把握市場需求,積累了海量的客戶資源和豐富的服務經驗

    BG大游 HPC 方案助力石油勘探軟件加速
    案例背景

    易源興華公司是我國石油勘探領域內一支強有力的研發隊伍,其在地震偏移處理及解釋方面開發了一套獨有的高效軟件,代表了在這一領域的最高技術水平。公司主要客戶涵蓋中國海洋石油、中國石油等石油勘探研究所。石油勘探系統包括三個環節:數據採集、地震偏移處理、成像解釋。其中的關鍵應用爲地震偏移處理。BG大游集羣主要支持後兩者。地震偏移處理對計算機廠商的要求最爲苛刻,要求計算機具備高 IO 帶寬,高計算能力。一直以來,SGI、SUN、IBM 等國際 IT 巨頭憑藉多年來在該領域積累的經驗壟斷了這一市場,包括易源興華公司在內的石油行業一直採用國外產品。近年來,我國開始自主研發石油系統地震偏移處理軟件,力求打破了國際軟件廠商的壟斷。在硬件方面,國產廠商也不斷髮力,縮小了同國際廠商之間的差距,開始登上石油勘探領域的舞臺。在認真分析客戶需求的基礎上,BG大游打出了一套組合牌,成功贏得這個項目。

    案例分析

    在瞭解 CGG、Omega 等地震偏移軟件方面的資料後發現石油行業高性能計算應用,要求硬件設備具備以下幾個特性:
    節點的高可靠性,避免計算節點和管理節點頻繁死機。
    I/O 的高併發及高帶寬訪問,由於節點數較多,存儲系統不僅需要滿足高併發的讀寫訪問需求,而且還要提供高帶寬的讀寫相應能力具有便捷的集羣管理方案,提供簡單易用的集羣管理工具和接口。
    多套針對不同應用的網絡,數據網、計算網和管理網分離,互相無幹擾。
    針對上述應用分析的結果,我們設計了一套高性能計算集羣整體解決方案。

    解決方案

    計算部分包含 50 臺 2U 機架式 CPU 計算節點,10 臺 2U 機架式 GPU 計算節點及相應輔助節點。共擁有 20Tflops 的計算能力。其中每臺 CPU 計算節點根據應用特點,特別設計了由 7 塊高速 SAS 盤做 RAID0 組成的高性能本地數據盤。每臺 GPU 計算節點,特別設計了由3 塊 GPU 加速的高性能異構計算環境。網絡部分採用網絡分離結構,包括管理網和計算網。管理網絡設計使用最普遍的千兆以太網作爲整個集羣的管理網。它保障了所有節點最基本的互通互聯需求,方便了管理員遠程登陸。同時也肩負操作硬件底層芯片實現遠程開關機等功能的重任。計算網絡全部使用萬兆低延遲無阻塞以太網作爲數據傳輸通路,使數據無阻塞、高效快速的轉發。保障了集羣所有節點之間的數據的高速可靠傳遞。通過以上網絡配置的組合。存儲部分基於高性能計算集羣的“統一數據池”的特點,針對目前石油勘探計算平臺的現狀以及未來的發展趨勢。爲了有效相應前端數以百計的計算節點大規模高併發長時間訪問的需求。後端存儲既要具有高帶寬的特性,又要有高 IOPS 的特性。傳統的 SAN 文件系統和 NAS 文件系統是遠遠無法滿足實際需求的。BG大游設計了一套分佈式的海量存儲系統。整套系統可提供 256TB的可使用空間,以及 5GBps 的實際使用帶寬,保證數據調用的暢通無阻。存儲具有大容量文件共享、高效海量併發訪問、可定製的數據安全性保證、低總體擁有成本、方便的系統管理等諸多特點。軟件部分我們採用聯科的 Chess 軟件。Chess 集羣軟件系統是對高性能計算行業,耗時多年開發出來的一套功能完善的大規模服務器集羣管理軟件。它擁有強大的工作負載管理平臺,簡化了 HPC 集羣管理。它爲客戶提供了全方位的集羣監控管理、作業調度等功能。可以精細展現當前集羣運行狀態,動態顯示監控信息,記錄歷史錯誤信息,及時發現集羣的異常狀況。在集羣軟件系統的管理平臺中,整合了集羣監控,作業提交,節點監控,web 遠程登陸等功能。

    客戶收益

    方案綜合考慮了大規模集羣系統的瓶頸問題,消除了計算節點,網絡,存儲和軟件上的諸多瓶頸。
    解決了管理節點和計算節點因內存佔用導致的頻繁死機問題。
    I/O 帶寬和 IOPS 能力顯著增加。有效解決了了存儲端拖慢整個集羣情況。
    在集羣管理方面,提供了簡單易用的集羣管理工具和接口。
    計算網和管理網分離,互相無幹擾。