NVIDIA A40 TENSOR CORE GPU
NVIDIA A40 可加速數據中心要求嚴苛的視覺計算工作負載,將最新的NVIDIA Ampere 架構 RT Core、Tensor Core 和 CUDA® 核心與 48 GB圖形顯存相結合。從可以隨時隨地訪問的強大虛擬工作站到專用的渲染節點,NVIDIA A40 將新一代 NVIDIA RTX™ 技術引入數據中心,處理更先進的專業可視化工作負載。
通用計算、異構計算、協同計算、邊緣計算等多元產品佈局
NVIDIA A30 Tensor Core GPU 是用途廣泛的主流計算 GPU, 適用於 AI 推理和主流企業工作負載。這款 GPU 採用 NVIDIA Ampere 架構的 Tensor Core 技術,支持廣泛的數學精度, 可針對每個工作負載提供單個加速器。
專爲大規模 AI 推理而構建的同一計算資源能夠通過 TF32 精度快速重新訓練 AI 模型,同時還能借助 FP64 Tensor Core 加速高性能計算 (HPC) 應用。多實例 GPU (MIG) 及 FP64 Tensor Core,可在 165W 低功率電路下相結合,實現速度 高達 933GB/s 的顯存帶寬,以上特性均在這一適用於主流 服務器的 PCIe 卡上體現。
通過結合使用第三代 Tensor Core 與 MIG 技術,其可在各種工作負載中提供安全的服務質量,所有這些技術都由多功能 GPU 提供支持,從而實現彈性數據中心。A30 在各個規模的 工作負載中都具有多用途計算能力,能夠儘可能地爲主流 企業創造價值。
A30 是整個 NVIDIA 數據中心解決方案的一部分,該解決方案由硬件、網絡、軟件、庫以及 NGC™ 中經優化的 AI 模型和 應用等構成。作爲性能超強的端到端數據中心專用 AI 和 HPC 平臺,A30 可助力研究人員交付真實結果,並將解決方案 大規模部署到生產環境中。
A30 TENSOR CORE GPU 規格 | ||
---|---|---|
FP64 | 5.2 teraFLOPS | |
FP64 Tensor Core | 10.3 teraFLOPS | |
FP32 | 10.3 teraFLOPS | |
TF32 Tensor Core | 82 teraFLOPS | 165 teraFLOPS* | |
BFLOAT16 Tensor Core | 165 teraFLOPS | 330 teraFLOPS* | |
FP16 Tensor Core | 165 teraFLOPS | 330 teraFLOPS* | |
INT8 Tensor Core | 330 TOPS | 661 TOPS* | |
INT4 Tensor Core | 661 TOPS | 1321 TOPS* | |
媒體引擎 | 1 個光流加速器 (OFA) 1 個 JPEG 解碼器 (NVJPEG) 4 個視頻解碼器 (NVDEC) | |
GPU 顯存 | 24GB HBM2 | |
GPU 顯存帶寬 | 933GB/s | |
互聯 | PCIe Gen4: 64GB/s 第三代 NVLINK:200 GB/s** | |
外形規格 | 雙插槽、全高、全長 (FHFL) | |
最大熱設計功耗 (TDP) | 165W | |
多實例 GPU (MIG) | 4 個 GPU 實例,每個 6 GB 2 個 GPU 實例,每個 12GB each 1 個 GPU 實例,24 GB | |
虛擬 GPU (vGPU) 軟件支持 | 適用於 的 NVIDIA AI Enterprise NVIDIA 虛擬計算服務器 |