近日,阿里雲異構計算宣佈上線gn7 GPU系列雲服務器,即日起開放售賣。gn7系列實例是阿里雲新一代GPU計算實例,主要面向AI訓練和高性能計算應用。該產品基於NVIDIA A100 Tensor Core GPU打造,雲服務器中的8塊A100 GPU以NVIDIA NVSwitch實現了GPU之間的NVLink直接通信。
結合最新支持的Tensor Core加速能力,阿里雲gn7雲服務器最高可讓AI最佳性能提升20倍,高性能計算速度提升2.5倍,單卡最高支持19.5TFlops(FP64)、156TFlops (TF32)、312 TFlops(FP16 混合精度)的運算。對於大模型訓練的場景,阿里雲自研的神龍AI加速引擎AIACC可以通過優化多GPU訓練通信效率,進一步提升多GPU和多機並行訓練的加速比,為AI研發過程節省更多的時間和成本。
第一批上線的產品為效率最高的阿里雲神龍裸金屬實例ebmgn7, 用戶可直接獲得一臺完整的配置有Intel 2代Xeon Scalable 52核CPU、768G系統內存和由 NVSwitch互聯的8顆A100 的GPU服務器主機。
隨著人工智能的不斷髮展,深度學習的訓練模型越來越龐大和複雜,訓練模型需要的算力也在快速增長。針對AI訓練和高性能計算的算力需求,NVIDIA於今年5月推出了 A100 GPU。NVIDIA A100 GPU基於最新NVIDIA 安培(Ampere)架構,不僅通過製程優化提升了計算性能,同時優化了計算架構,其第三代Tensor Core可以對單精度及雙精度進行加速,大幅提升了整體計算性能。
阿里雲gn7系列雲服務器上線,意味著各大企業可以立即開始使用最新一代的GPU的強大算力。該系列實例適合深度學習場景,如圖像識別、無人駕駛、語音識別等人工智能算法的訓練應用;也適用於諸如計算流體動力學、計算金融學、分子動力學、環境分析等GPU加速的高性能計算場景。
雲是獲取AI算力最為便捷的方式,相較於自行購買服務器,用戶可以按需要隨時購買GPU實例資源,訓練和推理任務結束時,自動釋放/停止GPU實例資源。阿里雲擁有亞洲最大的異構計算集群,加上秒級交付的彈性能力,為行業提供強大的AI算力。
針對人工智能場景,阿里雲異構計算提供了軟硬一體性能優化方案,自研的飛天AI加速器(AIACC)是業界首個支持Tensorflow、PyTorch、MXNet、Caffe等主流開源框架的深度學習加速引擎,它針對訓練場景和推理場景,結合阿里雲的網絡和異構計算架構作了優化,雲上訓練有2-14倍的性能提升,推理場景下性能提升2-6倍。
阿里雲異構計算產品大圖
前不久,阿里雲異構計算也推出了獨有的cGPU容器技術和彈性加速計算實例(EAIS),與神龍AI加速引擎(AIACC)一起組成阿里雲異構計算的三大特色優勢,為用戶提供靈活高效、性能超群的異構計算基礎設施。
點擊“閱讀原文”,瞭解阿里雲gn7實例的更多詳情。