阿里雲最佳實踐頻道:【點擊查看更多上雲最佳實踐】
這裡有豐富的企業上雲最佳實踐,從典型場景入門,提供一系列項目實踐方案,降低企業上雲門檻的同時滿足您的需求!
場景描述
本方案適用於AI圖片訓練場景,尤其是對性能要求苛刻,業務交付緊迫的場景。例如自動駕駛的模型訓練(圖片)等AI模型訓練的場景。本方案使用了SCC超級計算集群,採用彈性裸金屬GPU服務器+並行文件系統CPFS+RDMA網絡+阿里雲容器服務Kubernetes版+飛天AI加速訓練工具,提供極致性能穩定的訓練環境,保障業務能力。
解決問題
- 搭建AI圖片訓練基礎環境。
- 使用CPFS存儲訓練數據
- 使用飛天AI加速訓練工具加速訓練
- 使用Arena一鍵提交作業
產品列表
- 容器服務Kubernetes版
- CPFS
- 超級計算集群SCC
- 神龍GPU服務器