Nebius AI Cloud 解決方案庫

自動化

提供 Terraform 和 Helm 解決方案,簡化在 Nebius AI Cloud 上部署和管理 AI 應用程式的流程。

此 GitHub 開源專案是一個精選的解決方案庫,專為在 Nebius AI Cloud 上部署和管理人工智慧(AI)與機器學習(ML)應用程式而設計。專案使用 Terraform 和 Helm 工具,提供多種預配置方案,包括訓練環境設定(如 Kubernetes 和 SLURM 集群)、網路安全配置(如 Wireguard VPN 和 Bastion 主機)、以及第三方整合(如 Anyscale 和 SkyPilot)。這些解決方案旨在優化 GPU 資源利用、提升網路效能,並簡化複雜基礎設施的部署流程。適用於需要高效能運算的 AI 開發者和企業,幫助快速啟動和管理 AI/ML 工作負載。README 說明中詳細介紹了各個解決方案的用途和設置步驟,並強調對 InfiniBand 技術的支持,以確保數據密集型任務的高效執行。

Stars102
Forks38
語言HCL
分類自動化
標籤
terraformhelmkubernetesslurmgpuinfinibandaimlcloud