Tenstorrent TT-Metal AI 加速器運算庫

開發工具

提供 TT-NN 操作庫與 TT-Metalium 低級核函數編程模型,專為 Tenstorrent AI 加速器硬體優化 LLM 和生成式 AI 模型效能。

此 GitHub 開源專案提供 TT-NN 操作庫和 TT-Metalium 低級核函數編程模型,專為 Tenstorrent 的 AI 加速器硬體設計。README 說明中展示了多種模型的性能優化範例,包括 Llama 3.3 70B、Qwen 2.5 7B 和 72B 等大型語言模型,以及 Stable Diffusion 等圖像生成模型,並附有詳細基準測試數據,如時間到首標記(TTFT)和每秒標記數(T/S)。專案適用於 AI 開發者在 Tenstorrent 硬體上高效運行推理任務,支援硬體加速和平行處理(如張量平行與資料平行),同時提供完整的 API 參考和模型示範,便於低級效能調優。

Stars1,516
Forks494
語言C++
分類開發工具
標籤
aiacceleratorgpullmkernelsmetaltenstorrent
GitHub Topics
acceleratoraicudadeepseekgpuimg-genkernelsllamallmmetalscale-outstable-diffusiontenstorrentvideo-gen