基於 TileLang 的高效能 LLM 運算元庫

開發工具

為大型語言模型設計的 GPU 運算元庫,支援 spec-driven 開發與自動調優,提升訓練與推理效能。

此 GitHub 開源專案 TileOPs 是一個專為大型語言模型(LLM)設計的高效能 GPU 運算元庫,基於 TileLang 構建。它採用 spec-driven 開發模型,允許 AI 代理讀取聲明式運算元規格,自動生成核心實現並進行效能評估。架構上分為兩層:無狀態的 Python 入口點(Op)負責驗證和類型轉換,TileLang GPU 實現(Kernel)進行硬體特定優化,支援 Ampere 和 Hopper 架構。專案提供自動調優功能,透過搜尋 tile 大小和調度參數來優化效能。適用於 LLM 訓練和推理場景,幫助開發者高效構建和優化模型。

Stars145
Forks41
語言Python
分類開發工具
標籤
llmgpuoperator-librarytilelangperformance-optimizationauto-tuning