異構大型語言模型推理與微調優化框架

開發工具

KTransformers 是一個靈活框架，透過 CPU-GPU 異構計算優化大型語言模型的推理與微調效能。

此 GitHub 開源專案 KTransformers 專注於透過異構計算（如 CPU-GPU 協作）提升大型語言模型（LLM）的推理與微調效率。專案提供靈活的框架，支持多種硬體平台（包括 CPU、GPU、NPU）和最新模型（如 DeepSeek-V4、GLM-5、Kimi-K2 等），並具備多層級緩存與專家調度機制。適用於 AI 研究者、開發者，在消費級硬體上高效運行大型模型或進行微調實驗。README 說明詳細，提供多個教學文件與整合方案，如與 LLaMA-Factory 集成，方便用戶快速上手。

Repokvcache-ai/ktransformers

Stars⭐ 17,280

Forks1,313

語言Python

分類開發工具

標籤