Xinference：統一開源模型推理平台

模型服務

通過一行程式碼替換 GPT，在雲端、本地或筆記型電腦上運行開源、語音和多模態模型，提供統一生產就緒的推理 API。

此 GitHub 開源專案 Xinference 是一個功能強大且多用途的框架，專為服務語言、語音識別和多模態模型而設計。通過單一命令，用戶可以輕鬆部署和服務各種開源或內建的最新型號。Xinference 提供統一的 API，支持在雲端、本地環境或個人筆記型電腦上運行模型，實現生產就緒的推理服務。其特色包括自動批次處理以提升吞吐量、分佈式推理跨多個工作者運行模型、以及與 Xagent 集成支持代理原生服務。此外，內建支援多種先進模型，如 DeepSeek、GLM 和 Qwen 等。適用場景包括 AI 模型部署、自託管推理服務，以及替代商業 API 的解決方案，適合研究人員、開發者和數據科學家使用。

Repoxorbitsai/inference

Stars⭐ 9,349

Forks835

語言Python

分類模型服務

標籤

GitHub Topics