Xinference:統一開源模型推理平台

模型服務

通過一行程式碼替換 GPT,在雲端、本地或筆記型電腦上運行開源、語音和多模態模型,提供統一生產就緒的推理 API。

此 GitHub 開源專案 Xinference 是一個功能強大且多用途的框架,專為服務語言、語音識別和多模態模型而設計。通過單一命令,用戶可以輕鬆部署和服務各種開源或內建的最新型號。Xinference 提供統一的 API,支持在雲端、本地環境或個人筆記型電腦上運行模型,實現生產就緒的推理服務。其特色包括自動批次處理以提升吞吐量、分佈式推理跨多個工作者運行模型、以及與 Xagent 集成支持代理原生服務。此外,內建支援多種先進模型,如 DeepSeek、GLM 和 Qwen 等。適用場景包括 AI 模型部署、自託管推理服務,以及替代商業 API 的解決方案,適合研究人員、開發者和數據科學家使用。

Stars9,349
Forks835
語言Python
分類模型服務
標籤
inferencellmopenai-apipytorchvllmwhisper
GitHub Topics
artificial-intelligencechatglmdeploymentflan-t5gemmaggmlglm4inferencellamallama3llamacppllmmachine-learningmistralopenai-apipytorchqwenvllmwhisperwizardlm