MNN:輕量級高效推理引擎,專為邊緣 AI 和 LLM 設計

本地 AI

MNN 為阿里巴巴推出的輕量級推理引擎,專為邊緣裝置提供高效能的 LLM 推理與 AI 應用支援。

此 GitHub 開源專案 MNN 由阿里巴巴開發並維護,是一個快速且輕量級的推理引擎,專門為邊緣 AI 和大型語言模型(LLM)設計。專案提供高效能的推論能力,適用於嵌入式裝置、移動平台等資源受限環境,支援多種深度學習架構如 Vulkan 和 ARM 處理器。README 說明中指出,MNN 已經過阿里巴巴的實戰測試,並整合了多種應用程式範例,例如 MNN Chat App 和 TaoAvatar,讓使用者能在本地裝置上執行 LLM、ASR、TTS、圖像生成等功能。此外,專案持續更新,支援 Qwen3.5 等最新模型系列。適用場景包括邊緣裝置上的 AI 推理、移動應用開發、嵌入式系統部署,以及需要高效能低功耗模型推論的專案。

Stars15,480
Forks2,352
語言C++
分類本地 AI
標籤
inferenceedge-aillmembedded-devicesdeep-learningmobile
GitHub Topics
armconvolutiondeep-learningembedded-devicesllmmachine-learningmlmnntransformervulkanwinograd-algorithm