研究06/02 05:06

MiniMax 發布 MiniMax M3 模型，支援 1M-token 上下文與多模態

媒體報導指出，MiniMax 於2026年6月1日正式發布了 MiniMax M3 模型，這是 M 系列中繼 M2.7 之後的下一代版本。該模型的核心創新在於 MSA（MiniMax Sparse Attention）架構，這是一種稀疏注意力機制，將 KV 快取分為更精確的區塊，在保持高有效上下文覆蓋率的同時，將計算成本降低到每 token 僅為前代模型的 1/20。在 1M-token 上下文長度下，預填充階段加速超過 9 倍，解碼階段加速超過 15 倍。性能基準測試方面，MiniMax M3 在 SWE-Bench Pro 上得分 59.0%，超越 GPT-5.5 和 Gemini 3.1 Pro；在 Terminal-Bench 2.1 上得分 66.0%；並在多模態文檔理解基準 OmniDocBench 上表現優異。模型還支持原生多模態輸入，從訓練初期就整合了文本、圖像和視頻數據，並能操作桌面電腦。MiniMax 提供了三個實際任務示例：論文複製、CUDA 內核優化和自主模型訓練，展示了其在長上下文和代理編碼方面的強大能力。模型現已通過 MiniMax Code、Token Plan 和 API 提供，權重和技術報告將在十天內發布。

來源

來源：媒體報導

媒體報導MiniMax Releases MiniMax M3 with MSA Architecture Supporting 1M-Token Context, Native Multimodality, and Agentic Coding