MiniMax 發布 MiniMax M3 模型,支援 1M-token 上下文與多模態
媒體報導指出,MiniMax 於2026年6月1日正式發布了 MiniMax M3 模型,這是 M 系列中繼 M2.7 之後的下一代版本。該模型的核心創新在於 MSA(MiniMax Sparse Attention)架構,這是一種稀疏注意力機制,將 KV 快取分為更精確的區塊,在保持高有效上下文覆蓋率的同時,將計算成本降低到每 token 僅為前代模型的 1/20。在 1M-token 上下文長度下,預填充階段加速超過 9 倍,解碼階段加速超過 15 倍。性能基準測試方面,MiniMax M3 在 SWE-Bench Pro 上得分 59.0%,超越 GPT-5.5 和 Gemini 3.1 Pro;在 Terminal-Bench 2.1 上得分 66.0%;並在多模態文檔理解基準 OmniDocBench 上表現優異。模型還支持原生多模態輸入,從訓練初期就整合了文本、圖像和視頻數據,並能操作桌面電腦。MiniMax 提供了三個實際任務示例:論文複製、CUDA 內核優化和自主模型訓練,展示了其在長上下文和代理編碼方面的強大能力。模型現已通過 MiniMax Code、Token Plan 和 API 提供,權重和技術報告將在十天內發布。
來源
來源:媒體報導