快訊06/11 04:36

Google DeepMind 發布開源模型 DiffusionGemma 加速文字生成

媒體報導指出，Google DeepMind 團隊本周公布了一個實驗性新語言模型，代號為 DiffusionGemma。這是一個 260 億參數的混合專家模型，不同於傳統大型語言模型，它採用了原本為 AI 圖像生成器開發的擴散技術，能同時生成整個段落的標記，類似於 Stable Diffusion 或 Flux 的去噪過程。據報導，DiffusionGemma 在資源受限的消費級硬體上運行時，可將文字輸出性能提升多達 4 倍，僅需 18 GB DRAM 或 VRAM 即可運行，免費下載。Google 將其定位為實驗模型，許可為 Apache 2.0，並已整合到 vLLM、MLX 和 HF Transformers 等推理引擎中，Llama.cpp 支援即將到來。與 Gemma 4 12B 相比，DiffusionGemma 在 GPQA-Diamond 基準測試中略遜一籌，但主要優勢在於輸出速度，特別是在單一 Nvidia H100 上運行時，速度提升近 4 倍。這反映了 Google 正在探索本地部署技術以降低雲端成本，同時為 AI 愛好者提供更多選擇。

來源：媒體報導

媒體報導Google's new open-weights model brings image-generation tricks to AI text generation
工具官網DiffusionGemma