返回事件流

Google DeepMind 發布開源模型 DiffusionGemma 加速文字生成

媒體報導指出,Google DeepMind 團隊本周公布了一個實驗性新語言模型,代號為 DiffusionGemma。這是一個 260 億參數的混合專家模型,不同於傳統大型語言模型,它採用了原本為 AI 圖像生成器開發的擴散技術,能同時生成整個段落的標記,類似於 Stable Diffusion 或 Flux 的去噪過程。據報導,DiffusionGemma 在資源受限的消費級硬體上運行時,可將文字輸出性能提升多達 4 倍,僅需 18 GB DRAM 或 VRAM 即可運行,免費下載。Google 將其定位為實驗模型,許可為 Apache 2.0,並已整合到 vLLM、MLX 和 HF Transformers 等推理引擎中,Llama.cpp 支援即將到來。與 Gemma 4 12B 相比,DiffusionGemma 在 GPQA-Diamond 基準測試中略遜一籌,但主要優勢在於輸出速度,特別是在單一 Nvidia H100 上運行時,速度提升近 4 倍。這反映了 Google 正在探索本地部署技術以降低雲端成本,同時為 AI 愛好者提供更多選擇。

來源:媒體報導