擴散模型幻覺減少的評分控制
擴散模型已成為現代生成式AI的骨幹,推動了視覺、語言、音訊等領域的進展。然而,它們存在幻覺問題,即生成超出真實數據分佈的不可信樣本,降低了可靠性和信任度。研究論文首先實證確認了先前假說,即評分平滑度導致圖像生成擴散模型中的幻覺,並提供了基於密度的視角。進一步,研究將幻覺概率質量與學習評分函數的利普希茨常數相聯繫,為此提出了一種方差引導評分調制策略,通過控制評分雅可比矩陣來減少評分平滑度,更好地逼近真實評分,從而減少幻覺。在合成和真實數據集上的實驗結果顯示,該方法將幻覺減少達25%,同時保持高保真度和多樣性,為更可靠的擴散模型圖像生成提供了原則性步驟。論文還提出了兩個具有極端語義變化的基準數據集,用於系統性幻覺評估,代碼和數據集已公開於GitHub。
來源:Hugging Face / 論文來源