後驗取樣法改進大型語言模型幻覺問題
研究論文指出,大型語言模型仍受幻覺問題困擾,近期工作嘗試使用基於符合性預測的統計技術來降低幻覺普遍性,並在理論與實證上取得成功。然而,這些方法以事後方式運作,將取樣過程視為原子操作,然後手術式地修改樣本以移除幻覺聲稱。這種過濾與生成之間的斷裂可能導致樣本不一致、不連貫,或不符合模型本身的概率分佈。此外,事後手術無法將概率質量轉移到更有用和有幫助的回應上。為解決這些問題,論文提出改為從近似後驗分佈中取樣,其中條件事件對應於一個校準的高評分區域。研究開發了一個針對條件序列生成設定的校準程序,有效識別該區域並實現目標風險控制。在實證應用中,將方法應用於開放式傳記生成和數學問題解決的案例研究;與先前工作相比,在獲得相同統計保證的同時,取得了更高的下游效用。
來源:網頁來源