研究06/04 24:44

後驗取樣法改進大型語言模型幻覺問題

研究論文指出，大型語言模型仍受幻覺問題困擾，近期工作嘗試使用基於符合性預測的統計技術來降低幻覺普遍性，並在理論與實證上取得成功。然而，這些方法以事後方式運作，將取樣過程視為原子操作，然後手術式地修改樣本以移除幻覺聲稱。這種過濾與生成之間的斷裂可能導致樣本不一致、不連貫，或不符合模型本身的概率分佈。此外，事後手術無法將概率質量轉移到更有用和有幫助的回應上。為解決這些問題，論文提出改為從近似後驗分佈中取樣，其中條件事件對應於一個校準的高評分區域。研究開發了一個針對條件序列生成設定的校準程序，有效識別該區域並實現目標風險控制。在實證應用中，將方法應用於開放式傳記生成和數學問題解決的案例研究；與先前工作相比，在獲得相同統計保證的同時，取得了更高的下游效用。

來源：網頁來源

網頁來源On the Persistent Effects of Lexicality in Large Language Mod
網頁來源Linguistic Productivity in Large Language Models: Models Coerce, but do not Preempt
網頁來源Conformal Language Modeling via Posterior Sampling