斯坦福大學的研究人員利用維基百科數據訓練了一個大模型,命名為WikiChat,通過優(yōu)化和改進,成功解決了大模型的幻覺問題,并在事實準確性和其他指標上表現優(yōu)秀。他們的最佳模型在新的基準測試中獲得了97.3%的事實準確性,遠遠超過了GPT-4的66.1%。此外,WikiChat還在相關性、信息性、自然性、非重復性和時間正確性方面領先其他模型。

為了解決幻覺問題,研究人員采用了檢索增強生成(RAG)的方法,并添加了幾個重要步驟來進一步減輕幻覺,并改進對話性指標。通過這些優(yōu)化,WikiChat在事實準確性方面比微調后的SOTA RAG模型Atlas高出8.5%。此外,研究人員還將基于GPT-4的WikiChat提煉成7B參數的LLaMA模型,這個模型在事實準確性方面能達到91.1%的高分,并且運行速度提高了6.5倍,能效更好,可以本地部署。
然而,解決大模型的幻覺問題并不容易。一般情況下,當檢索不到相關信息或知識庫中沒有相關信息時,大模型會產生幻覺來填補空白。為了解決這個問題,WikiChat通過匯總和過濾檢索到的信息,而不是直接生成響應。同時,研究人員還教導了LLM理解時間背景,以及在必要時讓系統(tǒng)說「我不知道」。
通過結合大模型和維基百科數據,研究人員成功地提高了聊天機器人的性能。WikiChat的成功表明,維基百科數據在大模型訓練中發(fā)揮了重要作用,通過檢索增強生成的方法,可以有效解決大模型的幻覺問題,提高模型的事實準確性和對話性能。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創(chuàng)作風格。
IDC今日發(fā)布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。