国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

AI胡說八道這事,終于有人管了?

人工智能 新聞
來自蘇黎世聯(lián)邦理工學(xué)院(ETH)和 MATS 的一項(xiàng)新研究提出了一種低成本、可擴(kuò)展的檢測方法,能夠?qū)崟r(shí)識別長篇內(nèi)容中的「幻覺 token」,并成功應(yīng)用于高達(dá) 700 億(70B)參數(shù)的大型模型。

想象一下,如果 ChatGPT 等 AI 大模型在生成的時(shí)候,能把自己不確定的地方都標(biāo)記出來,你會(huì)不會(huì)對它們生成的答案放心很多?

上周末,OpenAI 發(fā)的一篇論文引爆了社區(qū)。這篇論文系統(tǒng)性地揭示了幻覺的根源,指出問題出在獎(jiǎng)勵(lì)上 —— 標(biāo)準(zhǔn)的訓(xùn)練和評估程序更傾向于對猜測進(jìn)行獎(jiǎng)勵(lì),而不是在模型勇于承認(rèn)不確定時(shí)給予獎(jiǎng)勵(lì)。可能就是因?yàn)橐庾R到了這個(gè)問題,并找出了針對性的解法,GPT-5 的幻覺率大幅降低。

隨著 AI 大模型在醫(yī)療咨詢、法律建議等高風(fēng)險(xiǎn)領(lǐng)域的應(yīng)用不斷深入,幻覺問題會(huì)變得越來越棘手,因此不少研究者都在往這一方向發(fā)力。除了像 OpenAI 那樣尋找幻覺原因,還有不少人在研究幻覺檢測技術(shù)。然而,現(xiàn)有的幻覺檢測技術(shù)在實(shí)際應(yīng)用中面臨瓶頸,通常僅適用于簡短的事實(shí)性查詢,或需要借助昂貴的外部資源進(jìn)行驗(yàn)證。

針對這一挑戰(zhàn),來自蘇黎世聯(lián)邦理工學(xué)院(ETH)和 MATS 的一項(xiàng)新研究提出了一種低成本、可擴(kuò)展的檢測方法,能夠?qū)崟r(shí)識別長篇內(nèi)容中的「幻覺 token」,并成功應(yīng)用于高達(dá) 700 億(70B)參數(shù)的大型模型。

  • 論文標(biāo)題:Real-Time Detection of Hallucinated Entities in Long-Form Generation
  • 論文地址:https://arxiv.org/abs/2509.03531
  • 代碼地址:https://github.com/obalcells/hallucination_probes
  • 項(xiàng)目地址:https://www.hallucination-probes.com/
  • 代碼和數(shù)據(jù)集:https://github.com/obalcells/hallucination_probes

該方法的核心是精準(zhǔn)識別實(shí)體級幻覺,例如捏造的人名、日期或引文,而非判斷整個(gè)陳述的真?zhèn)巍_@種策略使其能夠自然地映射到 token 級別的標(biāo)簽,從而實(shí)現(xiàn)實(shí)時(shí)流式檢測。

通過 token 級探針檢測幻覺實(shí)體。在長文本生成場景(Long Fact、HealthBench)中,線性探針的性能遠(yuǎn)超基于不確定性的基線方法,而 LoRA 探針則進(jìn)一步提升了性能。該探針同樣在短文本場景(TriviaQA)以及分布外推理領(lǐng)域(MATH)中表現(xiàn)出色。圖中展示的是 Llama-3.3-70B 模型的結(jié)果。

為實(shí)現(xiàn)這一目標(biāo),研究人員開發(fā)了一種高效的標(biāo)注流程。他們利用網(wǎng)絡(luò)搜索來驗(yàn)證模型生成內(nèi)容中的實(shí)體,并為每一個(gè) token 標(biāo)注是否有事實(shí)依據(jù)。基于這個(gè)專門構(gòu)建的數(shù)據(jù)集,研究人員通過線性探針(linear probes)等簡潔高效的技術(shù),成功訓(xùn)練出精準(zhǔn)的幻覺分類器。

在對四種主流模型家族的評估中,該分類器的表現(xiàn)全面超越了現(xiàn)有基準(zhǔn)方法。尤其是在處理長篇回復(fù)時(shí),其效果遠(yuǎn)勝于語義熵(semantic entropy)等計(jì)算成本更高的方法。例如,在 Llama-3.3-70B 模型上,該方法的 AUC(分類器性能指標(biāo))達(dá)到了 0.90,而基準(zhǔn)方法僅為 0.71。此外,它在短式問答場景中也展現(xiàn)出優(yōu)越的性能。

值得注意的是,盡管該分類器僅使用實(shí)體級標(biāo)簽進(jìn)行訓(xùn)練,它卻能有效識別數(shù)學(xué)推理任務(wù)中的錯(cuò)誤答案。這一發(fā)現(xiàn)表明,該方法具備了超越實(shí)體檢測的泛化能力,能夠識別更廣泛的邏輯錯(cuò)誤。

雖然原始數(shù)據(jù)集的標(biāo)注成本高昂,但研究發(fā)現(xiàn),基于一個(gè)模型標(biāo)注的數(shù)據(jù)可被復(fù)用于訓(xùn)練針對其他模型的有效分類器。因此,研究團(tuán)隊(duì)已公開發(fā)布此數(shù)據(jù)集,以推動(dòng)社區(qū)的后續(xù)研究。

方法概覽

用于 token 級幻覺檢測的數(shù)據(jù)集構(gòu)建

為了訓(xùn)練能夠在 token 級別檢測幻覺的分類器,研究者需要一個(gè)對長文本中的幻覺內(nèi)容有精確標(biāo)注的數(shù)據(jù)集。這個(gè)過程分為兩步:(1) 生成包含事實(shí)與幻覺內(nèi)容的混合文本 ;(2) 對這些文本進(jìn)行準(zhǔn)確的 token 級標(biāo)注,以識別哪些 token 屬于被捏造的實(shí)體。下圖展示了該標(biāo)注流程。

token 級標(biāo)注流水線。

  • 數(shù)據(jù)生成

研究者在 LongFact 數(shù)據(jù)集的基礎(chǔ)上,創(chuàng)建了一個(gè)規(guī)模擴(kuò)大 10 倍、領(lǐng)域更多樣化的提示集 LongFact++。

LongFact++ 包含主題查詢、名人傳記、引文生成和法律案件等四類提示,旨在誘導(dǎo)大語言模型生成富含實(shí)體的長文本,作為后續(xù)標(biāo)注的原材料。

  • token 級標(biāo)注

與傳統(tǒng)方法將文本分解為 atomic claims 不同,該研究專注于標(biāo)注實(shí)體(如人名、日期、引文等),因?yàn)閷?shí)體有明確的 token 邊界,易于進(jìn)行流式檢測。他們使用帶有網(wǎng)絡(luò)搜索功能的 Claude 4 Sonnet 模型來自動(dòng)完成標(biāo)注流程。

該系統(tǒng)會(huì)識別文本中的實(shí)體,通過網(wǎng)絡(luò)搜索驗(yàn)證其真實(shí)性,并將其標(biāo)記為「Supported」(有證據(jù)支持)、「Not Supported」(被證實(shí)是捏造的)或「Insufficient Information」(信息不足)。

  • 標(biāo)簽質(zhì)量

為驗(yàn)證標(biāo)注質(zhì)量,研究者進(jìn)行了兩項(xiàng)檢查。首先,人類標(biāo)注員的標(biāo)注結(jié)果與大模型自動(dòng)標(biāo)注結(jié)果的一致性為 84%。其次,在一個(gè)包含已知錯(cuò)誤(人工注入)的受控?cái)?shù)據(jù)集中,該標(biāo)注流程的召回率為 80.6%,假陽性率為 15.8% 。

訓(xùn)練 token 級探針

探針是一個(gè)附加在語言模型上的幻覺檢測器,它由一個(gè)線性的「價(jià)值頭」和可選的 LoRA 適配器組成。價(jià)值頭讀取模型中間層 ? 的隱藏狀態(tài) ,并輸出一個(gè) token 級的幻覺概率 :

訓(xùn)練的總損失函數(shù)是一個(gè)組合,它既包括用于訓(xùn)練幻覺分類器的探針損失,也包括一個(gè)用于約束模型行為變化的正則化項(xiàng) 

為了解決幻覺信號通常集中在少數(shù)幾個(gè)關(guān)鍵 token 上的問題,研究者設(shè)計(jì)了一種結(jié)合了逐詞損失和跨度最大值損失 的混合損失函數(shù) 。其公式如下:

這個(gè)設(shè)計(jì)的巧妙之處在于:對于一個(gè)被標(biāo)記為幻覺的文本片段,只要其中至少有一個(gè) token 的幻覺分?jǐn)?shù)很高,損失函數(shù)就會(huì)給予獎(jiǎng)勵(lì),從而讓探針學(xué)會(huì)更精確地聚焦于關(guān)鍵錯(cuò)誤信號 。

實(shí)驗(yàn)結(jié)果

在長文本設(shè)置中(LongFact 和 HealthBench),token 級探針在兩個(gè)主要模型上的表現(xiàn)都顯著優(yōu)于基線方法(表 1)。簡單的線性探針始終實(shí)現(xiàn)了 0.85 以上的 AUC 值,而 LoRA 探針進(jìn)一步提升了性能,將 AUC 推高到 0.89 以上。

相比之下,基于不確定性的基線方法表現(xiàn)均不佳,AUC 值均未超過 0.76。在短文本設(shè)置中(TriviaQA),基線方法比長文本設(shè)置中表現(xiàn)更強(qiáng),但探針仍然領(lǐng)先。LoRA 探針始終實(shí)現(xiàn)了超過 0.96 的 AUC 值,線性探針也表現(xiàn)良好。值得注意的是,本文提出的探針在 MATH 數(shù)據(jù)集上也取得了強(qiáng)勁的結(jié)果。這種分布外的性能表明,本文提出的方法捕獲了正確性的信號,這些信號的泛化性超出了其最初針對的虛構(gòu)實(shí)體。

作者在三個(gè)次要模型上復(fù)制了長文本結(jié)果,每個(gè)模型僅使用 2000 個(gè)其自身長文本生成的注釋樣本進(jìn)行訓(xùn)練。結(jié)果是相似的:LoRA 探針再次優(yōu)于線性探針,在 LongFact 生成上的 AUC 值在 0.87-0.90 之間。次要模型的完整結(jié)果顯示在表 5 中。

雖然 LoRA 探針的 AUC 值在多個(gè)設(shè)置中接近或超過 0.9,但長文本上的 R@0.1 最高約為 0.7,即在 10% 假陽性率下,檢測器能夠識別出大約三分之二的幻覺實(shí)體。這些結(jié)果既突出了相對于標(biāo)準(zhǔn)基于不確定性基線方法的實(shí)際收益,也表明在這類方法能夠廣泛應(yīng)用于高風(fēng)險(xiǎn)場景之前,仍有進(jìn)一步改進(jìn)的空間。

更多細(xì)節(jié)請參見原論文。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2023-04-11 14:32:25

騰訊面試Chunk

2009-06-29 13:28:18

PHP小組PHP技巧網(wǎng)站加速

2025-09-23 09:44:02

2023-05-05 10:28:47

2025-08-25 00:02:00

人工智能AI語言模型

2023-04-02 18:00:56

2025-02-13 11:02:12

2025-07-11 08:27:29

2023-06-16 09:49:11

人工智能研究

2025-03-31 08:30:00

AI模型技術(shù)

2023-11-18 09:30:42

模型AI

2025-10-27 01:55:00

2023-10-26 23:55:46

數(shù)據(jù)模型

2012-11-30 11:26:00

代碼注釋

2013-03-08 09:59:59

2025-12-12 08:35:45

Certimate開源SSL

2015-07-08 09:28:46

Xcode代碼簽名

2023-11-21 15:13:30

2021-10-07 20:24:16

AIBI大數(shù)據(jù)

2020-08-17 08:17:00

大數(shù)據(jù)人工智能技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

www日韩av| 正在播放91九色| 日日夜夜精品| 在线综合+亚洲+欧美中文字幕| 日韩视频免费在线播放| 国产一区二区在线视频| 精品乱子伦一区二区三区| 日本一二区不卡| 欧美一级电影在线| 精品国产18久久久久久二百| 亚洲精品电影网| 欧美精品videosex| 日韩视频免费观看高清完整版| 国产三级在线看| 欧美日韩加勒比精品一区| 国产国产国产国产国产国产| 中文字幕av资源一区| 久草在在线视频| 久久综合国产精品| 成年人视频在线免费| 国产精品99久久久久久似苏梦涵| 亚洲图片在线观看| 国产另类ts人妖一区二区| 亚洲精品tv久久久久久久久| 日本女优在线视频一区二区| 茄子视频成人在线观看| 老鸭窝91久久精品色噜噜导演| 免费精品视频一区| 日韩高清不卡一区二区三区| 一区二区免费电影| 国产精品一二三区在线| 欧美国产综合在线| 国产乱码字幕精品高清av| 国产精品wwwww| 日韩午夜精品| 欧美自拍偷拍一区| 五月婷婷导航| 亚洲aa在线| 国产精品9999| 久久在线播放| 国产综合动作在线观看| 亚洲综合国产激情另类一区| 一级做a爰片久久| 国产.欧美.日韩| 99精品免费在线观看| 综合分类小说区另类春色亚洲小说欧美| 四虎永久在线高清国产精品| 大桥未久av一区二区三区| www.99久久热国产日韩欧美.com| 僵尸再翻生在线观看免费国语| 在线观看精品国产视频| 美女扒开腿让男人桶爽久久动漫| 国产精品自产拍在线观看中文| 韩国精品一区二区三区| 五月天色婷婷综合| 国产精品久久久久一区| 在线视频2区| 日韩电影在线观看永久视频免费网站| 成人51免费| 444亚洲人体| 国产激情视频一区二区三区欧美| 黑森林福利视频导航| 亚洲va欧美va人人爽午夜| 永久免费网站在线| 欧美福利在线观看| 黄色av成人| 草草视频在线免费观看| 中文字幕一区二区视频| 毛片在线播放a| 日韩小视频在线| 欧美在线看片| 欧美日本视频在线观看| 在线观看区一区二| 亚洲精品乱码日韩| 91精品国产综合久久男男 | 亚州欧美一区三区三区在线 | 日本一区二区在线| 久久久久久一二三区| 国产视频在线看| 精品国产拍在线观看| 国内一区二区三区| 日韩精品一区二区三区久久| 欧美在线看片a免费观看| 国产免费av国片精品草莓男男| 成人在线观看91| 日本一区二区三区免费乱视频| av在线电影观看| 午夜精品福利电影| 另类欧美日韩国产在线| 超碰在线免费| 久久夜色精品国产亚洲aⅴ| 一道本一区二区| 国产黄色免费网| 久久夜精品va视频免费观看| 麻豆精品网站| 色综合888| 日本精品久久久久影院| 99亚偷拍自图区亚洲| 男人天堂亚洲天堂| 99九九视频| 亚洲国产综合在线| 精品在线网站观看| 狠狠爱免费视频| 亚洲片av在线| 日韩二区在线观看| av资源在线观看免费高清| 国产成人精品国内自产拍免费看| www.欧美精品一二区| 是的av在线| 亚洲日本japanese丝袜| 欧美一区二区在线视频| 欧美日韩国产高清| 永久免费在线| 国产精品视频区| 一区二区激情小说| 色爱综合av| 成人网址大全| 国内精品400部情侣激情| 波多野结衣中文一区| 日韩电影免费观看高清完整版| 亚洲精品一区国产精品| 精品国产三级a在线观看| 国产欧美一级| av女优在线| 国产精品视频一区二区三区经| 一本久久综合亚洲鲁鲁五月天| 成人午夜av| 在线视频三级| 国产国语刺激对白av不卡| 亚洲美女视频在线观看| 欧美美乳视频| 在线免费色视频| 91麻豆精品秘密入口| 精品二区三区线观看| 日韩成人综合| 飘雪影视在线观看免费观看 | 欧美性色综合网| 国内精品福利| 91啦中文在线| 亚洲a∨一区二区三区| 亚洲成人网在线| 国产成人自拍网| 日本少妇精品亚洲第一区| 欧美女同在线观看| 国产精品aaaa| 在线视频你懂得一区二区三区| 99综合在线| 女人天堂av在线播放| 正在播放国产精品| 亚洲一级黄色片| 亚洲国产岛国毛片在线| 红桃视频在线观看一区二区| 污视频网站在线观看| 国产午夜精品在线| 日韩电影免费在线观看中文字幕| 成人网在线播放| 宅男在线一区| 在线观看免费黄视频| 夜夜爽www精品| 欧美大片在线看免费观看| 亚洲一区二区三区四区在线免费观看| 亚洲视频久久| 外国成人直播| www.91av| 欧美成熟毛茸茸复古| 色综合伊人色综合网站| 亚洲精品午夜久久久| 激情成人综合| 外国电影一区二区| 国产又大又黄又粗又爽| 91久久国产精品| 日韩国产欧美区| √…a在线天堂一区| 亚洲黄页一区| 国产美女亚洲精品7777| 九色在线观看视频| 中文字幕在线乱| 国产精品精品一区二区三区午夜版 | 日本不卡免费高清视频| 精品久久久久人成 | 久久99精品国产99久久| 最近2019好看的中文字幕免费| 日韩美女视频一区二区 | 国产精品高清一区二区三区| 亚洲免费av片| 亚洲h动漫在线| 国产裸体歌舞团一区二区| 欧洲杯半决赛直播| av电影一区| 亚洲福利二区| 奇米精品一区二区三区| 国产精品夜色7777狼人| 亚洲小视频在线观看| 色综合天天综合狠狠| 91小视频在线免费看| 欧美精品一卡| 日本黄色成人| 成人免费在线| 人成福利视频在线观看| av免费观看大全|