国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

科學美國人: 大模型永遠不會停止幻覺

發布于 2024-7-5 09:56
瀏覽
0收藏

去年夏天,一名聯邦法官對紐約市一家律師事務所處以 5,000 美元的罰款,原因是一名律師使用人工智能工具 ChatGPT 起草了一起人身傷害案件的摘要。文本中充滿了虛假信息,包括超過六個完全捏造的過去案例,旨在為人身傷害訴訟建立判例。斯坦福大學(Stanford University)和耶魯大學(Yale University)的研究人員在最近對三種流行的大語言模型(LLM)的研究預印本中發現,類似的錯誤在人工智能生成的法律輸出中非常普遍。當生成式 AI 模型產生與現實不符的響應時,有一個術語:“幻覺 hallucination”。

幻覺通常被描述為人工智能的一個技術問題,一個勤奮的開發人員最終會解決的問題。但許多機器學習專家并不認為幻覺是可以修復的,因為它源于LLMs只是在做他們被開發和訓練應該做的事情:盡可能地響應用戶提示。根據一些人工智能研究人員的說法,真正的問題存在于我們的共同想法 - 對這些模型是什么以及如何使用它們的決定。研究人員表示,為了減輕幻覺,生成式人工智能工具必須與事實核查系統配對,避免任何不受監督的聊天機器人。 

許多與人工智能幻覺有關的沖突都源于營銷和炒作??萍脊緦⑺麄兊腖LM描繪成數字瑞士軍刀,能夠解決無數問題或取代人類工作。但是應用在錯誤的設置中,這些工具就會失敗。聊天機器人為用戶提供了不正確且可能有害的醫療建議,媒體機構發布了人工智能生成的文章,其中包括不準確的財務指導,具有人工智能界面的搜索引擎發明了虛假引文。隨著越來越多的人和企業依賴聊天機器人來獲取事實信息,他們編造事情的傾向變得更加明顯和具有破壞性。

但今天的 LLM 從來都不是為了純粹準確而設計的。它們被創造出來是為了創造——為了生成——亞利桑那州立大學(Arizona State University)研究人工智能的計算機科學教授Subbarao Kambhampati說。“現實情況是:沒有辦法保證所生成內容的真實性,”他解釋說,并補充說,所有計算機生成的“創造力在某種程度上都是幻覺”?!咀g者注:譯者一直強調GenAI的應用場景選擇的一個最重要的原則是:創意大于準確性。當前有人建議你將GenAI應用于數據分析的時候,請三思。】

在一月份發布的一項研究預印本中,新加坡國立大學的三名機器學習研究人員提出了一個證據,證明在大型語言模型中,幻覺是不可避免的。該證明應用了學習理論中的一些經典結果,例如康托爾的對角化論證(Cantor’s diagonalization argument),以證明 LLM 根本無法學習所有可計算函數。換句話說,它表明總會有超出模型能力的可解決的問題。“對于任何大語言模型來說,現實世界中都有一部分是它無法學習的,在那里它不可避免地會產生幻覺,”該研究的合著者Ziwei Xu,Sanjay Jain和Mohan Kankanhalli在給《科學美國人》的一封聯合電子郵件中寫道。

盡管這個證明看起來是準確的,Kambhampati說,但它提出的 - 某些難題總能難倒計算機的論點 - 過于寬泛,無法深入了解為什么會發生特定的虛構。而且,他繼續說,這個問題比證明所顯示的更為普遍,因為大語言模型即使面對簡單的請求也會產生幻覺。【譯者注:譯者在“??大模型的幻覺,解鈴還須系鈴人??”文中從生成的數理框架的機理出發,對幻覺的主要來源,比如跨范疇采樣與變分推理,以及如何管控幻覺做了詳細的邏輯推演。】 

科學美國人: 大模型永遠不會停止幻覺-AI.x社區


伊利諾伊大學香檳分校(University of Illinois at Urbana-Champaign)研究自然語言和語音處理的計算機科學教授迪萊克·哈卡尼-圖爾(Dilek Hakkani-Tür)說,人工智能聊天機器人經常產生幻覺的一個主要原因源于它們的基本結構。LLM 基本上是超高級的自動完成工具;他們經過訓練,可以預測序列中接下來應該出現什么,例如文本字符串。如果模型的訓練數據包含有關某個主題的大量信息,則可能會產生準確的輸出。但是 LLM 的構建是為了始終產生答案,即使是在其訓練數據中沒有出現的主題上也是如此。哈卡尼-圖爾說,這增加了出現錯誤的可能性。

添加更多基于事實的訓練數據似乎是一個顯而易見的解決方案。但是,LLM可以容納多少信息存在實際和物理限制,計算機科學家Amr Awadallah說,他是AI平臺Vectara的聯合創始人兼首席執行官,該平臺在排行榜上跟蹤LLM的幻覺率。(在跟蹤的AI模型中,最低的幻覺率約為3%至5%。為了達到語言的流暢性,這些龐大的模型用來訓練的數據比它們能存儲的數據多得多,數據壓縮是不可避免的結果。當 LLM 無法“像在培訓中一樣回憶起一切時,他們會編造東西并填補空白,”Awadallah 說。而且,他補充說,這些模型已經在我們計算能力的邊緣運行;試圖通過使 LLM 變大來避免幻覺會產生更慢的模型,這些模型更昂貴且對環境更有害。

【譯者注:舉一個真實例子,大模型幫助審閱合同的時候,找到合同中的問題,稱是根據某某法典某條某款的判斷,判斷確實是對的,但大模型無法完整復述該法典該條該款。其實這很類似人類的理解式學習】    


科學美國人: 大模型永遠不會停止幻覺-AI.x社區


幻覺的另一個原因是校準,佐治亞理工學院計算機科學教授Santosh Vempala說。校準是調整 LLM 以偏愛某些輸出而不是其他輸出的過程(以匹配訓練數據的統計數據或生成更逼真的人類短語)?!咀g者注:作者后來修正注釋這是一個單獨的過程,稱為對齊】 在去年 11 月首次發布的一篇預印本論文中,Vempala 和一位合著者認為,任何經過校準的語言模型都會產生幻覺——因為準確性本身有時與自然流暢且看起來是原創的文本不一致。減少校準可以提高真實性,同時在 LLM 生成的文本中引入其他缺陷。Vempala說,未經校準的模型可能會公式化地寫作,比人更頻繁地重復單詞和短語。問題在于,用戶希望人工智能聊天機器人既真實又流暢。

Kambhampati 說,接受 LLM 可能永遠無法產生完全準確的輸出意味著重新考慮我們何時、何地以及如何部署這些生成工具。他補充說,他們是很棒的創意創造者,但他們不是獨立的問題解決者?!澳憧梢酝ㄟ^把它們放到一個有驗證者的架構中來利用它們,”他解釋說,無論這意味著讓更多的人參與進來,還是使用其他自動化程序?!咀g者注:重要的事情說三遍:譯者一直強調GenAI的應用場景選擇的一個最重要的原則是:創意大于準確性。而且RAG 在事實校驗中的作用是十分局限的。】    

在Vectara公司,Awadallah正在為此努力。他說,他的團隊的排行榜項目是幻覺檢測器的早期概念驗證,而檢測幻覺是能夠修復幻覺的第一步。未來的檢測器可能會與自動化 AI 編輯器配對,該編輯器可以在錯誤到達最終用戶之前糾正錯誤。他的公司還在開發一個名為AskNews的混合聊天機器人和新聞數據庫,該數據庫將LLM與檢索引擎相結合,該引擎從最近發表的文章中挑選最相關的事實來回答用戶的問題。阿瓦達拉說,AskNews提供的時事描述比LLM本身所能產生的要準確得多,因為聊天機器人的響應僅基于數據庫搜索工具挖掘的來源。

         

科學美國人: 大模型永遠不會停止幻覺-AI.x社區


Hakkani-Tür也在研究基于事實的系統,將專門的語言模型與相對可靠的信息源(如公司文件、經過驗證的產品評論、醫學文獻或維基百科帖子)配對,以提高準確性。她希望,一旦所有的問題都得到解決,這些接地氣的網絡有朝一日可以成為實現健康獲取和教育公平等方面的有用工具。“我確實看到了語言模型的力量,它是讓我們的生活更美好、更有成效、更公平的工具,”她說。

在未來,專業系統會驗證LLM輸出,為特定環境設計的人工智能工具將部分取代今天的通用模型。人工智能文本生成器的每個應用程序(無論是客戶服務聊天機器人、新聞摘要服務還是法律顧問)都將成為定制架構的一部分,從而實現其實用性。同時,不那么接地氣的通才聊天機器人將能夠回答你提出的任何問題,但不能保證真實性。他們將繼續成為強大的創意伙伴或靈感和娛樂的來源——但不是神諭或百科全書——完全遵照其設計目標。

【譯者注:譯者在“??大模型的幻覺,解鈴還須系鈴人??”文中運用自己總結的大模型數學物理原理的思維框架,從原理層面分析了大模型幻覺產生的機理和控制方法,與本文中眾多學者的學術分析吻合,印證了思維框架的重要價值。】 

作者勞倫·萊弗(LAUREN LEFFER)是《科學美國人》的特約撰稿人和前技術報道研究員。她報道了許多主題,包括人工智能、氣候和奇怪的生物學,因為她對錯誤感到好奇。 

收藏
回復
舉報
回復
相關推薦
亚洲精品欧洲| 精品一区二区日本| 国产欧美精品一区二区三区| 周于希免费高清在线观看| 91网站在线观看视频| 国产精品欧美在线| 日本精品久久| 欧美精品乱码久久久久久| 亚洲精品高清无码视频| 久久精品导航| 国产日产欧美精品| 综合欧美精品| 日韩美女一区二区三区| 久艹在线视频| 国产一区二区影院| 久草热久草热线频97精品| 一区三区自拍| 久久亚洲精品小早川怜子66| 国产网红女主播精品视频| 欧美视频免费在线观看| 午夜精品在线免费观看| 99精品国产视频| av电影一区二区三区| 亚洲激情精品| 亚洲影影院av| 91精品推荐| 91久久大香伊蕉在人线| 日韩电影一区| 国产成人精品av在线| 亚洲精品一级二级三级| 久久久久久97| 欧美调教在线| 国产精品www色诱视频| 动漫3d精品一区二区三区乱码| 欧美俄罗斯乱妇| 一区二区三区欧洲区| 久久全国免费视频| 一区二区三区四区在线看| 日本久久亚洲电影| 欧美日本国产| 蜜臀av一区二区在线观看| 2019中文字幕在线观看| 日本亚洲天堂网| 九色视频成人自拍| 91超碰rencao97精品| 中文字幕日韩一区| 香蕉免费一区二区三区在线观看| 国内精品国产三级国产99| 日韩成人在线观看| 国产激情视频一区二区在线观看| 欧美寡妇性猛交xxx免费| 国产日韩欧美综合精品| 欧美日韩亚洲综合在线 | 欧美精品一区二区三区在线播放| 图片区亚洲欧美小说区| 中文字幕色一区二区| 亚洲午夜久久久久久久久久久 | 亚洲欧美激情一区| 国内欧美视频一区二区| 丝袜国产在线| 伊人狠狠色丁香综合尤物| 日韩av最新在线| 成人永久免费视频| 色综合视频一区二区三区日韩 | 色综合久久99| 久久久久久久久久久妇女| 成人精品一区二区三区免费 | 天堂蜜桃一区二区三区| 国产h视频在线观看| 欧美日韩在线一二三| 欧美日韩一级黄| 国产精品亚洲视频| 牛牛影视一区二区三区免费看| 免费观看又污又黄在线观看国产| 国产欧美日韩视频| 欧美日韩国产在线观看| 免费观看在线色综合| 成人影院在线免费观看| 区一区二日本| 韩日视频在线观看| 国产99视频在线观看| 欧美亚洲国产一区二区三区va| 欧美1级日本1级| 91福利在线免费| www.99re.av| 美女被啪啪一区二区| 久久久www成人免费精品张筱雨| 最新高清无码专区| 伊人成人在线| 成人在线tv视频| 三区四区电影在线观看| 国产极品粉嫩福利姬萌白酱| 99在线热播| 久久久国产精品一区| 欧美性大战久久| 中文字幕乱码亚洲精品一区| 视频一区二区三区在线| 一个色综合网| 欧美在线色图| 国产成人精品三级高清久久91| 日本免费一区二区三区等视频| 91蜜桃在线视频| 欧美13一16娇小xxxx| 欧美色18zzzzxxxxx| 91欧美日韩一区| 欧美一区二区三区性视频| 欧美大片aaaa| 国内精彩免费自拍视频在线观看网址| 异国色恋浪漫潭| 亚洲精品视频在线观看视频| 久久美女高清视频| 动漫视频在线一区| 午夜激情在线观看| 丁香花在线影院观看在线播放 | 绯色av一区二区| 日韩在线视频在线| 国产欧美久久久久久| 日韩精品视频在线播放| 国产精品久久久久久久久免费丝袜 | www在线观看黄色| 北条麻妃av高潮尖叫在线观看| 国产精品高清在线观看| 亚洲人成网站色ww在线| 欧美性猛交xxxx乱大交3| 久久综合国产精品| 一区二区三区福利| 成人免费直播在线| 日韩高清在线| 人妖欧美1区| 欧美激情视频在线播放| 中国国产一级毛片| aⅴ在线免费观看| 日韩欧美亚洲区| 欧美日韩精品综合| 91蜜桃网站免费观看| 国产精品69精品一区二区三区| 欧美成人网在线| 九九精品在线观看| 亚洲视频精品在线| 日韩午夜激情电影| 欧美亚洲国产bt| 色诱视频网站一区| 亚洲国产一区在线观看| 夜色激情一区二区| 国产精品久久二区二区| 国产精品国产三级国产普通话蜜臀 | 一本大道亚洲视频| 亚洲精品成人久久| 亚洲精品一区久久久久久| 亚洲国产日韩精品在线| 亚洲爱爱爱爱爱| 中文字幕国产日韩| 一区二区三区视频在线| 日韩一区在线视频| 欧美激情xxxx性bbbb| 性日韩欧美在线视频| 国产热re99久久6国产精品| 国产综合福利在线| 亚洲精品国产精品国自产观看| 欧美一级免费在线观看| 欧美日韩在线不卡视频| а√最新版在线天堂| av电影在线观看| 日韩欧美的一区二区| 国产一区二区在线观看免费| 91色乱码一区二区三区| 亚洲国产精品欧美一二99| 欧美日韩视频第一区| 久久久精品国产网站| 国产精品成人久久久久| 久久国产精品-国产精品| 久久综合久久久久| 诱受h嗯啊巨肉高潮| 99re6在线精品视频免费播放| 6080成人| 亚洲中字在线| 一区二区三区精品视频| 欧美一区二区三区系列电影| 欧美精品久久久久久久久| 精品毛片久久久久久| 欧美精品性生活| 免费看男女www网站入口在线| 欧美一性一交| 不卡一区二区三区四区| 6080午夜不卡| 国产精品亚洲片夜色在线| 成人免费看片'免费看| 日本在线视频观看| 蜜臀av免费一区二区三区| 粉嫩嫩av羞羞动漫久久久| 欧美综合天天夜夜久久| 欧美一区第一页| www国产精品内射老熟女| 91国内在线| 首页欧美精品中文字幕| 欧美日韩亚洲一区二| 日本久久91av| jlzzjlzz欧美大全| 成人知道污网站| 亚洲欧洲无码一区二区三区|