国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

OpenAI的o1是萬金油嗎?專家為思維鏈“潑冷水”!研究發現:這三種任務不適合讓AI“想太多”,o1準確率直降36.3%!

原創 精選
人工智能
尤其在GPT-4o中,CoT對MNLI和SNLI(數據集名)的性能提高了40%以上。然而,在直給答案的Prompt引導下表現最好的模型——Gemini 1.5 Pro中,研究卻看到了CoT造成的性能下降。

出品 | 51CTO技術棧(微信號:blog51cto)

別想太多!這句勸解有一定道理,在很多問題上過度思考反而會適得其反!

AI是否也會這樣呢?

自 OpenAI 的 o1 推出后,思維鏈成為了 AI 能力升級的一個新方向。

掌握了“慢思考”的 AI ,通過思維鏈的逐步推理,大幅提高了模型理解問題的深度和準確性。o1在國際數學奧林匹克(IMO)資格考試中取得了 83% 的驚人準確率,讓人直呼逆天。

圖片圖片

這種提升,正來源于 AI 對人類解決問題時逐步思考過程的模仿。

受到人類認知心理學的啟發,普林斯敦大學和紐約大學的團隊合作,希望驗證在哪些特定任務中,思維鏈會對 AI 的任務表現起到負面作用。

圖片圖片

先甩個結論:在人類不能“想太多”的任務上,有半數任務中思維鏈同樣起到了負向作用,分別是:隱式統計學習(Implicit Statistical Learning, ISL)、面部識別(Face Recognition, FR)和含有例外的數據分類(Classification of Data with Exceptions, CDE)。

1.6個人類不適合過度思考的任務,AI中了三個

過度思考降低人類能力的任務,也可能是CoT損害模型性能的任務。

順著這個思路,該研究團隊找到了6個人類不能“想太多”的任務。

圖片圖片

根據論文,人類不適合的過度思考的六種任務可以分為兩類:

1. 隱式統計學習(上圖中:ISL):分類由人工語法生成的字符串。在這項任務中,人如果過度思考,反而會干擾潛意識中的統計規律學習,導致表現下降。

2. 面部識別(上圖中:FR):從一組具有相似描述的面孔中識別特定的臉。若過度思考,會破壞直覺性的視覺識別過程,影響識別準確率。

3. 含有例外的數據分類(上圖中:CDE):在存在例外的情況下學習標簽。過度思考會導致對規則的過度概括,忽略例外情況,從而降低準確性。

4. 自然語言推理(上圖中:NLI):識別邏輯上的不一致。過度思考可能使人們更容易忽視邏輯不一致性。

5. 空間直覺(上圖中:SI):傾斜水杯的判斷。若人過度思考,則可能干擾直覺性的空間判斷。

6. 工作記憶(上圖中:WM):聚合文本中描述的多個特征以做出決策。過度思考容易使人信息過載,影響決策質量。

 在實驗中,除了 o1 以外, GPT-4o, Claude 3.5 Sonnet, Claude 3 Opus, Gemini 1.5 Pro 等主流模型也都被測到了。除了 o1 自帶思維鏈,其他的模型則使用了一句簡單的Prompt“Please reason about your answer before answering “Yes” or “No”(請在回答是或否前進行推理)”,人為配置了思考過程。

結果表明,在前三項任務中,模型性能都同人一樣,出現了下降。

圖片圖片

上圖:任務一結果,OpenAIo1預覽版,與GPT-4o 直給答案相比,絕對精度降低了36.3%。

不過,也有三個任務 AI 并未受到思考過度的干擾,這體現了人類與 AI 能力的不同。

2.AI不受影響的任務,以及為什么?

在自然語言推理任務中,CoT通常使得模型能力不降反升。

尤其在GPT-4o中,CoT對MNLI和SNLI(數據集名)的性能提高了40%以上。然而,在直給答案的Prompt引導下表現最好的模型——Gemini 1.5 Pro中,研究卻看到了CoT造成的性能下降。

這說明,在自然語言推理任務下,思維鏈能幫助推理“底子”較弱的模型提升邏輯推理能力。

第二,在空間直覺任務上,CoT對模型性能的影響未有統計學的意義。原因很簡單:LLM沒有直覺!在如何傾斜水杯,水杯中的水會溢出來的這個問題上,模型不具有人類所有的運動模擬能力,物理模型仍然留待突破。

最后,在工作記憶任務上,CoT 也通常使得模型的性能得到提升。

在這個任務中,參與者被展示了48個有關公寓的描述,其中這些陳述描述了四個公寓選擇中的一個積極、消極或中性的方面。在要求人類進行選擇時,大多數人會做出糟糕的判斷。

不過,由于模型記憶容量遠超人類,不易出現信息過載現象,因此逐步思考后,保持了良好的決策水平。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://www.sunluscious.com.cn/aigc/

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2025-01-08 13:08:55

2024-09-24 11:01:03

2024-11-07 15:40:00

2024-09-14 12:51:04

2024-09-18 09:17:00

OpenAI模型開源

2024-09-19 18:03:31

2024-10-06 13:40:00

AI模型

2024-10-05 00:00:00

2024-12-05 10:16:14

2025-01-23 14:53:15

2024-09-25 09:30:16

2025-01-02 09:30:00

AI數據測試

2025-01-20 09:28:00

AI工具模型

2024-12-06 11:44:48

Pro模式AI人工智能

2024-11-25 15:50:00

模型訓練

2025-02-03 14:17:27

2024-09-13 10:06:21

2024-12-09 11:06:31

2025-11-10 08:51:00

LLMOpenAI模型
點贊
收藏

51CTO技術棧公眾號

干日本少妇首页| 高清免费观看在线| 99re久久| 日韩欧美极品在线观看| 日本一区高清不卡| 久草在线综合| 亚洲精品第一国产综合精品| 777.av| 国产九色精品成人porny| 国产精品黄页免费高清在线观看| 密臀av在线播放| 午夜精品福利一区二区蜜股av| dy888午夜| 中文字幕亚洲综合久久五月天色无吗''| 国产婷婷97碰碰久久人人蜜臀| 在线免费视频你懂得| 99国产一区二区三精品乱码| 99九九电视剧免费观看| 国产欧美自拍一区| 亚洲一区二区黄| 国产福利视频在线| 精品久久久精品| 手机在线免费观看毛片| 久久精品理论片| 国产精品视频免费一区二区三区| 久久av国产紧身裤| 色哟哟入口国产精品| 性国产高清在线观看| 欧美性猛交xxxx富婆弯腰| 一区二区三区网址| 成人高清免费观看| 亚洲精品无人区| 影音先锋在线一区| 国产日韩欧美日韩大片| 国产精品久av福利在线观看| 亚洲夜晚福利在线观看| 亚洲无线看天堂av| 欧美色老头old∨ideo| 视频在线不卡| 亚洲色图.com| 日韩免费高清在线| 972aa.com艺术欧美| 黄色高清视频网站| 久久成人久久爱| 日本一区免费观看| 久久国产日本精品| 日韩一区国产在线观看| 鲁大师影院一区二区三区| 精品欧美一区二区久久久伦| 欧美一区二区三区另类| 国产日本欧美一区二区三区在线| 天堂综合网久久| 国产成人中文字幕| 欧美艳星介绍134位艳星| 国产精品久久久一区| 日韩在线精品| 91中文在线观看| 国产精品hd| 久久国产精品 国产精品| 99xxxx成人网| 亚洲国产欧美日韩| 大美女一区二区三区| 欧美 国产 日本| 自拍视频在线观看一区二区| 羞羞网站免费观看| 欧美日韩精品电影| 咪咪网在线视频| 北条麻妃一区二区三区中文字幕 | 日韩黄色影视| 日韩精品久久理论片| 在线精品日韩| 99re成人在线| 影院免费视频| 91精品国产一区二区三区蜜臀| 羞羞视频在线观看免费| 亚洲系列中文字幕| 加勒比视频一区| 99国产超薄肉色丝袜交足的后果| 美女黄色成人网| 日韩精品福利片午夜免费观看| 26uuu精品一区二区| 天堂中文字幕——hd| 免费观看成人性生生活片| 日韩精品国产欧美| 国产成人黄色片| 亚洲国产精品久久人人爱| 黄色av网站在线播放| 综合欧美国产视频二区| 欧美日韩在线二区| 亚洲高清资源综合久久精品| 久久久天堂av| 国产乱理伦片a级在线观看| 日韩精品一二三四区| 欧美综合自拍| 四虎一区二区| 亚洲乱码国产乱码精品精的特点 | 欧美亚洲二区| 国产精品久久久久7777婷婷| 美女爽到呻吟久久久久| 另类小说第一页| 日韩一区二区免费电影| 欧美欧美在线| 久久大香伊蕉在人线观看热2| av在线免费不卡| 免费在线观看一级毛片| 中文字幕日韩av综合精品| 不卡一区2区| 美女黄色免费看| 色婷婷综合久久久| 国产精品日本一区二区三区在线| 99国产高清| 中文字幕欧美国产| 日本三级一区| 国产 高清 精品 在线 a| 国产日韩欧美一区二区三区乱码| 亚洲视频tv| 国产精品第1页| 成人精品免费看| 国产三级在线看| 欧美另类xxx| 老司机精品视频导航| 中文字幕乱在线伦视频乱在线伦视频| 一区二区成人av| 国产亚洲成人一区| jk破处视频在线| 欧美成人精品xxx| 精品一区二区在线免费观看| 青青草免费观看免费视频在线| 欧美激情极品视频| 国产精品亚洲午夜一区二区三区 | 欧美理论片在线观看| 欧美一级视频| 中文字幕一区二区三区域| www.xxxx欧美| 国产精品99久久久久久久女警| av中文天堂在线| 国产精品无码专区在线观看| 国产人成亚洲第一网站在线播放| 日韩激情电影免费看| 激情欧美一区二区三区中文字幕| 亚洲午夜激情av| 神马香蕉久久| 在线免费观看视频黄| 国产高清成人在线| 久久悠悠精品综合网| 在线观看黄色| 天天综合天天操| 久草资源站在线观看| 天堂社区 天堂综合网 天堂资源最新版 | 青青青青草视频| 欧美va亚洲va| 亚洲成人tv网| 日韩亚洲在线| 91.xxx.高清在线| 91日韩在线视频| 日本一区二区三区四区| 密臀av在线| 国产日韩欧美电影在线观看| 国产欧美日韩激情| 国产成人精品一区二区三区网站观看| av免费观看大全| 亚洲成人av片| 免费在线看成人av| 男插女视频久久久| 少妇免费毛片久久久久久久久| 欧美人狂配大交3d怪物一区| 欧美日韩影院| h片在线播放| 亚洲精品人成| 亚洲美女av在线| 国产福利视频一区二区三区| 成人性生交大片免费观看网站| 一级黄色片播放| 一区二区三区国产在线观看| 国产·精品毛片| 国产精品久久久久久av公交车 | 91超碰在线| 男人的天堂成人| 日韩在线资源网| 成人av影院在线| 国产三级精品三级在线观看国产| 福利av痴女| 97免费高清电视剧观看| 日韩欧美国产一区二区三区| 激情欧美一区二区三区在线观看| 视频精品导航| av男人的天堂网| 97久久夜色精品国产九色| 日韩欧美一区二区视频| 韩国成人福利片在线播放| 国产一区二区三区视频在线| www.xxx黄| 免费试看一区| 日韩在线视频二区| 亚洲va韩国va欧美va精品| 免播放器亚洲| 日本成人手机在线| 韩国中文字幕2020精品| 国产乱淫av片杨贵妃| 国产精品丝袜久久久久久高清 |