国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

大模型智障檢測+1:Strawberry有幾個r紛紛數不清,最新最強Llama3.1也傻了

人工智能 新聞
教給大模型判斷自己知道不知道的方法,Meta在LLama 3.1論文中也有所涉及。

繼分不清9.11和9.9哪個大以后,大模型又“集體失智”了!

數不對單詞“Strawberry”中有幾個“r”,再次引起一片討論。

GPT-4o不僅錯了還很自信。

圖片

剛出爐的Llama-3.1 405B,倒是能在驗證中發現問題并改正。

圖片

比較離譜的是Claude 3.5 Sonnet,還越改越錯了。

圖片

說起來這并不是最新發現的問題,只是最近新模型接連發布,非常熱鬧。

一個個號稱自己數學漲多少分,大家就再次拿出這個問題來試驗,結果很是失望。

在眾多相關討論的帖子中,還翻出一條馬斯克對此現象的評論:

好吧,也許AGI比我想象的還要更遠。

圖片

路遇失智AI,拼盡全力終于教會

有人發現,即使使用Few-Shot CoT,也就是“一步一步地想”大法附加一個人類操作示例,ChatGPT依然學不會:

倒是把r出現的位置都標成1,其他標成0,問題的難度下降了,但是數“1”依舊不擅長。

圖片

為了教會大模型數r,全球網友腦洞大開,開發出各種奇奇怪怪的提示詞技巧。

比如讓ChatGPT使用漫畫《死亡筆記中》高智商角色“L”可能使用的方法。

圖片

ChatGPT想出的方法倒是也很樸素,就是分別把每個字母寫出來再一個一個數并記錄位置,總之終于答對了。

圖片

有Claude玩家寫了整整3682個token的提示詞,方法來自DeepMind的Self-Discover論文,可以說是連夜把論文給復現了。

圖片

整個方法分為兩大階段:先針對特定任務讓AI自我發現推理步驟,第二階段再具體執行。

圖片

發現推理步驟的方法簡單概括就是,不光要會抽象的思維方法,也要具體問題具體分析。

圖片

這套方法下,Claude給出的答案也非常復雜。

圖片

作者補充,花這么大力氣解決“數r問題”其實并不真正實用,只是在嘗試復現論文方法時偶然測試到了,希望能找出一個能用來回答所有問題的通用提示詞。

不過很可惜,這位網友目前還沒公布完整的提示詞。

圖片

還有人想到更深一層,如果要計算文檔中straberry出現多少次怎么辦?

他的方法是讓AI想象有一個從0開始的內存計數器,每次遇到這個單詞就往上加。

圖片

有人評論這種方法就像在用英語編程

圖片

也有AI可以一次做對

那么究竟有沒有大模型,可以不靠額外提示詞直接答對呢?

其實不久之前有網友報告,ChatGPT是有小概率能直接答對的,只不過不常見。

圖片

谷歌Gemini 大概有三分之二的概率能答對,打開“草稿”就能發現,默認每個問題回答三次,兩次對一次錯。

圖片

至于國內選手,在提問方式統一、每個模型只給一次嘗試機會的測試下,上次能正確判斷數字大小的,這次同樣穩定發揮。

字節豆包給出了正確回答,還猜測用戶問這個問題是要學習單詞拼寫嗎?

圖片

智譜清言的ChatGLM,自動觸發了代碼模式,直接給出正確答案“3”。

圖片

騰訊元寶像解數學題一樣列方程給出了正確答案(雖然貌似沒有必要)。

圖片

文心一言4.0收費版則更加詳細,也是先正確理解了意圖,然后掰指頭挨個找出了全部的“r”。

圖片

不過有意思的是,在同一種方法下,文心一言APP中的免費版文心3.5掰指頭也能數錯。

圖片

訊飛星火也通過找出“r”所在位置給出了正確回答。

圖片

還是token的鍋

雖然“數r”和“9.11與9.9哪個大”,看似一個是數字問題一個是字母問題,但對于大模型來說,都是token問題

單個字符對大模型來說意義有限,使用GPT系列的Llama系列的tokenizer就會發現,20個字符的問題,在不同AI眼中是10-13個token。

其中相同之處在于,strawberry被拆成了st-,raw,-berry三個部分來理解。

圖片

換一個思路用特殊字符??????????來提問,每一個字符對應的token也就會分開了。

圖片圖片

面對這種問題,其實最簡單的方法就是像智譜清言一樣,調用代碼來解決了。

圖片

可以看到,ChatGPT直接用Python語言字符串的count函數,就能簡單搞定。

圖片

剛剛創業開了所學校的大神卡帕西認為,關鍵在于需要讓AI知道自己能力的邊界,才能主動去調用工具

圖片

至于教給大模型判斷自己知道不知道的方法,Meta在LLama 3.1論文中也有所涉及。

圖片

最后正如網友所說,希望OpenAI等大模型公司,都能在下個版本中解決這個問題。

圖片

GPT Tokenizer試玩https://gpt-tokenizer.dev
Llama Tokenizer試玩https://belladoreai.github.io/llama-tokenizer-js/example-demo/build/

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-07-29 08:28:00

模型AI

2024-07-29 07:46:00

英偉達模型

2024-08-27 14:20:00

2024-07-30 13:48:37

2024-12-09 08:00:00

AI大模型人工智能

2019-08-20 15:01:05

Chrome 瀏覽器 插件

2019-08-16 10:33:00

Chrome插件開發者

2024-07-24 09:20:45

2024-08-12 09:47:00

模型數據

2024-07-24 16:54:45

2020-03-11 20:11:06

電腦騷操作AMD

2024-07-25 13:36:32

2025-05-19 08:41:00

AI模型開發者

2025-04-03 09:42:05

2024-07-29 13:38:06

2024-04-30 08:28:44

開源大模型Llama

2024-07-24 10:48:04

NVIDIANVIDIA AI

2024-08-15 15:45:00

AI訓練

2024-01-30 13:02:05

AI訓練

2025-11-18 06:00:00

點贊
收藏

51CTO技術棧公眾號

国产欧美中文在线| 亚洲精品白浆高清久久久久久| 亚洲自拍小视频| 亚洲久草在线| 欧美一区二区三区色| 中文字幕在线看| 国产欧美综合在线| 国产亚洲综合视频| 激情五月激情综合网| 免费亚洲精品视频| 亚洲国产二区| 翡翠波斯猫1977年美国| 日韩成人精品一区二区| 欧美中文字幕在线视频| 综合成人在线| 97成人精品区在线播放| 精品国产一区二区三区性色av| 一本一本久久a久久精品综合小说| 欧美亚洲在线视频| 欧美性天天影院| 亚洲中字在线| 久久精品国产一区二区三区日韩| 中文字幕亚洲精品乱码| 亚洲在线免费视频| 午夜欧美精品| 国产精品久久久久久久久久久久午夜片 | 2021国产视频| 成人美女视频在线看| 91动漫在线看| 国产亚洲一区二区在线观看| 欧美伦理片在线看| 亚洲欧美日韩国产手机在线| 日本视频三区| 午夜精品福利视频网站| 毛片网站在线观看| 337p亚洲精品色噜噜狠狠| 视频在线观看入口黄最新永久免费国产| 欧美一区二区久久| 在线免费日韩片| 欧美精品久久久久久久久久| 久久精品论坛| 91嫩草视频在线观看| 免费一区二区视频| 日韩久久午夜影院| 日韩尤物视频| 97久久精品人人做人人爽50路 | 日韩精品免费在线| 亚洲精品成a人ⅴ香蕉片| 久久久久久久一| 精品国产一区二区三区| 久久久人人爽| 不卡的av电影| 自拍偷拍第1页| 欧美成人精品福利| 深夜激情久久| 国产精品免费看一区二区三区| 国产一区二区三区在线观看免费视频 | 日韩欧美国产免费播放| 色婷婷av在线| 久久久精品久久久| 精品久久91| 久久精品日产第一区二区三区精品版| 久久99蜜桃精品| 久草在线在线视频| 欧美电影免费观看完整版 | 日韩精品久久久久久久玫瑰园| 欧洲一区在线| 精品国产乱码久久久久久久软件 | 成人在线免费网站| 国产资源精品在线观看| 日本久久久久久久久久久久| 偷窥国产亚洲免费视频 | 欧美午夜在线一二页| 高清欧美日韩| 91久久精品国产91久久性色| 美女视频黄频大全不卡视频在线播放| 成人福利影院| 亚洲精品一区二区三区影院| 欧美91在线| 日韩三级电影| 亚洲综合精品久久| a屁视频一区二区三区四区| 亚洲精品欧美日韩专区| 波多野结衣精品在线| 午夜免费福利在线观看| 欧美日韩国产二区| 狂野欧美一区| h色视频在线观看| 久久久av免费| 热久久久久久久| 天堂av网在线| 精品国产美女在线| 在线成人黄色| 日日噜噜噜夜夜爽爽狠狠| 二区在线观看| 不用播放器成人网| 麻豆国产精品777777在线| 一二三区在线视频| 精品综合久久久久久97| 男男视频亚洲欧美| 一级毛片视频在线| 91精品在线播放| 亚洲男人的天堂av| 欧美高清hd| 好吊色视频988gao在线观看| 欧美区视频在线观看| 欧洲杯什么时候开赛| 日韩xxxx视频| 精品国产污污免费网站入口| 亚洲a在线视频| 国内av免费| 午夜精品一区二区三区在线视频| 国产成人亚洲精品狼色在线| 欧美xxx黑人xxx水蜜桃| 精品视频在线观看| 欧美在线短视频| 天天做综合网| 偷拍自拍在线| 成人福利视频在线观看| 国产精品视频一区二区三区不卡| 欧美爱爱视频| 亚洲精品无码久久久久久| 日韩av在线免费| 日韩经典一区二区| 黄av在线免费观看| 国产区在线观看成人精品 | 久久夜色精品| 18视频免费网址在线观看| 成人黄色片在线| 午夜激情一区二区三区| 日韩aaa久久蜜桃av| 国产一区视频免费观看| 日韩在线视频线视频免费网站| 国产专区综合网| 精品丝袜在线| 大地资源第二页在线观看高清版| 欧美videossexotv100| 一区二区三区高清视频在线观看| yourporn在线观看中文站| 97超碰人人看人人| 欧美日韩国产高清一区二区| 亚洲人体大胆视频| 性xxxfreexxxx性欧美| 亚洲乱码一区二区三区| 亚洲免费电影一区| 91丨porny丨国产入口| 亚洲一区二区三区日本久久九| 另类小说色综合| 国产精品日韩精品| 日韩人体视频一二区| 欧美三区不卡| 久草在线视频福利| 国产精品专区在线| 欧美一级大片视频| 狠狠久久亚洲欧美专区| 精产国产伦理一二三区| 一区二区久久久| 欧美va亚洲va日韩∨a综合色| 午夜在线小视频| 青草全福视在线| 综合国产在线观看| 亚洲人成在线观看一区二区| 午夜激情久久| 成人女同在线观看| 天天碰免费视频| 91成人免费看| 亚洲视频自拍偷拍| 一区二区三区欧美在线观看| 亚洲最黄网站| 日韩午夜电影免费看| 美女视频黄a视频全免费观看| 国产久一道中文一区| 国产一区二区三区欧美| 最新久久zyz资源站| 欧美大片aaaa| 国产三级电影在线播放| 成人手机在线电影| 精品综合在线| 中文字幕日韩在线播放| 亚洲va韩国va欧美va| 国产资源在线一区| 精品久久久久久久久久久下田 | 欧美风情在线视频| 国产污污在线观看| 最新视频 - x88av| 国产精品精品视频一区二区三区| 欧美一区二区三区免费观看视频 | 久久美女视频| 金瓶狂野欧美性猛交xxxx | 日本高清不卡在线| 欧美日韩国产一二三| 2024国产精品| 国产欧美三级| 久久a爱视频| 国产高潮在线| 神马久久影视大全| 精品国产一区二区三区在线| 国产精品国产亚洲伊人久久| 日韩精品在线免费观看| 狠狠久久亚洲欧美专区|