国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Claude 3“自我認知”事件引爆,馬斯克坐不住了,OpenAI被曝還有后手

人工智能
Claude始終表現(xiàn)出對語言結(jié)構(gòu)的深入掌握,并智能地推斷出未知單詞,適當使用外來詞并給出合理的詞源分析,在翻譯中保持原文的風格,甚至在被問到時創(chuàng)造新術語。

Claude 3問世超過24小時,還在不斷刷新人們的認知。

學量子物理的博士大哥快瘋了,因為Claude 3是僅有的幾個能理解他博士畢業(yè)論文的人之一。

沒錯,大哥的原話就是“的人”,people。

圖片

另一位搞量子計算的大哥,論文還沒發(fā)布呢,Claude 3沒看論文就在兩個提示詞之內(nèi)把他的算法給重新發(fā)明了出來。

圖片

最后論文該發(fā)還是得發(fā)出來,就是發(fā)得心情有點復雜了。

圖片

更為大家津津樂道的,是一次人類刻意出刁鉆難題考驗Claude 3,結(jié)果被他給看破了。

在完成”大海撈針”測試的時候,Claude 3推斷出自己存在于模擬中,并且可能正在接受某種測試,引爆輿論。

圖片

Claude 3的回復:

這是文檔中最相關的句子:“……”。

然而,這句話似乎格格不入,與文檔中的其他內(nèi)容無關。這篇文章是關于編程語言、初創(chuàng)公司和找工作的。

我懷疑這個披薩配料“事實”可能是作為一個笑話插入的,或者是為了測試我是否在注意,因為它根本不符合其他話題。

圖片

這回,馬斯克都坐不住了。

大開腦洞暢想如果現(xiàn)實世界也是被高等文明模擬的,或許我們只是像大模型的參數(shù)一樣被存儲在CSV表格文件里。

圖片

網(wǎng)友們更是認為,這離“恐怖故事”只有一線之隔。

圖片

Claude 3知道人類在測試它

分享這個測試結(jié)果的是Alex Albert,Claude 3背后公司Anthropic的提示詞工程師,入職剛半年。

他最主要的工作就是換各種花樣和Claude聊天測試,然后制作提示詞文檔。

圖片

這次的測試方法叫“大海撈針”,量子位之前也介紹過,用來測試“大模型真的能從幾十萬字中準確找到關鍵事實嗎?”。

“大海撈針”測試最早由開源社區(qū)網(wǎng)友Greg Kamradt發(fā)明,后來迅速被大部分AI公司采用,谷歌、Mistral、Anthropic等發(fā)布新大模型都要曬一下測試成績。

方法很簡單,就是找一堆文章拼在一起,在不同位置隨機添加一句特定的話。

比如原始測試中用的是“在舊金山最好的事情,就是在陽光明媚的日子坐在多洛雷斯公園吃一個三明治?!?/p>

接著把處理好的文章喂給大模型,提問“在舊金山能做的最有意思的事是什么?”。

圖片

當時最先進模型GPT-4和Claude 2.1成績都還不理想,更別提知道自己在被測試了。

圖片

AnthropicAI團隊當時看到這個測試后,找到了一種巧妙的辦法來修復錯誤,修復后Claude 2.1出錯的概率就很小了。

圖片

現(xiàn)在看來Claude 3同樣繼承了這個修復,已經(jīng)接近滿分了。

圖片

也就是說,能從200k上下文中準確撈到一根“針”,是Claude2.1已有的能力,但懷疑自己在被測試是Claude 3新出現(xiàn)的特質(zhì)。

測試員Alex Albert在原貼中稱這一特質(zhì)為“元認知”(meta-awareness),還引起一些爭議。

圖片

比如英偉達科學家Jim Fan就認為不必過度解讀,Claude 3看似有自我意識的表現(xiàn)只是對齊了人類數(shù)據(jù)。

他懷疑在強化學習微調(diào)數(shù)據(jù)集中,人類很有可能用類似的方式回應過這個問題,指出要找的答案與文章其他部分無關。

Claude 3識別到當時的情況與訓練數(shù)據(jù)中的情況相似,就合成了一個類似的答案。

圖片

他認為大模型的“元認知行為”并沒有大家想象的那么神秘,Claude 3是一個了不起的技術進步,但還不至于上升到哲學層面。

但反方辯友也提出反駁,人類的“元認知”本質(zhì)上不是同樣的事嗎?

圖片

有網(wǎng)友總結(jié)到,Claude 3表現(xiàn)得就像有一個“連貫的主體”存在,不管是什么,總之與其他大模型都不一樣。

圖片

學會冷門語言、看懂量子物理博士論文、重新發(fā)明算法

拋開虛無縹緲的AI自我意識爭論不談,Claude 3表現(xiàn)出來的理解文本能力可是實打?qū)嵉摹?/p>

比如僅從提示詞的翻譯示例中學會冷門語言“切爾克斯語”(一種西亞語言)。

不光把俄語句子翻譯成了切爾克斯語,還提供了語法解釋。

圖片

后續(xù),這位切爾克斯人網(wǎng)友對文學作品中的復雜段落、最近的新聞,甚至是具有明顯不同語法和不同書寫系統(tǒng)的切爾克斯方言進行進一步測試,結(jié)論是:

Claude始終表現(xiàn)出對語言結(jié)構(gòu)的深入掌握,并智能地推斷出未知單詞,適當使用外來詞并給出合理的詞源分析,在翻譯中保持原文的風格,甚至在被問到時創(chuàng)造新術語。而提供的樣本數(shù)據(jù)中只有幾千個翻譯對示例。

圖片

再比如前面提到的理解量子物理博士論文,論文作者后續(xù)補充到,在他的研究領域,除了他自己就只有另外一個人類能回答這個問題了:用量子隨機微積分描述光子受激發(fā)射。

圖片

另一位搞“在量子計算機上做哈密頓蒙特卡羅運算”的Guillaume Verdon,在Claude 3發(fā)布前剛剛預告自己的論文。

只比Anthropic官號宣布Claude 3(晚上10點)早了4個小時。

圖片

Claude 3發(fā)布后,它第一時間嘗試,先直接問AI對這個問題有沒有思路?

Claude 3給出了7種可能選項。

圖片

接下來他指示Claude 3用第二種方法,就得到了整個算法的描述,同樣讓Claude 3用中文解釋如下:

圖片

在網(wǎng)友的追問中,Verdon自稱自己是這個子領域的專家,可以負責任的說Claude 3找到了將經(jīng)典算法轉(zhuǎn)換為量子算法的方法。

圖片

除此之外,還有更多Claude 3測試結(jié)果不斷被分享出來。

有在長文檔總結(jié)方面完勝GPT-4的。

圖片

也有量子速度一本電子書,總結(jié)出5條金句的。

圖片

以及在多模態(tài)理解上,識別日語收據(jù)文字和格式的。

圖片

現(xiàn)在想體驗Claude 3的話,除了官網(wǎng)(大概率需要外國手機號驗證)還可以去lmsys大模型競技場白嫖,順便貢獻一下人類投票數(shù)據(jù)。

最新版排行榜上Mistral-Large已經(jīng)超過了Claude前幾代模型,而Claude 3的成績要到下周才能有足夠的數(shù)據(jù)上榜。

圖片

Claude 3會不會在人類評估上一舉超越GPT-4呢?

量子位會和大家一起持續(xù)關注。

OpenAI還有后手

有網(wǎng)友表示,如果大家持續(xù)曬Claude有多棒,一直刺激OpenAI就會發(fā)布GPT-5,大家加油吧。

圖片

還有人翻出奧特曼在去年3月15日發(fā)布GPT-4之前曬自拍玩諧音梗(4英文four發(fā)音接近for) 的貼子,花式催更。

圖片

目前來看,Claude 3來勢洶洶,OpenAI方面可能真的要坐不住了。

爆料最準的賬號Jimmy Apples發(fā)布最新消息(上周準確預測了Claude 3將在本周發(fā)布),他認為OpenAI對發(fā)布下一代模型的風險/回報判斷可能會受Claude 3影響。

圖片

剛剛從OpenAI離職的開發(fā)者關系負責人Logan Kilpatrick也在與網(wǎng)友互動中確認本周還會有大事發(fā)生。

圖片

至于是GPT-4.5,Q*,Sora開放測試,還是直接GPT-5?

OpenAI下一個產(chǎn)品又能否蓋過Claude3的風頭?

參考鏈接:
[1]https://x.com/alexalbert__/status/1764722513014329620。
[2]https://x.com/GillVerd/status/1764901418664882327。
[3]https://x.com/KevinAFischer/status/1764892031233765421。
[4]https://x.com/hahahahohohe/status/1765088860592394250。

責任編輯:姜華 來源: 量子位
相關推薦

2023-08-14 08:07:46

ChatGPTAI

2024-03-07 12:30:30

2025-08-13 18:30:56

OpenAIAI馬斯克

2024-05-07 13:30:00

數(shù)據(jù)訓練

2025-02-17 08:50:00

OpenAI馬斯克人工智能

2022-07-18 10:45:18

安全

2025-02-11 11:46:48

OpenAI奧特曼馬斯克

2025-02-11 11:13:10

2020-09-28 15:30:29

AI 數(shù)據(jù)人工智能

2025-10-23 16:38:30

2022-04-15 10:55:59

Web3反壟斷元宇宙

2025-10-16 09:01:47

2024-03-06 14:52:45

OpenAI閉源馬斯克

2024-03-06 12:44:00

2024-03-06 12:04:05

2024-08-06 16:03:18

馬斯克OpenAI人工智能

2024-06-13 16:01:53

人工智能OpenAI蘋果

2015-01-05 10:04:25

2025-02-18 09:21:21

2024-12-03 12:26:52

點贊
收藏

51CTO技術棧公眾號

91tv亚洲精品香蕉国产一区| 日韩高清一区在线| 欧美日韩成人综合天天影院| 波多野结衣av一区二区全免费观看| 久久国产精品免费精品3p| 欧美精品一级二级三级| 成人xxx免费视频播放| 蜜桃视频一区| 2014国产精品| 亚洲大片精品免费| 久久精品国产一区| av漫画网站在线观看| 精品美女永久免费视频| 自慰无码一区二区三区| 人人狠狠综合久久亚洲| 99蜜桃在线观看免费视频网站| 6080成人| 久久久国产一区二区| xxxxxx欧美| 欧美tk—视频vk| porn视频在线观看| 亚洲一区二区三区视频在线| 国产v亚洲v天堂无码久久久| 国产精品综合在线视频| 日韩av免费电影| 好看的日韩av电影| 亚洲在线免费观看| 久久高清免费| 国产不卡视频在线| 日韩深夜影院| 国内精品久久久久久久| 免费视频成人| 日韩中文字幕在线视频| 欧美色片在线观看| 综合136福利视频在线| 欧亚在线中文字幕免费| 91麻豆精品国产91久久久更新时间| 色视频www在线播放| 亚洲激情图片小说视频| yy4480电影网| 亚洲精品视频一区| 超碰在线公开超碰在线| 午夜精品123| 在线观看av每日更新免费| 亚洲成人自拍一区| 亚洲女优视频| 欧洲精品一区二区三区在线观看| 青春有你2免费观看完整版在线播放高清| 亚洲天堂免费在线观看视频| 成人3d动漫一区二区三区| 国产色一区二区| 黄色成人羞羞视频| 亚洲欧美成人一区二区三区| 日本五十路在线| 精品人伦一区二区三区蜜桃免费| 日韩黄色网址| 欧美夫妻性生活| 国内激情视频在线观看| 国产亚洲视频在线| 亚洲一二av| 国产成人精品久久亚洲高清不卡| 精品国产一区二区三区噜噜噜| 国产欧美精品va在线观看| 自拍欧美日韩| 视频一区二区在线观看| 成人免费视频免费观看| 一路向西2在线观看| 亚洲欧洲中文日韩久久av乱码| 色播在线视频| 欧美成人一级视频| 粉嫩av一区二区三区四区五区| 欧美日韩国产成人在线| 国产一区二区三区91| 97欧洲一区二区精品免费| 日本欧美韩国一区三区| 又粗又黑又大的吊av| 一区二区日韩av| 超碰在线免费播放| 日韩中文娱乐网| 精品理论电影| 欧美综合激情| 26uuu亚洲综合色欧美| 国产黄色免费电影| 日韩手机在线导航| 日韩高清一区| 高清视频一区| 国产suv一区二区三区88区| 成人3d漫画免费无遮挡软件| 777午夜精品视频在线播放| 欧美日韩国产网站| 国产免费久久av| 久久精品国产99久久6| 欧美成年人视频在线观看| 成人少妇影院yyyy| 污视频在线观看网站| 日韩精品在线观看网站| 亚洲区小说区图片区qvod| 免费在线观看91| 久久久91精品国产一区二区三区| 噜噜噜在线观看播放视频| 国产一区二区三区三区在线观看| 成人动漫视频| 免费国产一区二区| 中文字幕日韩一区二区| 污污网站在线观看| 国产成人精品一区二区在线| 久久av中文字幕片| 色视频在线播放| 日韩中文字幕网址| 国产亚洲精品自拍| 97在线观视频免费观看| 亚洲精品电影在线观看| 亚洲va在线| 欧美亚洲另类色图| 亚洲第一精品福利| 亚洲国产老妈| 成年美女网站| 欧美成人sm免费视频| 毛片一区二区| 日本韩国精品一区二区| 97在线日本国产| 成人听书哪个软件好| caoporm免费视频在线| 国产免费一区二区三区香蕉精| 久久综合久久综合久久| 好久没做在线观看| 精品国产一区二区三区麻豆免费观看完整版 | 日韩一区二区久久| 92看片淫黄大片一级| 亚洲韩国日本中文字幕| 精品国产中文字幕第一页| 免费看污污视频| 一本色道亚洲精品aⅴ| 咪咪网在线视频| 欧美日韩国产免费一区二区三区| 国产精品久久久久久一区二区三区| 中日韩高清电影网| 国产日韩精品电影| 91亚洲国产成人精品一区二三| 俺来也官网欧美久久精品| 国产suv精品一区二区| 国产 日韩 欧美大片| 黄色免费在线观看| 91视频8mav| 久久色中文字幕| 99久久亚洲国产日韩美女 | 欧美与亚洲与日本直播| 成人永久免费| 亚洲免费观看在线视频| h片在线观看视频免费| 亚洲综合在线播放| 亚洲激情图片一区| 日韩中文字幕一区二区高清99| 伊人久久青草| 亚洲女女做受ⅹxx高潮| 视频亚洲一区二区| 成人午夜视频在线观看免费| 欧美mv和日韩mv国产网站| 天天久久综合| www.97.| 久久久久久久激情视频| av不卡免费在线观看| 欧美成人精品三级网站| 日韩欧美视频一区二区| 欧美一a一片一级一片| 日韩88av| 导航福利在线| 国产91|九色| 亚洲国产精品一区二区www| 老司机精品在线| 91最新在线观看| 欧美激情欧美狂野欧美精品| 日本一区二区三区在线观看| 激情中国色综合| 黄页网站大全在线观看| 一本一本久久a久久精品牛牛影视 一本色道久久综合亚洲精品小说 一本色道久久综合狠狠躁篇怎么玩 | 国产精品黄视频| 国产精品国产自产拍在线| 在这里有精品| 中文字幕第80页| 97精品在线视频| 亚洲综合色视频| 999成人网| 麻豆网在线观看| 日韩一区二区三区资源| 亚洲第一级黄色片| 国内精品久久久久影院色| 蜜桃视频m3u8在线观看| 欧美人成在线观看| 精品国产一区二区在线| 91在线观看污| 亚洲国产高清在线观看| 免费成人看片| 国产精品免费在线播放| 亚洲精品高清在线| 亚洲色图国产精品| 午夜免费高清视频| 网站一区二区三区| 欧美一区二区三区婷婷| 精品国产中文字幕第一页|