国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

陶哲軒,用AI爆改科研范式

人工智能 新聞
陶哲軒讓ChatGPT把復雜的數學論文翻譯成Lean代碼,與AI合作完成形式化證明。AI能理解論文、寫出正確命題,卻常在關鍵處卡殼。經過人機配合,終于生成1125行被驗證的證明。這種「vibe coding」式合作,也讓數學家重新思考:AI或許不是獨立的解題者,卻正在深刻改變數學研究的工作方式。

白板在那晚的數學推導中沒派上用場。

陶哲軒盯著屏幕,Lean像刻薄裁判吐出一行行紅字。

反復拉扯后,報錯忽然安靜。

1125行Lean代碼落定——埃爾德什第613號問題的復雜反例,被逐行核查進了形式化世界。

寫手是ChatGPT,思路由陶哲軒調度,判決由機器拍板。

在一個著名的未解數學問題上,菲爾茲獎得主陶哲軒請出了ChatGPT和數學證明助手Lean,來聯手完成一項繁瑣而嚴謹的任務:形式化一個復雜的反例證明。

這個反例源自保羅·埃爾德什(Paul Erd?s)提出的第613號問題,一道困擾數學家幾十年的難題。

https://www.erdosproblems.com/forum/thread/613

早在本世紀初,就有數學家給出了一個反例證明,將這一問題「證偽」(也就是找到反例證明原猜想不成立)。

但把這個證明徹底翻譯成計算機可核查的形式卻一直沒人嘗試,因為這意味著要將所有推理細節寫成正式的邏輯代碼,工作量驚人。

而陶哲軒決定嘗鮮:讓ChatGPT先當他的「翻譯官」和「小工」,把人類的紙筆證明轉化為Lean語言的嚴謹代碼。

ChatGPT讀論文

數學黑話翻譯官上線

陶哲軒首先讓ChatGPT閱讀論文中的證明構造。

論文里的數學描述往往充滿符號和行話,但ChatGPT就像一位不知疲倦的助教,可以逐段解釋這些構造是什么意思,再嘗試用更「機械」的方式表述。

比如,論文構造了一個特殊的圖(滿足某些頂點與邊的計數條件)作為反例,ChatGPT能根據文字描述提煉出關鍵條件,甚至將它翻譯成Lean所需的定義。

它好比把晦澀的古文譯成白話,確保每一步都清晰明了。

當然,ChatGPT并非真的理解深奧的數學理念,它更多是模式匹配和概率生成。

但在這種場景下,它的確展現出驚人的「閱讀理解」能力。

陶哲軒要求它把論文中的命題用Lean語言表述出來,ChatGPT幾乎立刻就給出了正確的定義和命題陳述。

有時候,它甚至會主動「發揮」一下,比如在沒有提示的情況下就證明了一個引理的性質。

這種時刻令陶哲軒都感到驚喜,仿佛AI學生一下子開竅了。

然而興奮沒持續太久,ChatGPT很快卡在了證明的最后一步。

它能讀懂并重述大部分內容,卻在真正需要創造性跳躍的地方卡殼。

畢竟,它不是真正的數學家,只是扮演了一個熟練的翻譯加初級解題助手。

人機協作

1125行代碼橫空出世

接下來就是耐心活:一步一步引導ChatGPT編寫Lean代碼,也就是所謂「vibe coding」的過程。

所謂「vibe coding」,指的是人類不給出過于詳細的嚴苛指令,而是憑直覺和整體思路一步步讓AI搭建代碼,就像即興合奏一樣。

在這個過程中,陶哲軒更像一位樂隊指揮,提供方向和節奏,ChatGPT則即興「演奏」出代碼片段。

Lean充當嚴格的裁判,每寫一段就立刻檢查對不對,如果不對,報錯信息就是「音準」偏了,需要調整。

這一人機協作的體驗既神奇又讓人啼笑皆非。

ChatGPT有時展現出高超的「琴技」:它居然能猜出數學家想要證明的中間引理,并直接給出對應的Lean證明思路!

很多常規定義、基本引理,它張口就來,速度飛快。

這讓陶哲軒省去了大量查閱Lean庫和語法的時間,等于身邊多了個熟悉Lean語言的超級速記員。

然而,當涉及比較復雜或微妙的地方,AI就開始「跑調」了:經常寫出一長串Lean代碼卻無濟于事,不是邏輯不通就是和之前的定義對不上。Lean會毫不留情地報錯,而ChatGPT有時還一臉無辜地看不出錯在哪,需要人類耐心指正。

AI不斷繞彎子,不是遺忘前提,就是引錯定理,把簡單問題搞得撲朔迷離。

陶哲軒不得不一次次提示:「嘿,你該證明的是這個基本性質,別走遠了。」

就這樣來回拉鋸,才終于把這個「小目標」攻克。

經過將近一周的「磨煉」,ChatGPT和陶哲軒終于完成了整個反例證明的形式化。

Lean代碼整整1125行,儼然一部迷你巨著。

https://github.com/teorth/analysis/blob/main/analysis/Analysis/Misc/erdos_613.lean

回頭看這些代碼,作者笑稱完全是一坨「意大利面條代碼」——結構盤根錯節,充滿了AI生成的冗長繞行和中途更改的思路。

正常情況下,程序員看到這樣的代碼可能要頭疼不已;但在數學證明里,這反倒不是什么大問題。

因為Lean最終驗證通過了,就意味著每一句話、每一個推理步驟在邏輯上都是正確的。

就算代碼看起來冗繁,只要能被Lean接受,那證明就在嚴謹意義上成立了。

正如陶哲軒所說,Lean簡直是「vibe coding」的宏大舞臺。

AI鬧烏龍,人類擦屁股

誰更耗時間?

可能有人會問:讓AI瞎折騰一通,吐出上千行絮絮叨叨的代碼,這真的省時間嗎?

陶哲軒的回答是肯定的。

雖然和ChatGPT互動有時讓人抓狂,但對比他親自動手從零寫這1125行Lean證明,AI至少幫他節省了一半以上的時間和精力。

更有趣的是,ChatGPT在對話中還能及時發現陶哲軒提要求時的一些小錯誤,比如參數取值不當等,然后自動糾正再生成代碼。

它不僅是聽話的碼農,偶爾還兼職「質檢」,替人類把關。

這種體驗讓陶哲軒直呼過癮——過去覺得不值得一試的繁瑣計算,現在敢放心交給AI跑,他則專注于更有創意的部分。

當然,并不是說AI已經萬能。

其實在正式編寫Lean證明的過程中,大量低級而重復的收尾工作最后還是人類在做。

ChatGPT寫出的代碼片段往往需要陶哲軒仔細檢查、微調格式,然后粘貼進Lean運行,看是否通過。

一旦報錯,再回頭提示ChatGPT修改。

許多時候AI會陷入一個狹窄思路,不停產出同樣錯的代碼,需要人類耐心引導它跳出死循環。

這一切都說明,AI目前充當的是「能力強大的助理」角色,而非獨立的數學家。

正如Nature雜志的每日簡報所指出,這些工具可以幫助數學家確認某些近乎不可琢磨的證明、為困難問題出謀劃策,但離自動產出完整新證明還有距離。

人類的智慧仍是不可或缺的。至少現在來看,最精彩的創意和洞見,AI還給不出來。

{1, 2, 4, 8, 13}推翻了Erd?s猜想

另一則引發轟動的案例發生在Erd?s第707號問題上。

這道問題關乎組合數學中的Sidon集合與完美差集的關系——聽上去高深莫測,但簡單來說,Erd?s猜想任何一個特殊的「Sidon數集」都能擴充成某種「完美差集」。

這個猜想懸而未決幾十年,獎金為1000美元。

直到最近,兩位數學家鮑里斯·阿列克謝夫(Boris Alexeev)和達斯汀·米克森(Dustin G. Mixon)找到了令人意外的反例:集合{1, 2, 4, 8, 13}就是一個無法擴充成完美差集的Sidon集!


五個看似普通的數字,就這樣終結了一個長期懸而未決的猜想,令數學界既興奮又驚訝。

發現反例只是故事的一半。

這兩位研究者做了一個大膽決定:讓AI來驗證他們的發現。

他們聽說陶哲軒成功用ChatGPT編寫Lean證明,于是如法炮制,請出最新的大模型來協助,把反例證明從頭到尾寫成Lean代碼。

他們不僅形式化了自己找到的新反例,還讓AI把幾十年前一位數學家馬歇爾·霍爾(Marshall Hall Jr.)曾給出的另一個反例也寫成Lean證明。

其實霍爾的結果早在1940年代就發表了,但長期被學界忽視了。

Marshall Hall Jr. 在 1947 年的論文《Cyclic projective planes》(Duke Math. J. 14(4): 1079–1090)里,在定理 4.3 后的下一段,給出了不能擴展為任何有限完美差集(λ=1 的差集,亦稱平面差集)的具體反例。

原文里他舉的例子就是:

「For example the set {?8, ?6, 0, 1, 4} may not be so extended.」(「例如集合{?8, ?6, 0, 1, 4}不能如此擴展。」) 

https://projecteuclid.org/journals/duke-mathematical-journal/volume-14/issue-4/Cyclic-projective-planes/10.1215/S0012-7094-47-01482-8.short

這一切聽起來就像讓AI一邊考古、一邊蓋新樓——把人類數學遺產用現代工具重做一遍,以確保萬無一失。

結果如何呢?

ChatGPT不負眾望,經過無數次人機對話和嘗試,最終吐出了長達數千行的Lean證明代碼,把新舊兩個反例案例統統嚴絲合縫地驗證了一遍。

論文作者感嘆:「正式證明幾乎每一行都是ChatGPT寫的」。

可以說,沒有AI幫忙,這樣繁瑣的形式化工作幾乎不可能在短時間內完成。

這也是他們為何在論文初稿中大膽署名ChatGPT和Lean為共同作者的原因——一個寫了證明,一個審了證明。

這一舉動由于arXiv的規定,最后發表時還是去掉了AI作者的名字。

更令人好奇的是,他們采用的也是類似「vibe coding」的交互式編程方式。

不是預先設計好完整證明步驟,再讓AI去填空,而是邊想邊讓AI試,一步步把想法轉化為代碼。

這樣做的好處是人類不需要過多操心Lean的語法細節,而由AI根據上下文「自由發揮」提案,然后人類再篩選糾正。

這種人機協作方式頗有即興創作的味道:AI提供源源不斷的靈感火花,人類負責辨別哪些是寶石、哪些只是火花。

然而這種自由也帶來了大量「垃圾代碼」和反復嘗試。

作者直言,最終的Lean證明簡直是一鍋夾生的「意大利面」,里面充滿了AI走彎路留下的冗余邏輯。

好在有Lean這個「蜻蜓隊長」把關,每個步驟都嚴格審核,否則真不敢相信AI產出的證明就一定可靠。

正如兩位作者所強調的,大模型常常幻覺、出錯,如果沒有形式化驗證(如使用Lean),根本無法信任這樣的證明。

AI+人類

數學證明的新范式

AI與人類在數學中協作的藝術想象。

國外權威媒體也開始關注這一趨勢:數學證明正悄悄進入「AI輔助時代」。

Quanta Magazine就報道了數學家們對于AI助手的看法,許多人已經在為這種范式轉變做準備,思考在AI時代如何重新定義「證明」。

畢竟從歷史看,每當出現新工具,數學家的工作方式就會隨之改變:計算器、計算機代數系統,現在輪到了智能AI。

即使只能把證明中枯燥繁瑣的部分外包給AI,也將「極大改變我們從事數學的方式」。

的確,當人類不再需要手動檢查每個細節,就能把更多精力放在創造性的思考上。

另一方面,也有數學家提出謹慎的聲音。

蒙特利爾大學的安德魯·格蘭維爾(Andrew Granville)坦言,他擔心過度依賴AI驗證會讓研究者失去鍛煉思維的機會:

真正的理解往往來自于親自動手,「弄臟雙手」。

Andrew Granville

這種顧慮不無道理:如果AI成了拐杖,年輕一代會不會變得不善于獨立證明?

然而,多數專家認為,與其抗拒AI,不如主動擁抱、學習駕馭。

畢竟紙和鉛筆的時代早已過去,電腦驗算、機器證明正成為新常態。

未來的數學家或許更像是總指揮,調度AI這個強大的工具完成證明,就像科學家使用實驗儀器那樣。

陶哲軒把這種前景稱作「數學的工業化時代」,要用AI擴充數學家的能力版圖。

一如當年國際象棋出現計算機助手,頂尖棋手學會與電腦共舞,開辟出人機融合的新境界。

數學領域如今也站在類似的門檻上:AI不會取代數學家,但正在成為數學家工作桌上的標配工具。

也許若干年后,我們回顧這段歷史時,會驚嘆地發現:正是從ChatGPT與Lean的「合奏」開始,證明的方式被重新定義,人類對真理的探索奏響了新的樂章。

在AI的陪伴下,數學家的征途不再是孤軍奮戰,而更像是一場人與機器聯袂出演的華麗冒險。

定理未必更容易求證了,但證明的旅程,變得前所未有的精彩。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-10-14 14:31:36

2023-10-04 08:07:06

CopilotGitHub

2025-05-22 09:08:40

2024-12-09 09:35:00

AI數據訓練

2023-09-02 11:21:54

代碼ChatGPT

2025-06-03 08:15:00

2025-07-14 09:20:00

2023-10-10 13:51:46

GPT-4GitHubAI

2023-09-04 13:16:00

人工智能模型

2024-02-26 08:30:00

2024-04-15 12:29:00

AI訓練

2024-07-29 08:49:00

AI數學

2025-05-27 15:17:55

研究經費NSF資金

2025-10-20 09:04:00

2024-07-08 13:08:04

2024-10-12 12:30:04

2025-10-30 16:08:28

谷歌AI陶哲軒

2025-05-21 09:10:00

AI代碼陶哲軒

2025-06-12 14:20:35

谷歌DeepMindAI

2025-08-13 09:10:40

點贊
收藏

51CTO技術棧公眾號

日本午夜精品一区二区| 国产美女福利在线| 99精品视频免费观看| 97人洗澡人人免费公开视频碰碰碰| 欧美另类tv| 91久久精品一区二区二区| www.91av| 久久久久久久久一| 精品一区二区成人免费视频| 综合久久精品| 国产mv久久久| 777精品视频| 一根才成人网| 精品欧美乱码久久久久久| 国产精品视频一区二区久久| 亚洲高清在线视频| 五十度飞在线播放| 亚洲男人天堂av网| 天天综合天天操| 国产精品五月天| 九九热精品在线播放| 国产精品私房写真福利视频| 国产一区二区三区小说| 国产电影精品久久禁18| 久久观看最新视频| 蜜臀av在线播放一区二区三区| 精品在线视频一区二区| 午夜久久tv| 成人午夜激情免费视频| 久久一区二区三区喷水| 欧美亚洲在线视频| 欧美久久精品一级c片| 国产精品流白浆视频| 999国产精品| 国产偷国产偷亚洲高清97cao| 欧美fxxxxxx另类| 热re99久久精品国产66热| 欧美人xxxxx| avtt在线播放| 欧美mv日韩mv亚洲| free欧美| 欧美激情在线观看| 啪啪亚洲精品| 91情侣偷在线精品国产| 1024成人| 在线观看成人av| 成人一区二区在线观看| 牛夜精品久久久久久久| 亚洲自拍与偷拍| 尤物网在线观看| 亚洲欧美日韩爽爽影院| 国产精品自在| 成人av蜜桃| 狠狠色综合色综合网络| 老司机午夜av| 欧美日韩综合视频| av2020不卡| 97久久精品视频| 日韩图片一区| 佐佐木明希av| 亚洲在线视频免费观看| 二区三区在线观看| 久久91精品国产91久久久| 日韩欧美一区二区三区在线视频| 欧美三日本三级少妇三99| 91丝袜美腿高跟国产极品老师| 欧美变态视频| 日韩av在线看| 中文字幕伦av一区二区邻居| 国产 日韩 欧美 综合 一区| 国产精品入口免费| 国产99精品| 欧美日韩综合在线| 欧美精品资源| 国产日产欧美精品| 激情久久五月天| h动漫在线视频| 日韩精品免费在线观看| 日本午夜精品久久久| 精品国产乱码久久久久久108| www.在线欧美| av免费在线一区二区三区| 久久精品在线视频| 最新成人av网站| 亚洲福利精品视频| 亚洲第一精品电影| 日韩专区精品| 无遮挡又爽又刺激的视频| 欧美日韩国产一级二级| 中文字幕日韩亚洲| 蜜桃视频在线观看成人| 欧美第一页浮力影院| 欧美激情视频在线观看| 欧美不卡视频| 久草网在线视频| 国产精品99久久久久久董美香 | 亚洲色图欧美偷拍| 天堂8中文在线最新版在线| 成人av资源在线播放| 26uuu久久天堂性欧美| 国产1区在线| 久久久久久网| 亚洲尤物在线视频| 欧美极品第一页| 国产一区二区三区四| 春暖花开成人亚洲区| 国产精品久久久999| 国产精品视频一二三区| 国产成人福利夜色影视| 久久66热这里只有精品| 欧美日韩国产一区中文午夜| 啪啪激情综合网| 香蕉视频网站入口| 久久精视频免费在线久久完整在线看| 精品一区二区三区免费毛片爱| av在线资源站| 不卡日韩av| 一本一本久久a久久精品综合麻豆 一本一道波多野结衣一区二区 | 欧美巨乳在线| 国产成人精品综合| 国产日韩欧美不卡| 亚洲ww精品| 久久在线中文字幕| 国产视频精品免费播放| 水野朝阳av一区二区三区| 高清av电影在线观看| 亚洲a级在线播放观看| 国产精品大尺度| 欧美**字幕| 在线观看中文字幕| 91九色国产社区在线观看| 亚洲mv在线观看| 欧美日韩精品一本二本三本 | 伊人色综合一区二区三区影院视频| 精品一区二区三区视频日产| 欧美伦理视频网站| 久久精品二区三区| 国产高清自产拍av在线| 国产 欧美 日韩 一区| 国产亚洲美女精品久久久| 成人永久aaa| 日韩中文在线| xxxx影院| 国产在线视频91| 在线视频国产一区| 免费在线观看成人av| 超碰在线网站| 国产美女在线一区| 亚州国产精品久久久| 伊人开心综合网| 欧美网站在线| 国产美女精品写真福利视频| 在线视频观看日韩| 日韩欧美电影| 欧美日韩国产综合在线| 亚洲成人网av| 91在线小视频| 日韩在线中文| 色婷婷视频在线观看| 法国空姐在线观看免费| 久久久精品日本| 亚洲成人精品影院| 激情视频国产| 国产精品99久久久久久www| 欧美性猛交xxxx免费看| 老司机午夜精品视频| 国产区一区二| 中文在线a在线| 一区二区精品视频| 欧美精品久久久久久久久| 一本一道波多野结衣一区二区 | 高清视频一区| 亚洲国产精品网站| 国产精品久久久久一区| 精品成人在线| 四虎地址8848精品| 国产一区精品| 免费看国产曰批40分钟| 91久久精品日日躁夜夜躁国产| 亚洲精品成人网| 亚洲人成亚洲人成在线观看图片| 新狼窝色av性久久久久久| 国产精品**亚洲精品| 国产中文字幕在线播放| 日本日本19xxxⅹhd乱影响| av在线不卡观看| 久热精品在线视频| 日本精品一区二区三区高清| 国产大片一区二区| 国产精品久久久久久麻豆一区软件| 黄频免费在线观看| 国产香蕉视频在线观看| 男人天堂a在线| 懂色一区二区三区av片| 色综合久久悠悠| 91精品国产高清一区二区三区蜜臀| 中文一区在线播放| 久久国产精品一区二区| 99久久精品网站| 亚洲国产欧美国产第一区|