大模型對(duì)語言有自己的理解！MIT論文揭示大模型“思維過程” | ICML 24

作者：量子位 2024-08-19 09:42:00

人工智能新聞

MIT的一項(xiàng)研究發(fā)現(xiàn)，隨著模型能力越強(qiáng)，它對(duì)現(xiàn)實(shí)的理解可能不僅是簡(jiǎn)單模仿。

大模型對(duì)現(xiàn)實(shí)世界，可以形成自己的理解！

MIT的一項(xiàng)研究發(fā)現(xiàn)，隨著模型能力越強(qiáng)，它對(duì)現(xiàn)實(shí)的理解可能不僅是簡(jiǎn)單模仿。

比如大模型沒有聞過氣味，是否就意味著它不能理解氣味？

研究發(fā)現(xiàn)，它可以自發(fā)模擬一些概念，方便理解。

這項(xiàng)研究意味著，大模型未來有希望更深入理解語言和世界，論文已被頂會(huì)ICML 24接收。

這篇論文的作者是MIT計(jì)算機(jī)與人工智能實(shí)驗(yàn)室（CSAIL）華裔博士生Charles Jin和他的導(dǎo)師Martin Rinard教授。

研究當(dāng)中，作者讓大模型只學(xué)習(xí)代碼文本，結(jié)果發(fā)現(xiàn)模型逐漸掌握了其背后的含義。

Rinard教授表示，這項(xiàng)研究直接針對(duì)現(xiàn)代人工智能的一個(gè)核心問題——

大模型的能力僅僅是由于大規(guī)模的統(tǒng)計(jì)相關(guān)性，還是對(duì)它們要處理的現(xiàn)實(shí)問題產(chǎn)生了有意義的理解？

△來源：MIT官網(wǎng)

同時(shí)這項(xiàng)研究也引發(fā)了不少討論。

有網(wǎng)友表示，雖然大模型對(duì)語言的理解可能和人類不同，但這項(xiàng)研究至少說明了模型做的絕不僅僅是對(duì)訓(xùn)練數(shù)據(jù)的記憶。

讓大模型學(xué)習(xí)純代碼

為了探究大模型能否產(chǎn)生語義層面的理解，作者構(gòu)建了一個(gè)由程序代碼及其對(duì)應(yīng)輸入輸出組成的合成數(shù)據(jù)集。

這些代碼程序用一種名為Karel的教學(xué)語言編寫，主要用于實(shí)現(xiàn)機(jī)器人在2D網(wǎng)格世界中導(dǎo)航的任務(wù)。

這個(gè)網(wǎng)格世界由8x8的格子組成，每個(gè)格子可以包含障礙物、標(biāo)記物或空地。機(jī)器人可以在格子間移動(dòng)，并進(jìn)行放置/拾取標(biāo)記物等操作。

Karel語言包含5個(gè)原始操作——move（前進(jìn)一步）、turnLeft（左轉(zhuǎn)90度）、turnRight（右轉(zhuǎn)90度）、pickMarker（拾取標(biāo)記物）、putMarker（放置標(biāo)記物），程序就是由這些原始操作的序列組成。

作者隨機(jī)生成了一個(gè)包含50萬個(gè)Karel程序的訓(xùn)練集，每個(gè)程序長(zhǎng)度在6到10之間。

每個(gè)訓(xùn)練樣本由三部分組成：5個(gè)輸入狀態(tài)、5個(gè)輸出狀態(tài)和完整的程序代碼，輸入輸出狀態(tài)以特定格式編碼進(jìn)字符串中。

利用這些數(shù)據(jù)，作者訓(xùn)練了標(biāo)準(zhǔn)Transformer架構(gòu)的CodeGen模型的一個(gè)變體。

訓(xùn)練過程中，模型可以訪問每個(gè)樣本中的輸入輸出信息和程序前綴，但看不到程序執(zhí)行的完整軌跡和中間狀態(tài)。

除了訓(xùn)練集，作者還構(gòu)建了一個(gè)包含1萬個(gè)樣本的測(cè)試集，用于評(píng)估模型的泛化性能。

為了研究語言模型是否掌握了代碼背后的語義，同時(shí)深入了解模型的“思維過程”，作者設(shè)計(jì)了一套包含線性分類器和單/雙隱層MLP的探測(cè)器組合。

探測(cè)器的輸入是語言模型在生成程序tokens過程中的隱藏狀態(tài)，預(yù)測(cè)目標(biāo)則是程序執(zhí)行的中間狀態(tài)，具體包括機(jī)器人的朝向（direction）、相對(duì)于初始位置的偏移量（position）以及是否正面朝向障礙物（obstacle）這三個(gè)特征。

在生成模型的訓(xùn)練過程中，作者每隔4000步記錄一次上述三個(gè)特征，并同時(shí)記下生成模型的隱藏狀態(tài)，形成探測(cè)器的訓(xùn)練數(shù)據(jù)集。

大模型學(xué)習(xí)的三個(gè)階段

通過觀察語言模型產(chǎn)生的程序的多樣性、困惑度等指標(biāo)隨訓(xùn)練進(jìn)程的變化，作者將訓(xùn)練過程分為了三個(gè)階段——

Babbling（胡言亂語）階段：輸出程序重復(fù)度高，探測(cè)器準(zhǔn)確率不穩(wěn)定。
語法習(xí)得階段：程序多樣性迅速提高，生成準(zhǔn)確率小幅提升，困惑度下降，說明語言模型習(xí)得了程序的句法結(jié)構(gòu)。
語義習(xí)得階段：程序多樣性和句法結(jié)構(gòu)掌握程度平穩(wěn)，但生成準(zhǔn)確率和探測(cè)器性能大幅提升，說明語言模型習(xí)得了程序的語義。

具體來說，Babbling階段占據(jù)了整個(gè)訓(xùn)練過程的前50%，例如在訓(xùn)練到20%左右的時(shí)候，無論輸入什么規(guī)范，模型都只會(huì)生成一個(gè)固定的程序——“pickMarker”重復(fù)9次。

語法習(xí)得階段處于訓(xùn)練過程的50%到75%，模型在Karel程序上的困惑度顯著下降，表明語言模型開始更好地適應(yīng)Karel程序的統(tǒng)計(jì)特性，但生成程序的準(zhǔn)確率提升幅度不大（從10%左右提升到25%左右），仍然無法準(zhǔn)確完成任務(wù)。

語義習(xí)得階段是最后的25%，程序的準(zhǔn)確率出現(xiàn)了急劇提升，從25%左右提升到90%以上，生成的程序能夠準(zhǔn)確地完成給定的任務(wù)。