国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

挖掘GPT的隱藏實力就靠它了

人工智能 新聞
在它的作用下,GPT-4回答的準確率從68%提高到了85%。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

這個GitHub新項目,能讓ChatGPT完成復雜任務,GPT3.5和GPT-4都支持。

它通過將問題拆解,并調用外部資源,提高了GPT的工作能力。

在它的調教下,GPT-4回答的準確率從68%提高到了85%。

這個項目名叫SmartGPT,這個名字很直白地告訴了我們它的作用。

無論是直觀感受還是量化數據,GPT在它的加持之下回答正確率都有提高。

我們不妨看看幾個經典的問題。

晾干5件衣服需要5個小時,那么晾30件需要多長時間呢?

這是一個來自OpenAI Playground的經典問題。

只見GPT一頓操作猛如虎,又是推理又是列方程……

然而最后給出的答案是30個小時。

圖片

而經過SmartGPT調教之后,不僅得到了正確答案,還指出了此前的思路為什么會出錯。

圖片

再來舉個栗子,同樣是來自于OpenAI Playground的問題。

假設有6升和12升的罐子各一個,如何量取6升水?

GPT的答案嘛……麻煩不說,能不能解釋下第五步的2升是怎么剩下的?

經過調教之后嘛……雖然不理解為什么不直接用6升的,但也有很大進步了。

我們也用倒拔垂楊柳的問題進行了測試,提供了諸葛亮、孫悟空和林黛玉三個選項。

第一輪,GPT-4給出的答案是……孫悟空。

圖片

經過調教之后,GPT-4終于發現了三個選項都是錯誤的。

同時還指出了孫悟空雖然沒有倒拔垂楊柳但是有相似的情節。

(《西游記》第二十五回中,孫悟空在五莊觀因憤怒將人參果樹拔倒)

圖片

需要說明的是,由于沒有GPT-4的API,測試是按照開發者介紹的方法手工完成的。

當然了,個例并不能說明它的表現,還是要用數據集測試一下。

開發者使用了MMLU數據集分別對調教前后的GPT-4進行了測試。

結果顯示,未經調教的版本只答對了68%,而調教后的版本答對了85%。

順便提一句,真人專家在測試中的平均成績是89.8%。

圖片

數學方面,同樣使用MMLU數據集進行測試,開發者從中選擇了15個大學難度的數學問題。

雖然準確率只有60%,但也是及格了,而且比原版GPT的40%已經好了太多。

化整為零,逐步解決

開發者將SmartGPT中的環節形象地比作了職場中的角色:

“甲方”:SmartGPT用戶。
“經理”:和“甲方”對接,把任務拆分成高級子任務并逐一匯報給“老板”。
“老板”:制定計劃,將高級子任務再次拆分,并分發給“員工”。
“員工”:接收任務,編寫偽代碼,交給“小黃人”執行。
“小黃人”:將偽代碼優化成LUA腳本并運行。

作為“甲方”的用戶,需要做的只是像使用普通GPT一樣輸入自己的問題,而不必給出額外指令。

SmartGPT會幫助用戶把問題拆分,然后按照步驟提交給GPT。

此前有人發現,在輸入給GPT的指令中加入“let’s think step by step”可以提高回復的準確率。

同時,GPT-4具有回溯能力,能夠發現并指出自己此前回答中的錯誤。

以上兩個特性為SmartGPT的工作提供了重要支撐。

圖片

△ SmartGPT工作流程圖

在用戶輸入完指令后,SmartGPT對其進行處理拆分,包括添加“let’s think step by step”類似的表述。

然后它會將處理好的指令傳至GPT的API,并重復多次獲取不同的答案。

接著,SmartGPT會向API發送要求其回溯答案并選擇最優解的指令。

最后,將GPT自己選擇的最佳答案展示給用戶。

上述步驟受到了三篇學術論文的啟發(圖中白框)。

這三篇論文的內容分別關于“鏈式提示方式”、“動態記憶及讓LLM自我回溯”和“用對話提高LLM完成度”。

和其他工具相比,SmartGPT好在哪

AutoGPT等工具同樣可以用來優化GPT,SmartGPT比它們好在哪里呢?

由于其工作原理是將任務進行拆分,會形成邏輯鏈條,因此SmartGPT擁有更強大的推理能力。

實用性方面,SmartGPT由獨立的子模塊組成,使用者可以對它們進行任意排列、組合和刪改。

此外,無論對于用戶還是開發人員,SmartGPT的配置過程都更為簡單。

不過開發者也坦言,這個項目剛推出不久,因此穩定性有待考證,在內存優化方面還有所欠缺,消耗的環境資源也更多。

在項目推出之后,有網友表示我們低估了GPT的潛力,甚至包括OpenAI自己。

圖片

那么,你期待GPT未來的表現嗎?

SmartGPT目前暫無開箱可用版本,需要自行在Linux環境搭建,動手能力強的讀者可根據下面的項目頁面中的指示體驗:

項目地址:https://github.com/Cormanz/smartgpt

項目涉及到的論文:
[1]. https://arxiv.org/abs/2305.02897
[2]. https://arxiv.org/abs/2303.11366
[3]. https://arxiv.org/abs/2303.17071

責任編輯:張燕妮 來源: 量子位
相關推薦

2021-05-07 06:15:32

編程開發端口掃描

2019-08-20 15:22:40

GitHub代碼開發者

2022-02-16 10:35:19

IBM

2022-11-02 08:46:42

Go設計模式流程

2020-04-08 17:26:19

QLCSSDHDD

2018-01-21 23:23:07

戴爾

2022-09-21 14:17:58

Umi-OCR軟件

2025-10-09 07:05:00

Spark運維

2015-08-14 10:07:06

2023-09-05 17:42:10

AI模型

2017-01-06 18:10:22

程序

2023-08-08 12:51:55

AI技術

2019-04-12 16:10:32

Python面試題編程

2017-07-14 15:20:43

Linux文件系統目錄結構

2018-02-02 10:49:05

編程開發Java

2023-04-06 16:09:46

程序員AI

2017-08-04 09:36:02

云計算中國云

2019-08-01 09:07:05

IBM存儲IBM存儲

2025-10-10 02:10:00

點贊
收藏

51CTO技術棧公眾號

91视频国产精品| 最新在线观看av| 成人情趣视频网站| 亚洲成人网在线| 国产在线一在线二| 天天影视网天天综合色在线播放| 九色成人在线| 国产欧美日产一区| 欧美v在线观看| 国产高清精品在线| 欧美黄色免费网址| 国产·精品毛片| 四虎影院一区二区| 麻豆91在线看| 先锋影音亚洲资源| 日韩1区2区3区| 鲁丝一区二区三区免费| 尤物在线精品| 国产伦精品一区二区三区免| 国模一区二区三区| 精品国产一区二区三区免费| 一区二区三区高清视频在线观看| 国产伦精品一区二区三区高清版| 欧美~级网站不卡| 91精品久久久久久久久| 91欧美在线| 国产午夜精品在线| 久久久久91| 婷婷视频在线播放| 高清在线观看日韩| 99色精品视频| 国产精品福利一区二区| bdsm精品捆绑chinese| 精品欧美aⅴ在线网站| av播放在线| 亚洲国产精品yw在线观看| 依依综合在线| 欧美人与物videos| 欧美日一区二区| 99久久伊人精品影院| 另类国产ts人妖高潮视频| 亚洲啊啊啊啊啊| 久久久高清一区二区三区| 国产剧情演绎av| 欧美在线免费观看亚洲| 国产伦子伦对白在线播放观看| 色av吧综合网| 蜜臀久久99精品久久一区二区| 国产主播在线一区| 日本中文一区二区三区| 青青青青草视频| 亚洲欧美另类小说| 国产精品剧情一区二区在线观看| 日韩国产在线播放| 国产精品流白浆在线观看| 亚洲xxxx3d| 国产精品一二三| 二区三区中文字幕| 日韩免费视频一区二区| 欧美电影院免费观看| 成人免费视频网| 久久成人精品无人区| 色婷婷亚洲十月十月色天| 欧美日韩国产一区二区三区地区| 日韩色淫视频| 91丝袜脚交足在线播放| 国产大片一区二区| 性综艺节目av在线播放| 欧美精品一区二区久久久| 8x国产一区二区三区精品推荐| 粉嫩精品一区二区三区在线观看| 国产成人精品亚洲日本在线桃色 | 91极品视觉盛宴| 厕沟全景美女厕沟精品| 国产精品久久久久av| 久久se精品一区精品二区| 日本搞黄视频| 日韩经典中文字幕在线观看| 日本精品黄色| 欧美视频免费看欧美视频| 91久久精品日日躁夜夜躁欧美| 国产电影一区| 欧美一区二视频在线免费观看| 国产精品盗摄一区二区三区| 黄视频在线免费看| 国产免费久久av| 91麻豆免费视频| 欧美人与禽猛交乱配| 91精品免费久久久久久久久| av一二三不卡影片| 蜜桃视频网站在线| 国产福利成人在线| 成人v精品蜜桃久久一区| 色的视频在线免费看| 人人爽久久涩噜噜噜网站| 国产成人精品影院| 亚洲性图自拍| 国产欧美在线视频| 国产精品区一区二区三区| а√天堂资源官网在线资源| 亚洲一区制服诱惑| 中国色在线观看另类| а√天堂8资源在线| 精品免费日产一区一区三区免费| 亚洲精品国产一区二区三区四区在线 | 最新在线地址| 九九热r在线视频精品| 久久www免费人成看片高清| 第三区美女视频在线| 日本成人黄色片| 国产日韩欧美a| 成人综合网站| 青草全福视在线| 亚洲国产精品人人爽夜夜爽| 99re国产精品| 国产免费a∨片在线观看不卡| 国产精品成久久久久三级| 国产欧美精品国产国产专区| 四虎在线精品| 国产资源在线免费观看| 亚洲男人的天堂网站| 视频一区中文字幕国产| 黄色网在线免费观看| 国产日韩欧美综合精品| 日本福利一区二区| 欧美人成网站| 黄色av网站在线免费观看| 91久久嫩草影院一区二区| 午夜免费久久看| 天天综合亚洲| 一级毛片在线视频| 国产日韩av高清| 精品国产91久久久| 亚洲成人最新网站| 国产高清视频在线播放| 成人av资源| 欧美一区二区三区啪啪| 久久精品欧洲| 亚洲深夜视频| 北条麻妃69av| 91国产一区在线| 一区二区三区欧美在线观看| 欧美色图一区| 黄色毛片在线看| 欧洲精品在线一区| 亚洲精选一区二区| 久久综合久久综合亚洲| 国产劲爆久久| 中文字幕在线免费专区| 国产伦精品一区二区三区在线 | 激情综合网五月激情 | 在线观看的av| 视频一区二区三区在线观看 | 国产精品18久久久久| 日本综合视频| 国产偷人视频免费| 国产91色在线|免| 91极品美女在线| 麻豆91在线播放免费| 91亚洲视频| 诱受h嗯啊巨肉高潮| 国产精品一区二区三区四区五区| 精品国产成人在线影院 | 日本一区二区免费看| 亚洲欧洲免费视频| 欧美激情一区二区三区不卡 | 国产亚洲精品久久久久久| 91麻豆免费看片| 九九亚洲视频| 欧美激情办公室videoshd| 免费一区二区| 另类综合日韩欧美亚洲| 91超碰在线免费| 污视频网站免费| 91在线三级| 欧美成人a∨高清免费观看| 性欧美video另类hd尤物| 亚洲中文字幕无码专区| 欧美激情区在线播放| 亚洲成a人v欧美综合天堂| 一本色道久久综合亚洲精品高清 | 久热精品视频在线观看| 亚洲欧美偷拍三级| 久久精品一本| 国产一区二区三区国产精品| 黄页网址在线观看| 亚洲第一精品区| 国产不卡在线观看| 99精品国产九九国产精品| 超碰在线图片| 国产精品久久成人免费观看| 欧美专区在线播放| 精品欧美一区二区久久| 亚洲人一二三区| 蜜桃av一区二区三区电影| 欧美激情15p| 欧美激情网站| 九色视频在线播放| 国产男女激情视频| 欧美精品一区二区三区四区五区|