国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

大型語言模型對編碼來說是錯誤的嗎?

人工智能
強化學習可以進行精確的大規模自主編碼,Lodge說。當然,他這么說是出于既得利益:2019年,他的公司Diffblue發布了基于強化學習的商業單元測試編寫工具Cover。Cover在沒有人工干預的情況下編寫完整的單元測試套件,使大規模自動化復雜的、容易出錯的任務成為可能。

當目標是準確性、一致性、精通游戲或找到一個正確答案時,強化學習模型會擊敗生成式人工智能。

  像GPT-4這樣的大型語言模型的興起令人矚目,它們能夠生成高度流暢、自信的文本。可悲的是,炒作也是如此:微軟的研究人員屏氣地將微軟資助的OpenAI GPT-4模型描述為展示“人工通用智能的火花”。

  當然,除非微軟指的是產生幻覺的傾向,生成的錯誤文本肯定是錯誤的。GPT還不擅長下棋和圍棋等游戲,不擅長數學,編寫的代碼可能有錯誤和微妙的漏洞。

  這并不意味著大型語言模型都是炒作。一點也不相反,這意味著我們在關于生成式人工智能(GenAI)的對話中需要一些視角,而不是夸大其詞。

  正如IEEESpectrum的一篇文章所詳述的那樣,一些專家,例如OpenAI的IlyaSutskever,認為添加帶有人類反饋的強化學習可以消除LLM幻覺。但是其他人,比如Meta的YannLeCun和GeoffHinton(最近從Google退休),認為大型語言模型中更根本的缺陷在起作用。兩人都認為,大型語言模型缺乏非語言知識,而非語言知識對于理解語言所描述的潛在現實是至關重要的。

  在一次采訪中,Diffblue公司首席執行官MathewLodge認為,有一種更好的方法。他說,“小型、快速、運行成本低廉的強化學習模型,在從玩游戲到編寫代碼的各種任務中,都能輕松擊敗擁有千億參數的大型語言模型。”

  我們是否在錯誤的地方尋找人工智能黃金?

  正如Lodge所說,生成式人工智能肯定有它的一席之地,但我們可能正試圖將其強行引入強化學習更好的領域。以游戲為例。

  國際象棋大師LevyRozman發布了一段他與ChatGPT對弈的視頻。這個模型做出了一系列荒謬和非法的動作,包括捕捉自己的棋子。最好的開源國際象棋軟件(Stockfish,它根本不使用神經網絡)讓ChatGPT在不到10步的時間里擊敗,因為大型語言模型找不到合法的走法。這是一個很好的證明,大型語言模型遠遠達不到通用人工智能的宣傳,這并不是一個孤立的例子。

  谷歌AlphaGo是目前最好的圍棋人工智能,它是由強化學習驅動的。強化學習的工作原理是為一個問題生成不同的解決方案,嘗試它們,使用結果來改進下一個建議,然后重復這個過程數千次以找到最佳結果。

  在AlphaGo的例子中,人工智能會嘗試不同的走法,并預測這是否是一個好走法,以及它是否有可能從這個位置贏得比賽。它使用反饋來“跟蹤”有希望的移動序列,并生成其他可能的移動。其效果是對可能的移動進行搜索。

  這個過程被稱為概率搜索。你不可能嘗試所有的招式(招式太多了),但可以花時間搜索可能找到最佳招式的區域。這對于玩游戲來說非常有效。AlphaGo過去曾擊敗過圍棋大師。AlphaGo并非萬無一失,但它目前的表現比當今最好的大型語言模型還要好。

  概率與準確性

  當有證據表明大型語言模型的表現明顯落后于其他類型的人工智能時,支持者認為大型語言模型“會變得更好”。然而,根據Lodge的說法,“如果我們同意這個觀點,我們需要理解為什么他們會在這類任務中做得更好。”他繼續說,這就是事情變得困難的地方,因為沒有人能預測GPT-4對特定提示會產生什么效果。這種模式是人類無法解釋的。他認為,這就是“‘即時工程’不存在的原因。”他強調,對于人工智能研究人員來說,證明大型語言模型的“涌現特性”存在也是一場斗爭,更不用說預測它們了。

  可以說,最好的論證是歸納法。GPT-4在一些語言任務上比GPT-3更好,因為它更大。因此,更大的模型會更好。

  Lodge認為:“唯一的問題是,GPT-4仍在努力完成OpenAI指出的GPT-3所面臨的挑戰。數學就是其中之一;GPT-4在加法運算方面優于GPT-3,但在乘法和其他數學運算方面仍存在困難。

  使語言模型更大并不能神奇地解決這些難題,甚至OpenAI也說更大的模型不是答案。原因歸結為大型語言模型的基本性質,正如OpenAI論壇所指出的那樣:“大型語言模型本質上是概率性的,并且通過根據他們在訓練數據中觀察到的模式生成可能的輸出來運行。在數學和物理問題中,可能只有一個正確答案,而且生成這個答案的可能性非常低。”

  相比之下,由強化學習驅動的人工智能在產生準確結果方面要好得多,因為這是一個尋求目標的人工智能過程。強化學習有意地朝著期望的目標迭代,旨在產生它能找到的最接近目標的最佳答案。Lodge指出,大型語言模型課程“并不是為了迭代或尋找目標而設計的。它們的設計目的是給出‘足夠好’的一次或幾次回答。”

  “一次性”答案是模型產生的第一個答案,它是通過預測提示中的一系列單詞而獲得的。在“幾次射擊”方法中,模型被給予額外的樣本或提示,以幫助它做出更好的預測。大型語言模型通常也會加入一些隨機性(也就是說,它們是“隨機的”),以增加更好的回答的可能性,所以他們會對同樣的問題給出不同的答案。

  并不是說大型語言模型世界忽視了強化學習。GPT-4結合了“強化學習與人類反饋”(RLHF)。這意味著核心模型隨后由人類操作員訓練,使其更喜歡某些答案,但從根本上說,這不會改變模型首先生成的答案。例如,Lodge說,大型語言模型可能會生成以下選項來完成句子“韋恩?格雷茨基喜歡冰....”。

  1.韋恩?格雷茨基喜歡冰淇淋。

  2.韋恩?格雷茨基喜歡冰球。

  3.韋恩?格雷茨基喜歡冰上釣魚。

  4.韋恩?格雷茨基喜歡滑冰。

  5.韋恩?格雷茨基喜歡冰酒。

  人工操作員對答案進行排序,可能會認為加拿大傳奇冰球運動員更喜歡冰球和滑冰,盡管冰淇淋有著廣泛的吸引力。人類的排名和更多的人類寫的回答被用來訓練模型。請注意,GPT-4并沒有假裝準確地知道韋恩?格雷茨基的偏好,只是在提示下最可能的完成。

  最后,大型語言模型的設計并不是高度準確或一致的。在準確性和確定性行為之間存在一種權衡,以換取普遍性。對Lodge來說,所有這些都意味著,在大規模應用人工智能方面,強化學習擊敗了生成式人工智能。

  將強化學習應用于軟件

  軟件開發呢?正如我所寫的,GenAI已經為那些使用GitHubCopilot或AmazonCodeWhisperer等工具提高生產力的開發人員提供了機會。這不是猜測——它已經發生了。這些工具根據集成開發環境中插入點前后的代碼預測接下來可能出現的代碼。

  事實上,正如VisualStudio雜志的DavidRamel所言,最新版本的Copilot已經生成了61%的Java代碼。對于那些擔心這會減少軟件開發人員工作的人,請記住,這些工具需要勤奮的人工監督來檢查完成情況,并對其進行編輯,以使代碼正確編譯和運行。自IDE誕生之初,自動補全功能就一直是IDE的主要功能,而Copilot和其他代碼生成器使它變得更加有用。但是大規模的自主編碼(實際上需要編寫61%的Java代碼)就不是這樣了。

  然而,強化學習可以進行精確的大規模自主編碼,Lodge說。當然,他這么說是出于既得利益:2019年,他的公司Diffblue發布了基于強化學習的商業單元測試編寫工具Cover。Cover在沒有人工干預的情況下編寫完整的單元測試套件,使大規模自動化復雜的、容易出錯的任務成為可能。

  Lodge有偏見嗎?絕對的。但他也有很多經驗來支持他的信念,即強化學習在軟件開發方面可以勝過GenAI。如今,Diffblue使用強化學習來搜索所有可能的測試方法的空間,為每個方法自動編寫測試代碼,并在編寫的測試中選擇最佳測試。強化學習的獎勵函數基于各種標準,包括測試的覆蓋率和美學,其中包括看起來像是人類編寫的編碼風格。該工具平均在一秒鐘內為每種方法創建測試。

  Lodge認為,如果目標是為一個沒有人理解的程序自動編寫10,000個單元測試,那么強化學習是唯一真正的解決方案。“大型語言模型無法競爭;人類沒有辦法有效地監督它們,并在這種規模上糾正它們的代碼,使模型更大、更復雜并不能解決這個問題。”

  結論:大型語言模型最強大的地方在于它們是通用語言處理器。他們可以完成沒有受過明確訓練的語言任務。這意味著他們可以在內容生成(文案)和許多其他事情上做得很好。Lodge強調:“但這并不能使大型語言模型成為人工智能模型的替代品,人工智能模型通常基于強化學習,后者更準確、更一致,而且可以大規模使用。”

責任編輯:武曉燕 來源: 機房360
相關推薦

2009-04-03 15:17:43

LinuxWindows 7機會

2009-04-04 09:36:11

Windows 7微軟操作系統

2018-08-06 04:03:00

2020-02-10 10:26:37

云計算大數據技術

2022-09-22 14:49:37

智能建筑物聯網

2012-06-25 14:12:44

2024-12-12 09:11:58

2021-04-06 16:30:30

智慧城市物聯網城市服務

2022-06-02 14:32:36

加密貨幣比特幣以太坊

2019-10-21 15:52:19

網絡安全技術安全

2009-02-24 09:04:07

Windows 7微軟PC游戲

2015-12-14 16:19:43

LPWA物聯網

2013-05-03 09:12:04

UPnPUPnP安全

2015-09-01 10:05:17

OpenStackDocker

2017-07-20 08:55:47

2023-09-20 16:21:42

2021-01-08 16:07:19

加密貨幣比特幣存儲

2024-04-16 16:14:01

人工智能LLMRAG

2025-08-19 10:10:46

2024-10-21 15:01:12

AI 工具
點贊
收藏

51CTO技術棧公眾號

57pao国产成人免费| 欧美午夜免费| 国产盗摄精品一区二区酒店| 91麻豆6部合集magnet| 国产一区二区不卡视频| 欧美wwwww| 国产精品91在线观看| 99ri日韩精品视频| 久久亚洲精品一区二区| 日韩免费小视频| 日韩成人av在线播放| 黄页网站在线| 亚洲国产另类久久精品 | 亚洲激情视频| 91手机在线视频| 欧美日韩在线大尺度| 国产免费一区二区三区在线能观看 | 97超碰在线免费| 91精品国产麻豆| 黄色在线论坛| 91精品国产综合久久小美女| 五月香视频在线观看| 欧美日韩国产天堂| 牛牛精品视频在线| 亚洲国产精品va在线看黑人| 一区二区电影免费观看| 国产亚洲精品美女| 玖玖玖视频精品| 国产激情视频一区| 黄色日韩在线| 日韩videos| 国产精品综合在线视频| 欧在线一二三四区| 午夜精品爽啪视频| 国产区在线观看| 亚洲丝袜一区在线| 精品亚洲二区| 日本久久久久久久久久久| 91久久国产| 欧美一区二区三区成人久久片| 麻豆视频一区二区| 韩国日本在线视频| 亚洲一区在线看| 91精品大全| 亚洲精品ady| 亚洲精品一区在线| 国产欧美日韩中文字幕| 欧美亚洲在线| 精品久久一二三| 亚洲最新视频在线观看| 日本高清视频在线播放| 精品在线小视频| 久久超级碰碰| 加勒比在线一区二区三区观看| 麻豆精品精品国产自在97香蕉| 成人毛片一区二区| 精品免费在线视频| 天堂av在线| 日本三级久久久| 快she精品国产999| 可以在线看的黄色网址| 香蕉久久一区二区不卡无毒影院 | 精品久久一区二区三区蜜桃| 精品制服美女久久| 免费福利片在线观看| 欧美久久久一区| 136福利精品导航| 九色91在线视频| 久久新电视剧免费观看| 高清av在线| 欧美美最猛性xxxxxx| 激情综合在线| 91视频免费版污| 91精品国产高清一区二区三区| 91精品在线免费视频| 国产伦理久久久| 国产免费成人在线视频| sm国产在线调教视频| 97不卡在线视频| 男人操女人的视频在线观看欧美| 国产免费网址| 精品一区精品二区| 一本到12不卡视频在线dvd| 精品久久一二三| 91精品国产欧美一区二区18| 秋霞综合在线视频| 亚洲区一区二区三区| 亚洲一区二区三区四区在线免费观看 | 国产欧美日韩最新| 99久久精品国产毛片| 午夜不卡视频| 青青草原一区二区| 国产乱子伦一区二区三区国色天香| 在线激情av| 97在线视频免费播放| 国产精品一区久久久久| 色视频在线免费观看| 国产精品久久久久久超碰| 99久久夜色精品国产网站| a级片国产精品自在拍在线播放| 国产精品扒开腿做爽爽爽的视频| 国产丶欧美丶日本不卡视频| 免费人成在线观看播放视频| 国产精品丝袜一区二区三区| 久久免费电影网| 国产免费不卡| 亚洲色图自拍| 6080午夜不卡| 很黄很黄激情成人| 一级在线观看| 国产精品a久久久久久| 久久久欧美精品sm网站| 快播电影网址老女人久久| 欧美日韩综合另类| 欧美精品在线一区二区三区| 综合国产精品| 欧美一区二区视频| 国产日韩视频在线观看| 樱花影视一区二区| 久久最新网址| 日本aⅴ中文| 欧洲亚洲免费在线| 国产欧美久久久精品影院| 99综合99| 四虎永久在线精品无码视频| 亚洲免费电影一区| 国产一二精品视频| 卡通欧美亚洲| 91大学生片黄在线观看| 亚洲人成绝费网站色www| 日本怡春院一区二区| 手机在线免费av| 亚洲视频在线观看日本a| 欧美成人精品福利| 蜜桃av一区二区在线观看| av影院在线| 激情六月天婷婷| 精品国偷自产在线视频| 91亚洲精华国产精华精华液| 成人在线精品| 冲田杏梨av在线| 欧美资源在线观看| 第一福利永久视频精品| 欧美色图首页| 女人黄色免费在线观看| 免费成人深夜夜行网站视频| 一区二区欧美日韩视频| 91美女在线观看| 亚洲影院天堂中文av色| 青青青手机在线视频观看| 国产乱码精品一区二区三区中文 | 成人免费黄色网页| 国产福利不卡| 精品国产凹凸成av人网站| 久久激情五月婷婷| 久久免费资源| 高清一级毛片视频| 国产精品三区四区| 日韩禁在线播放| 国产亚洲精品福利| 成人影院天天5g天天爽无毒影院| 精品久久av| 少妇高潮流白浆| 欧美激情一级精品国产| 欧美日韩国产麻豆| 久久精品国产久精国产爱| 国产aa精品| 360天大佬第二季在线观看| 国产欧美综合精品一区二区| 精品国产青草久久久久福利| 精品在线视频一区| 都市激情亚洲欧美| 国产在线你懂得| 亚洲色图都市激情| 欧美一区二区视频97| 欧美福利视频一区| 91在线高清观看| 国产精品永久免费视频| 欧美一区二区啪啪| 91美女在线视频| 国产精品chinese| 免费成人动漫| 偷偷要色偷偷| 影音先锋在线亚洲| 国产精品电影观看| 日韩精品在线看| 亚洲午夜日本在线观看| 久久精品国产99国产| 蜜桃成人av| 草草影院在线| 国产青青视频| 亚洲一区高清| 国产精品热视频| 亚洲天堂精品在线| 欧美性猛交xxxx乱大交3| 国产一区91精品张津瑜| 99国内精品久久久久久久| 激情中国色综合| 精品久久久久一区二区三区| 国模杨依粉嫩蝴蝶150p|