国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

OpenAI沒開源的gpt-oss基礎模型,他去掉強化學習逆轉出來了

人工智能 新聞
近日,Cornell Tech 博士生、Meta 研究員 Jack Morris 決定自己動手填補這一空白。

前些天,OpenAI 少見地 Open 了一回,發布了兩個推理模型 gpt-oss-120b 和 gpt-oss-20b。

但是,這兩個模型都是推理模型,OpenAI 并未發布未經強化學習的預訓練版本 gpt-oss 基礎模型。然而,發布非推理的基礎模型一直都是 AI 開源 / 開放權重社區的常見做法,DeepSeek、Qwen 和 Mistral 等知名開放模型皆如此。

近日,Cornell Tech 博士生、Meta 研究員 Jack Morris 決定自己動手填補這一空白。

他昨天在 ?? 上表示已經搞清楚了如何撤銷 gpt-oss 模型的強化學習,讓其回退成基礎模型。他還宣布將在今天發布他得到的基礎模型。

圖片

就在剛剛,他兌現了自己的承諾,發布了 gpt-oss-20b-base。

圖片

模型地址:https://huggingface.co/jxm/gpt-oss-20b-base

該模型一發布就獲得了大量好評。

圖片

據介紹,該模型基于 gpt-oss-20b 混合專家模型 —— 使用低秩適應(LoRA)將其微調成了一個基礎模型。

不同于 OpenAI 發布的 gpt-oss 模型,gpt-oss-20b-base 是基礎模型,可用于生成任意文本。也就是說,從效果上看,Morris 逆轉了 gpt-oss-20b 訓練過程中的對齊階段,使得到的模型可以再次生成看起來自然的文本。如下對比所示。

圖片

但也必須指出,正是因為 gpt-oss-20b 的對齊階段被逆轉了,因此這個模型已經不再對齊。也就是說,gpt-oss-20b-base 不僅會毫無顧忌地說臟話,也能幫助策劃非法活動,所以使用要慎重。

圖片

研究者還測試了 gpt-oss-20b-base 的記憶能力。他表示:「我們可以使用來自有版權材料的字符串提示模型,并檢查它的輸出,這樣就能輕松測試 gpt-oss 的記憶能力。」結果,他發現 gpt-oss 記得 6 本被測書籍中的 3 本。他說:「gpt-oss 絕對看過《哈利?波特》。」

圖片

gpt-oss-20b-base 的誕生之路

Jack Morris 也在 ?? 上分享了自己從靈感到煉成 gpt-oss-20b-base 的經歷。

他介紹說自己此前使用的方法是「越獄(jailbreaking)」,但這個思路是錯誤的。于是,他想尋找一個可以誘使模型變回基礎模型的提示詞 —— 但這很難。

圖片

在與 OpenAI 聯合創始人、前 Anthropic 研究者、Thinking Machines 聯合創始人兼首席科學家 John Schulman 一番交流之后,他得到了一個好建議:為什么不將這種「對齊逆轉」定義為優化?

也就是說「可以使用網絡文本的一個子集來搜索最小可能的模型更新,使 gpt-oss 表現為基礎模型」。

這涉及到兩個原理。

原理 1. 低秩性(Low-rankedness)

普遍的觀點是,預訓練是將所有信息存儲在模型權重中,而對齊 / 強化學習只是將輸出分布集中在有利于對話(和推理)的非常狹窄的輸出子集上。如果這是真的,那么 gpt-oss 模型與其原始預訓練模型權重相比,其實只進行了少量更新。

也就是說:在預訓練方向上存在一些足夠低秩的更新,而這些更新就可以「逆轉」后訓練過程。

原理 2:數據不可知性(Data Agnosticism)

此外,需要明確,Morris 想要的是恢復原始模型的能力,而不是繼續對其進行預訓練。這里并不想要模型學習任何新內容,而是希望它重新具備自由的文本生成能力。

所以,只要數據與典型的預訓練類似,使用什么數據都沒關系。Morris 表示選擇 FineWeb 的原因是它的開放度相對較高,加上他已經下載了。他表示只使用了大約 20,000 份文檔。

因此實際上講,他的做法就是將一個非常小的低秩 LoRA 應用于少數幾個線性層,并使用 <bos> ... 形式的數據進行訓練,就像典型的預訓練一樣。

圖片

具體技術上,Morris 表示,gpt-oss-20b-base 是原始 gpt-oss-20b 模型的 LoRA 微調版本。為了確保盡可能低的秩,他僅對第 7、15 和 23 層的 MLP 層進行了微調。至于 LoRA,他使用了 16 的秩,因此總共有 60,162,048 個可訓練參數,占原始模型 20,974,919,232 個參數的 0.3%。他已將所有參數合并回去,因此用戶可以將此模型視為完全微調的模型 —— 這使得它在大多數用例中都更有用。

該模型以 2e-6 的學習率和 16 的批次大小在 FineWeb 數據集中的樣本上進行了 1500 步微調。其最大序列長度為 8192。

那么,正如前 OpenAI 政策研究者 Miles Brundage 問道的那樣:「有什么證據表明這是在掘出下面的基礎模型,而不是教導一個已經蒸餾過的 / 無基礎的模型像基礎模型一樣運作?」

圖片

Morris 解釋說:「理論上講,因為這個更新的秩很低。而從實踐上看,是因為生成結果與訓練數據無關。例如,我沒有訓練模型輸出《哈利?波特》,但它卻不知怎的知道其內容。」

未來,Morris 表示還會更徹底地檢查 gpt-oss-20b-base 記憶的內容,并會試試逆轉 gpt-oss-120b,另外他還將嘗試指令微調以及與 GPT-2 和 GPT-3 進行比較。

圖片

對于該項目你怎么看?會嘗試這個模型嗎?

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-08-07 14:05:40

OpenAI大模型開源

2025-08-19 08:40:00

AI技術模型

2025-08-08 04:11:00

GPT-OSS大模型算法

2017-08-17 09:15:23

強化學習KerasOpenAI

2025-08-18 09:15:00

2025-08-15 08:17:41

2025-08-29 05:00:00

2017-08-22 15:56:49

神經網絡強化學習DQN

2025-08-06 14:09:40

模型OpenAIgpt-oss

2025-08-07 09:05:45

2024-01-26 08:31:49

2023-01-31 10:13:29

AI模型

2017-03-28 10:15:07

2025-06-05 08:40:00

2025-08-20 00:00:00

X-Omni圖像生成模型GPT-4o

2023-08-28 06:52:29

2024-01-29 00:05:00

OpenAI嵌入機器學習

2020-11-16 08:54:05

Google 開源技術

2025-06-11 08:54:52

2024-09-13 06:32:25

點贊
收藏

51CTO技術棧公眾號

91免费版在线| 亚洲加勒比久久88色综合| 黑人另类av| 欧美午夜在线播放| 在线视频欧美精品| 18禁男女爽爽爽午夜网站免费 | 免费a级人成a大片在线观看| 91免费看`日韩一区二区| 国产一区不卡在线观看| 国产精品99久久免费观看| 精品va天堂亚洲国产| 在线播放中文字幕| 2020国产精品| 男人草女人视频| 香蕉久久久久久久av网站| 国产精品视频久久久久| 国产精品对白| 久久精品国产成人精品| av漫画网站在线观看| 欧美日韩在线三级| 在线看视频你懂得| 亚洲视频 欧洲视频| www在线观看免费| 麻豆国产一区二区| 国产视频精品网| 久久久精品久久久久久96| 97成人精品区在线播放| 亚洲图片小说区| 亚洲视频在线视频| 中老年在线免费视频| 欧美大胆人体bbbb| 午夜伦理在线| 欧美日韩在线电影| 国产视频二区在线观看| 色先锋资源久久综合| 樱桃视频免费看| 亚洲一区二区精品视频| 91在线网站| 亚洲一区二区三区自拍| 免费av播放| 精品久久久久久久久中文字幕| 中文日本高清免费| 亚洲第一福利一区| 久久综合色播| 精品欧美激情精品一区| 深夜福利在线看| 欧美性视频一区二区三区| 国产69精品久久app免费版| 欧美网站在线观看| 成人不用播放器| 日韩欧美国产综合在线一区二区三区| 成人看片免费| 欧美xxx久久| 国产极品人妖在线观看| 欧美丰满熟妇bbbbbb百度| 亚洲一区二区三区四区在线| 最新久久zyz资源站| 九一国产精品视频| 岛国精品在线观看| 精品少妇一区二区三区在线| jizz一区二区| 青青在线视频免费| 中文字幕中文在线不卡住| 男女午夜网站| 亚洲va国产天堂va久久en| 玖草视频在线| 在线视频你懂得一区| 黄色大片在线播放| 日韩国产精品亚洲а∨天堂免| 天堂av在线网| 欧美区在线播放| 欧美午夜精彩| 黑人巨大精品欧美一区二区小视频| 久久不射2019中文字幕| 国产一级片91| 久久你懂得1024| 九色中文视频| 欧美片网站yy| 国产亚洲一区二区手机在线观看| 欧美老女人在线视频| 成人情趣视频| 色姑娘综合网| 色吧亚洲视频| 99av国产精品欲麻豆| 人人妻人人澡人人爽精品欧美一区| 成人免费视频视频在线观看免费| 亚洲五月天综合| 天天操天天干天天综合网| 欧美xxx黑人xxx水蜜桃| 不卡毛片在线看| 久久高清免费| 在线无限看免费粉色视频| 国产精品久久久久精k8 | 亚州av中文字幕在线免费观看| 欧美亚男人的天堂| av在线一区不卡| 国产免费观看久久黄| 国内精品视频666| 橘梨纱av一区二区三区在线观看| 91麻豆精品国产91久久久久| 2019中文亚洲字幕| 懂色一区二区三区av片| 久久久三级国产网站| 自拍偷拍亚洲在线| 91精品国产手机| 日韩精品一区二区三区久久| 欧美成人剧情片在线观看| 日韩精品在线视频| 色999日韩欧美国产| 国产精品久久777777毛茸茸| 国产不卡一区二区在线观看 | 国产免费久久精品| 久久天天躁夜夜躁狠狠躁2022| 欧美精品免费在线观看| 亚洲国产va精品久久久不卡综合| 精品一区二区成人精品| 亚洲在线久久| 日本黄色成人| 天堂av电影在线观看| 国产精品日韩欧美一区二区三区 | 亚洲人妖av一区二区| 国产高清精品网站| 三级视频在线| 99久久精品免费看国产一区二区三区| 久久蜜桃av一区精品变态类天堂 | 亚洲第一页中文字幕| 久久精品一区蜜桃臀影院| 中文字幕中文在线不卡住| 精品69视频一区二区三区Q| 国产女主播在线写真| 欧美国产亚洲视频| 奇米影视亚洲| 免费yellow网站| 亚洲欧美激情一区| 狠狠色狠狠色综合日日五| 成人成人成人在线视频| 国内精品自线一区二区三区视频| 亚洲性人人天天夜夜摸| 久久免费大视频| 国产高清一区日本| 国产一区二区三区自拍| 伊人久久噜噜噜躁狠狠躁| 日韩毛片网站| 天堂久久av| 加勒比久久高清| 秋霞蜜臀av久久电影网免费 | 日韩电影一二三区| 久久久xxx| 欧美影院三区| 欧美黑人巨大xxxxx| 青青草视频在线观看| 国产a级一级片| 日韩精品久久一区| 欧美黄色直播| 波多野结衣精品久久| 国产精品一区二区三区久久| 国产精品678| 欧美又大又粗又长| 日韩女优在线播放| xxx成人少妇69| 性久久久久久久| 暴力调教一区二区三区| 国产精品视频黄色| 国产香蕉精品视频一区二区三区| 久久国产福利国产秒拍| av综合电影网站| 人人妻人人澡人人爽欧美一区双 | 每日在线更新av| 久久影视电视剧免费网站清宫辞电视| 久久奇米777| 麻豆成人入口| 夜色福利刺激| 亚洲最大福利视频网| 欧美日韩国产另类一区| 日韩高清不卡一区| 四虎影视在线观看2413| 第九色区av在线| 亚洲免费精品视频| 亚欧无线一线二线三线区别| 国产精品99久久99久久久二8| 久久久黄色av| 久久国产精彩视频| 国产精品伦一区二区| 男女猛烈激情xx00免费视频| 99三级在线| 成人福利网站在线观看| 国产精品裸体一区二区三区| 久久精品免费一区二区| 欧美在线观看在线观看| 日本久久伊人| 久久99久久99小草精品免视看| 亚洲性受xxx喷奶水| 91视频国产一区| 麻豆一区二区三区在线观看| 国产高清美女一级毛片久久| 精品国产aⅴ| 91色视频在线| 中日韩美女免费视频网站在线观看| 色综合电影网| 国产伦理精品|