国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

夠快!爆火的ChatGPT等價開源項目來了,網友:我擔心跑不起來

人工智能
最近一段時間,由 OpenAI 開發的 AI 聊天機器人程序 ChatGPT 橫掃各大 AI 社區,大家對它的熱情只增不減,不斷挖掘其潛力。

?最近一段時間,由 OpenAI 開發的 AI 聊天機器人程序 ChatGPT 橫掃各大 AI 社區,大家對它的熱情只增不減,不斷挖掘其潛力。

有些研究者坐不住了,開始琢磨怎樣才能開發個等同于 ChatGPT 的開源軟件。還沒有行動的小伙伴這次參考示例來了,下面我們將要介紹的這個項目(PaLM + RLHF)就實現了這樣的功能。

圖片

項目地址:https://github.com/lucidrains/PaLM-rlhf-pytorch

該項目是在 PaLM 架構之上實施 RLHF(人類反饋強化學習)。基本上等同于 ChatGPT,區別是使用了 PaLM。PaLM 是在谷歌的通用 AI 架構「Pathways」上訓練而成的具有 5400 億參數的大型語言模型。而 RLHF,是 ChatGPT 在 GPT 3.5 系列模型的基礎上,引入「人工標注數據 + 強化學習」(RLHF)來不斷微調預訓練語言模型,旨在讓大型語言模型(LLM)學會理解人類的命令,并學會根據給定的 prompt 給出最優的答案。

想要了解 RLHF 更多內容,可以參考:https://huggingface.co/blog/rlhf

正如網友所說的:「在 AI 領域中,每有一次專項突破,開發者們很快就會復現出一個開源版本。」

圖片

不過該項目目前只包含訓練架構和代碼,沒有預先訓練好的權重。在使用說明上,文檔也顯示必須先要訓練 PaLM。

對此也有網友表示擔心,表示:這不是一個開箱即用的項目,還只是一個架構,就像 shell 一樣,需要昂貴的開銷才能訓練完成,沒有機構能夠像谷歌那樣訓練 PaLM。

圖片

還有網友表示:「沒有預訓練權重是非常糟糕的,官方至少需要釋放 50% 的稀疏權重,剩下的讓開發者自己訓練,才是最好的選擇。」

圖片

不過也有網友表示自己會去嘗試:

圖片

下面我們來看看這個項目是如何運行的。

安裝

$ pip install palm-rlhf-pytorch

用法

首先訓練 PaLM,就像任何其他自回歸 transformer 一樣。

import torch
from palm_rlhf_pytorch import PaLM
palm = PaLM(
num_tokens = 20000,
dim = 512,
depth = 12
).cuda()
seq = torch.randint(0, 20000, (1, 2048)).cuda()
loss = palm(seq, return_loss = True)loss.backward()
# after much training, you can now generate sequences
generated = palm.generate(2048) # (1, 2048)

接著使用精選的人類反饋來訓練獎勵模型。在原始論文中,在沒有出現過擬合的情況下,無法從預訓練 transformer 中獲得微調的獎勵模型。項目作者則提供了使用 LoRA 進行微調的選項。

import torch
from palm_rlhf_pytorch import PaLM, RewardModel
palm = PaLM(
num_tokens = 20000,
dim = 512,
depth = 12,
causal = False
)
reward_model = RewardModel(
palm,
num_binned_output = 5 # say rating from 1 to 5
).cuda()
# mock data
seq = torch.randint(0, 20000, (1, 1024)).cuda()prompt_mask = torch.zeros(1, 1024).bool().cuda() # which part of the sequence is prompt, which part is response
labels = torch.randint(0, 5, (1,)).cuda()
# train
loss = reward_model(seq, prompt_mask = prompt_mask, labels = labels)loss.backward()
# after much training
reward = reward_model(seq, prompt_mask = prompt_mask)

最后將 transformer 和獎勵模型傳遞給 RLHFTrainer。

import torch
from palm_rlhf_pytorch import PaLM, RewardModel, RLHFTrainer
# load your pretrained palm
palm = PaLM(
num_tokens = 20000,
dim = 512,
depth = 12
).cuda()
palm.load('./path/to/pretrained/palm.pt')
# load your pretrained reward model
reward_model = RewardModel(
palm,
num_binned_output = 5
).cuda()
reward_model.load('./path/to/pretrained/reward_model.pt')
# ready your list of prompts for reinforcement learning
prompts = torch.randint(0, 256, (50000, 512)).cuda() # 50k prompts
# pass it all to the trainer and train
trainer = RLHFTrainer(
palm = palm,
reward_model = reward_model,
prompt_token_ids = prompts
)
trainer.train(num_episodes = 50000)
# then, if it succeeded...
# generate say 10 samples and use the reward model to return the best one
answer = trainer.generate(2048, prompt = prompts[0], num_samples = 10) # (<= 2048,)
責任編輯:趙寧寧 來源: 機器之心
相關推薦

2023-05-25 13:59:12

ChatGPT模型

2022-12-05 15:03:01

2023-01-31 07:42:29

代碼JDKMaven

2011-09-06 09:37:04

MTK平臺

2024-02-23 09:02:21

前端開源項目

2023-04-03 09:56:22

模型系統

2015-05-07 10:47:16

安卓市場

2019-08-22 17:22:41

人工智能機器學習技術

2023-02-09 12:31:20

2023-07-04 10:18:25

開源模型

2023-03-02 11:44:08

AI技術

2013-09-12 15:51:56

2023-03-08 13:06:03

2022-12-12 09:01:03

2023-05-11 15:27:06

2024-10-29 15:29:06

2022-12-06 13:56:03

AI模型

2024-03-01 17:01:15

GraphQL后端

2014-06-30 11:30:21

2025-01-21 12:44:50

點贊
收藏

51CTO技術棧公眾號

屁屁影院ccyy国产第一页| 成人在线观看一区| 国模吧一区二区| 尤物yw午夜国产精品视频明星| 色美美综合视频| 国产三级精品视频| 欧美日韩在线播放三区四区| 欧美精品乱码久久久久久 | 亚洲综合成人在线视频| 日韩女同互慰一区二区| **欧美日韩在线| 欧美视频一区二区三区四区| 日本一二区视频| 亚洲精品中文字幕乱码三区| 91黑丝在线| 亚洲欧美日韩在线不卡| 激情丁香在线| 亚洲一区二区五区| 亚洲天堂2017| 91高清视频免费看| 中文日本在线观看| 欧美久久一二区| 毛片网站在线看| 亚洲欧美资源在线| 992tv国产精品成人影院| 国产一区二区三区在线观看网站| 欧美1级2级| www.日韩不卡电影av| 国产欧美自拍| 欧美精品免费在线观看| 青青操综合网| 亚洲一区二区日本| 水蜜桃久久夜色精品一区的特点 | 亚洲午夜视频在线观看| 亚州av中文字幕在线免费观看| 一本到不卡免费一区二区| 成人在线播放| 色偷偷88888欧美精品久久久| 7777精品| 成人乱色短篇合集| 亚洲欧美视频| 国产精品久久国产| 中文字幕佐山爱一区二区免费| 中文字幕在线中文字幕二区| 欧美日韩国产一级片| av第一福利在线导航| 色七七影院综合| 狠狠做六月爱婷婷综合aⅴ| 国产精品亚洲不卡a| 开心九九激情九九欧美日韩精美视频电影| 免费高清一区二区三区| 亚洲免费av网站| 久操视频在线| 欧美成人第一页| 91精品国产乱码久久久久久 | 亚洲精品偷拍| 欧美日韩激情四射| 一区二区三区在线播放| 欧洲美女少妇精品| 最新的欧美黄色| 日本午夜一区| 吴梦梦av在线| 亚洲一区自拍偷拍| 在线中文字幕播放| 国产精品mp4| 经典三级在线一区| 中出福利视频| 在线视频亚洲欧美| 国内久久精品| youjizzxxxx18| 日韩免费一区二区三区在线播放| 亚洲**毛片| 日韩少妇中文字幕| 亚洲另类在线视频| 国内老司机av在线| 国产精品久久二区| 国产在线精品免费| 国产传媒视频在线观看| 亚洲免费av网址| 亚洲天天影视网| 亚洲 中文字幕 日韩 无码| 欧美亚洲综合久久| jizz18欧美18| 日本午夜精品一区二区三区| 亚洲婷婷综合久久一本伊一区| 九色porny丨国产首页在线| 国产精品一二区| www亚洲一区| 丁香花在线电影| 成人激情视频小说免费下载| 91麻豆精品视频| 日本色护士高潮视频在线观看| 国产精品99久久久久久久久| 国内精品免费**视频| 欧美日韩激情视频一区二区三区| 欧美成人精品在线| 精品在线播放免费| 国产高清在线| 国产精品成人播放| 国产日韩精品一区二区三区在线| 98色花堂精品视频在线观看 | 国产一区二区三区网| 黄色一级片播放| 日韩经典中文字幕在线观看| 国模吧视频一区| 免费黄色av电影| 欧美日韩成人在线观看| 激情欧美一区二区三区在线观看| a天堂中文在线| 国产日韩欧美在线| 亚洲欧美日韩国产一区二区三区| 欧美91在线|欧美| 亚洲欧洲久久| 91麻豆精品国产91久久久久久| 91精品国产自产在线观看永久∴| 国产真实生活伦对白| 欧美老少配视频| 99精品桃花视频在线观看| 成人免费看黄| 欧洲精品在线播放| 中文字幕国产精品久久| 成人免费视频视频| 国内自拍亚洲| 成熟了的熟妇毛茸茸| 色婷婷av一区二区三区在线观看| 国产福利电影一区二区三区| jizz内谢中国亚洲jizz| 国产精品夜夜夜爽张柏芝| 日韩女优视频免费观看| 日韩电影在线观看网站| a毛片在线观看| 欧美一区二区三区电影在线观看| 欧美曰成人黄网| 亚洲精品免费观看| 七七久久电影网| 亚洲午夜激情| 亚洲香蕉伊综合在人在线视看| 国产盗摄一区二区三区| 成人美女大片| 国产综合av在线| 另类专区欧美制服同性| 91麻豆高清视频| 真实原创一区二区影院| 亚洲美女欧洲| 免费国产一区| 精品亚洲一区二区三区四区五区| 国产一区二区在线免费观看| 国产极品嫩模在线观看91精品| 99精品视频在线看| 日本精品一区二区三区在线| 午夜伦欧美伦电影理论片| 亚洲无毛电影| h片在线观看| 欧美视频在线播放一区| 欧美与欧洲交xxxx免费观看| 亚洲福利国产精品| 久久成人精品| 日韩精品一区二区三区av| 国产性生交xxxxx免费| 国产精品夜色7777狼人| 欧美日韩dvd在线观看| 国内精品写真在线观看| 超碰精品在线观看| 日本一区二区三区在线观看视频| 久久av一区二区三区漫画| 亚洲人成网在线播放| 亚洲国产精品国自产拍av| 天天操夜夜操国产精品| 爱啪啪综合导航| 亚洲这里只有精品| 91久久国产综合久久蜜月精品 | 国产传媒日韩欧美成人| а√中文在线天堂精品| 天堂中文在线资| 中文字幕免费在线不卡| 欧美精品久久久久久久久| 欧美日韩亚洲一区二区| 久久久蜜桃一区二区人| 国产一区 二区| 国产三级视频在线看| 99热久久这里只有精品| 国产精品入口尤物| 精品第一国产综合精品aⅴ| 欧美激情一区在线观看| 制服诱惑一区二区| 日韩精品一级| 国产网站在线免费观看| 国产原创精品在线| 日韩免费毛片| 国产精品福利久久久| 亚洲美女www午夜| 亚洲一区二区免费视频| 国产另类ts人妖一区二区| 欧美gayvideo| 综合久久av| 国产天堂在线播放视频| 三上悠亚在线观看| 国产精品333| 欧美日韩一区二区三区在线观看免| 97人人做人人爱|