国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

字節(jié)Seed最新版原生智能體來了!一個模型搞定手機/電腦/瀏覽器自主操作

人工智能 新聞
這就是Seed最新發(fā)布的智能體UI-TARS-2,它不止采用了All in one這樣的原生設計,而且表現(xiàn)更是優(yōu)于Claude和OpenAI Agent等競爭對手。

AI自己玩手機、玩電腦、操作網(wǎng)頁瀏覽器……背后還只靠一個模型。

卷王字節(jié)Seed又把智能體帶到了一個全新level~

比如任務是醬紫的:

編寫一個可以轉換重量單位的函數(shù)。如果原始單位是千克,目標單位是克,并且要轉換的值是Mathilde Seigner(法國知名演員)被提名凱撒獎的次數(shù)加1,最終結果會是多少?

而通過一系列操作,Agent僅用時35s就得出了答案為4000克。

這就是Seed最新發(fā)布的智能體UI-TARS-2,它不止采用了All in one這樣的原生設計,而且表現(xiàn)更是優(yōu)于Claude和OpenAI Agent等競爭對手。

來看團隊成員曬出的成績單,不管是操作電腦/手機,還是使用瀏覽器、玩15款小游戲,其絲滑程度和完成率現(xiàn)在已經(jīng)超越一眾競爭對手,并進一步接近人類水平。

而且這里還透露了UI-TARS-2背后的關鍵秘訣:

一個通過多輪強化學習訓練的原生GUI智能體

劃重點,多輪強化學習。依靠這一技巧,UI-TARS-2核心解決了“讓AI自主操作圖形界面(GUI)”的四大難題:

  • 數(shù)據(jù)稀缺:以往方法需要上百萬級高質量標注數(shù)據(jù),成本極高,擴展困難。
  • 環(huán)境割裂:不同任務(電腦、手機、網(wǎng)頁、終端、游戲)通常要在不同框架里訓練,無法統(tǒng)一。
  • 能力單一:大多數(shù)智能體只能做GUI點擊或終端命令,難以完成真實復雜任務。
  • 訓練不穩(wěn)定:強化學習在GUI任務上容易出現(xiàn)獎勵稀疏、策略崩潰,模型很難可靠收斂。

且看字節(jié)團隊如何見招拆招——

針對四大難題打出“組合拳”

先來看UI-TARS-2的整體設計思路和框架。

其核心目標為:構建一個真正原生、通用、跨平臺的GUI智能體,能在電腦、手機、網(wǎng)頁、終端,甚至游戲里自主完成復雜任務。

為此,UI-TARS-2架構主要包含下面這幾個部分:

1、統(tǒng)一的Agent架構:以大語言模型為核心決策器(Planner),將自然語言指令→GUI/終端/工具操作,全部納入一個通用執(zhí)行循環(huán),同時支持GUI點擊、鍵盤輸入、終端命令、API調用等多種操作流。

2、多模態(tài)感知與環(huán)境交互:輸入端整合屏幕截圖(視覺)+文本上下文+歷史操作軌跡,輸出端可以是點擊坐標、拖拽動作、命令行、甚至API請求,形成感知—決策—執(zhí)行—反饋的完整閉環(huán)。

3、多輪強化學習:不依賴人工標注,而是通過環(huán)境反饋獎勵優(yōu)化策略,同時采用模擬環(huán)境(sandbox)+自動化任務生成,構建出“數(shù)據(jù)飛輪”,讓模型能不斷自我進化。

4、混合操作流(Hybrid Flows):在一次任務軌跡中,智能體可以無縫組合GUI點擊、終端命令和API調用。例如,在網(wǎng)頁上找資料(GUI),處理數(shù)據(jù)(終端),再調用搜索API(工具)。

下面這個讓UI-TARS-2玩游戲的例子,很好地展示了這套框架的具體運作過程:

而基于這套框架,UI-TARS-2逐一解決了智能體自主操作GUI面臨的四大難題。

靠“數(shù)據(jù)飛輪”解決數(shù)據(jù)少的問題

為了打造數(shù)據(jù)飛輪,團隊采用了以下策略:

1、冷啟動:這一階段主要是廣泛收集原始數(shù)據(jù),以及通過合成數(shù)據(jù)和人工標注來構建監(jiān)督微調所需的原始高質量、任務針對性強的數(shù)據(jù)。

2、多輪迭代:有了數(shù)據(jù)之后,先讓模型通過預訓練學習更廣泛的知識(如不同GUI操作流程、任務解決思路等),再使用高質量特定任務數(shù)據(jù)對模型進行優(yōu)化,最后通過強化學習進行端到端優(yōu)化。

在每輪迭代中,團隊會使用拒絕采樣(RFT)或交互標注生成新軌跡,這些軌跡記錄了模型在執(zhí)行任務過程中的推理、動作、環(huán)境狀態(tài)以及反饋等信息,將其按質量篩選后,高質量的進微調數(shù)據(jù)集,低質量的進預訓練數(shù)據(jù)集。

3、循環(huán)增強:然后模型用更新后的數(shù)據(jù)集重新訓練,能力提升后又能生成更好的軌跡,形成“模型變好→數(shù)據(jù)變好→模型更好”的循環(huán),不斷解決數(shù)據(jù)稀缺問題。

用“多輪強化學習”讓AI操作更穩(wěn)

針對傳統(tǒng)強化學習在GUI長周期任務中“獎勵稀疏、優(yōu)化不穩(wěn)定、信用分配難” 的問題,團隊從任務設計、獎勵機制、訓練流程三方面進行了優(yōu)化。

如何進行任務獎勵設計?團隊先對任務類型進行拆分:

對可驗證任務(如游戲得分、網(wǎng)頁信息檢索),用明確信號(成功/失敗、LLM對比答案打分)當獎勵;

對模糊任務(如復雜GUI操作),訓練UI-TARS-2自身作為“獎勵模型”,根據(jù)軌跡和截圖輸出任務成功分數(shù),保證獎勵可靠。

確定了這一模式后,團隊摒棄“等所有任務完成再訓練”的模式,轉而采用“異步rollout”——

把模型推理環(huán)節(jié)單獨拿出來,和實際執(zhí)行過程分離,互不干擾;同時只要湊夠最少需要的軌跡數(shù)量,就立刻用這些完成的軌跡開始訓練,那些未完成的就留到下一輪。

等到訓練時,團隊還在PPO算法上進行了3處優(yōu)化,從而讓模型操作更穩(wěn),包括用“解耦GAE”避免長序列價值估計偏差、用“不對稱裁剪”鼓勵模型嘗試那些看似不常用、但可能有效的操作等。

打造“混合操作環(huán)境”突破界面限制

為解決純GUI操作(僅鼠標/鍵盤)無法應對數(shù)據(jù)處理、軟件開發(fā)等復雜工作流的問題,團隊構建了“GUI+多工具”融合的交互環(huán)境:

不僅整合多操作流,比如在同一環(huán)境里,智能體既能做GUI基礎操作(點擊、輸入、滾動網(wǎng)頁/APP),又能直接調用終端命令(如用Bash處理文件)、調用API,無需切換上下文。

還為其適配多場景載體,比如在云虛擬機里,內置文件系統(tǒng)、遠程VS Code、Jupyter等工具;在瀏覽器沙箱里,也能關聯(lián)終端功能,讓操作覆蓋“桌面-移動-游戲” 全場景。

建“統(tǒng)一沙盒平臺”支撐大規(guī)模訓練

針對傳統(tǒng)環(huán)境“難復現(xiàn)、易崩潰、吞吐量低”的工程瓶頸,團隊打造了兼容多載體的統(tǒng)一沙盒,保障百萬級交互訓練需求。

簡單來說,這就是一個虛擬的模型訓練場,支持智能體在里面大規(guī)模練習、試錯和進化。

以下為一個瀏覽器沙盒的示意圖,據(jù)此也能看到沙盒的大致運作方式:

優(yōu)于Claude和OpenAI Agent等競爭對手

那么,UI-TARS-2的實際表現(xiàn)如何呢?

根據(jù)介紹,UI-TARS-2是團隊基于Seed-thinking-1.6(總參數(shù)230B,含532M視覺編碼器 + 23B激活參數(shù)),經(jīng)過多輪迭代訓練而成。

在多個權威GUI測試里,比如OSWorld(369個Windows/Ubuntu/macOS任務)、WindowsAgentArena(150個 Windows任務)、TerminalBench(命令行任務)等,它的得分都比Claude、OpenAI的同類模型更高。

換句話說,在電腦、手機、瀏覽器操作上,UI-TARS-2的表現(xiàn)明顯更好。

而且在15款小游戲(比如2048、拼圖、迷宮)里,它的平均得分差不多是人類水平的60%,比OpenAI、Claude的游戲AI強不少,有的游戲(如“Shapes”)甚至比人玩得還好。

即使面對一些更復雜的游戲測試(LMGame-Bench),它也能和o3打得有來有回。

當然了,它不光會點界面、玩游戲,還能干“查資料”、“寫代碼修bug” 這樣的活兒,而且成績比只靠界面操作強很多。

總之,UI-TARS-2無疑驗證了多輪強化學習在智能體進化上的有效性。

論文:https://arxiv.org/abs/2509.02544

demo:https://seed-tars.com/showcase/ui-tars-2/

責任編輯:張燕妮 來源: 量子位
相關推薦

2009-12-16 10:04:51

Chrome瀏覽器漏洞

2009-05-27 08:56:49

IQ瀏覽器瀏覽器新功能

2009-04-13 08:43:01

微軟IE8 瀏覽器

2012-07-03 09:22:09

2012-04-01 10:08:28

瀏覽器評測

2009-05-30 10:09:03

Chrome瀏覽器Google

2015-02-05 15:58:06

2013-10-08 14:52:56

瀏覽器性能測試

2009-05-26 09:25:55

2021-11-10 19:00:47

微軟Edge Canary瀏覽器

2017-03-22 20:30:40

2021-03-08 05:42:26

瀏覽器FirefoxVIA瀏覽器

2025-01-24 08:53:46

2012-06-04 10:04:26

2025-11-06 01:44:00

2009-05-27 08:54:15

瀏覽器平臺Chrome

2017-12-14 15:45:02

2010-12-21 10:11:35

手機瀏覽器

2011-03-23 10:02:24

Opera Mini Opera Mobil

2011-11-03 11:02:00

瀏覽器排行榜
點贊
收藏

51CTO技術棧公眾號

欧美国产日韩电影| 日韩三级视频在线看| 黄色网页免费在线观看| 久久97超碰国产精品超碰| 日本一区二区三区免费观看| 亚洲免费激情| 中日韩在线视频| 成人午夜视频网站| 色悠悠久久综合网| 午夜婷婷国产麻豆精品| 午夜看片在线免费| 亚洲精品资源美女情侣酒店| 成人97精品毛片免费看| 日本亚洲欧洲色α| 亚洲午夜视频| 青青草免费在线视频观看| 久久久久久久电影| 日本在线三级| 日韩一二在线观看| 国产成人精品一区二区三区在线| 欧美激情第6页| 久久久综合色| 亚洲欧洲日韩综合二区| 91在线免费视频观看| 麻豆传媒在线播放| 日韩免费观看高清完整版 | 欧美一区午夜视频在线观看| 国产日韩另类视频一区| 97精品免费视频| 亚洲美女黄色| 一本久道中文无码字幕av| 日本韩国精品在线| 99视频有精品高清视频| 99久久精品免费看国产四区| 国产99久久久精品| 日韩精品视频在线观看一区二区三区| 亚洲免费精彩视频| 热久久天天拍国产| www.日本在线视频| 狠狠做深爱婷婷久久综合一区| 僵尸再翻生在线观看免费国语| 日本国产欧美一区二区三区| 日本最新不卡在线| 视频免费观看| 伊人久久免费视频| 伊人色**天天综合婷婷| 无码专区aaaaaa免费视频| 在线亚洲高清视频| 亚洲1区在线| 亚洲国产日韩美| 欧美日韩免费一区| 欧美激情精品| 亚洲黄色成人久久久| 香港成人在线视频| 久久99成人| 一区二区免费在线视频| 日韩欧美在线视频| 成人午夜网址| www.亚洲成人网| 欧美裸体bbwbbwbbw| 成人h动漫免费观看网站| 无码免费一区二区三区免费播放 | 成人亚洲精品久久久久软件| 蜜桃tv在线播放| 久久久精品免费视频| 奇米影视一区二区三区| 亚洲s色大片在线观看| 久久久久久久久久久亚洲| 激情都市一区二区| 不卡在线视频| 国产精品无码专区在线观看| 国产片一区二区| 怡红院成人在线| 日韩欧美在线电影| 欧美亚洲一区二区三区四区| 国产免费久久| 免费一级电影| 欧美华人在线视频| 波多野结衣亚洲一区| а√天堂中文资源在线bt| 精品91免费| 欧美视频一区二区三区四区 | 色狠狠色狠狠综合| 九一亚洲精品| 日韩经典第一页| 久久国产精品区| 在线看片你懂的| 亚洲视频专区在线| 日本中文字幕一区二区视频| 欧美亚洲系列| 亚洲最大福利视频网| 午夜精品久久久久久久| 黄色av电影在线播放| 成人在线免费观看91| 亚洲欧美第一页| 久久福利影视| 1024国产在线| 91久久久在线| 欧美性猛交xxxx偷拍洗澡| 欧美一级精品| 国产三级视频| 91国产在线精品| 国产精品美女久久久久aⅴ国产馆| 日韩成人亚洲| 九色在线视频观看| 九九综合九九综合| 国产精品色一区二区三区| 香蕉免费一区二区三区在线观看| 黑鬼大战白妞高潮喷白浆| 蜜月aⅴ免费一区二区三区| 妞干网免费在线视频| 免费在线观看的毛片| 久久久最新网址| 亚洲成人免费在线观看| 婷婷成人基地| 欧美成人精品三级在线观看| 久久国产一区| 国产一区二区三区福利| 国产精品一区免费在线| jizz亚洲女人高潮大叫| 午夜cr在线观看高清在线视频完整版| 国产一区国产精品| 最新国产精品亚洲| 欧美中文字幕一二三区视频| 丰满岳乱妇一区二区三区| 精品国产不卡| 91精品一区| 成年人在线网站| 秋霞av在线| av三级影院| 日韩欧美一区三区| 日本午夜精品电影| 免费精品视频一区二区三区| 国产一区不卡在线观看| 国模gogo一区二区大胆私拍| 日韩一区二区精品视频| 欧美日本不卡视频| 欧美成va人片在线观看| 国产麻豆91精品| 成人豆花视频| 韩国成人动漫| www日韩视频| 欧美综合第一页| 日韩色av导航| 欧美乱妇高清无乱码| 蜜桃成人免费视频| 日本在线视频网| 国产精品家庭影院| 中文字幕一区二区三区在线视频| 成年人国产在线观看| 18视频在线观看娇喘| 成人黄色免费| 啊v视频在线一区二区三区| 国产精品免费看片| 国产一区二区三区福利| 国产欧美日韩精品一区二区免费 | 日韩成人在线观看视频| av免费看大片| 在线一区高清| 国产精品91久久久| 日韩精品视频在线| 亚洲一二三四久久| 国产99精品在线观看| 欧美精品一级| 伊人久久影院| 国产精品—色呦呦| 香蕉97视频观看在线观看| 黄色三级中文字幕| 亚洲在线www| 欧美成人中文字幕在线| 欧美一区二区播放| 亚洲成人福利片| 国产亚洲福利社区一区| 日韩av一二三| 亚洲自拍偷拍网| 蜜臀av一区| 亚洲电影有码| 欧美午夜大胆人体| 国产最新视频在线| 97国产视频| 97av视频在线观看| 日本不卡免费新一二三区| 国产精品一区av| 久久久久久国产三级电影| 日韩av在线天堂网| 8x福利精品第一导航| 亚洲国产cao| 国产精品久久久久久久久动漫| 久久69国产一区二区蜜臀| 国产一区亚洲| 日韩精品免费一区二区三区| theporn国产在线精品| 成人国产激情在线| 综合日韩av| 538在线精品| 日韩成人伦理| 成人日韩欧美| 欧美成人高清在线| 九七久久人人| gogogogo高清视频在线|