国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

字節跳動開源多模態AI Agent—UI-TARS-1.5

發布于 2025-4-23 11:55
瀏覽
0收藏

字節跳動開源了多模態AI Agent UI-TARS的最新1.5版本。


與上一代相比,1.5版本在計算機使用、瀏覽器使用和手機使用等基準測試中均表現非常出色。


在計算機使用方面,OSworld測試得分為42.5,高于OpenAI CUA的36.4、Claude 3.7的28以及之前的最高水平38.1(200步);Windows Agent Arena(50步)得分為42.1,遠超之前的29.8。


瀏覽器使用方面,WebVoyager得分為84.8,接近OpenAI CUA和之前最高水平的87,Online-Mind2web得75.8,優于OpenAI CUA的71、Claude 3.7的62.9和之前的71。手機使用方面,Android World得64.2,高于之前的59.5。

字節跳動開源多模態AI Agent—UI-TARS-1.5-AI.x社區

開源地址:??https://github.com/bytedance/UI-TARS??

笑臉:??https://huggingface.co/ByteDance-Seed/UI-TARS-1.5-7B??


而在 GUI 定位方面,UI-TARS-1.5 相比之前的最高水平有顯著提升,尤其在具有挑戰性的 ScreenSpotPro 基準測試中表現突出。


ScreenSpot-V2測試得 94.2,高于 OpenAI CUA 的 87.9、Claude 3.7 的 87.6 和之前的 91.6;ScreenSpotPro 為61.6,遠超 OpenAI CUA的23.4、Claude 3.7的27.7和之前的43.6。


在推理時間方面,隨著推理時間的延長,UI-TARS-1.5 呈現出良好的擴展趨勢。盡管UI-TARS-1.5 并非專為Deep-research任務設計,例如,在互聯網上進行多步驟信息搜索研究,但在兩個近期具有挑戰性的網頁瀏覽基準測試中表現出了強大的通用性。


在 SimpleQA 測試中,UI-TARS-1.5為83.8,優于GPT-4.5的60,略低于 帶有搜索功能GPT-4o 90;BrowseComp為2.3,高于GPT4.5的0.6和GPT-4o的1.9。

字節跳動開源多模態AI Agent—UI-TARS-1.5-AI.x社區

游戲領域是評估多模態智能體復雜推理、決策和適應能力的關鍵測試環境,游戲需要直觀的常識推理和戰略遠見,是測試和展示多模態智能體高級認知能力的理想基準。


為評估 UI-TARS-1.5 的游戲能力,研究人員從poki選取了 14 款不同的游戲,每個模型在每個游戲中最多允許 1000 個交互步驟來生成執行軌跡,并進行多次運行。


結果顯示,UI-TARS-1.5 在這些游戲中均取得了100的成績,而 OpenAI CUA 和 Claude 3.7 在部分游戲中得分為 0 或較低。游戲的長視域特性使其成為評估推理時間可擴展性的理想選擇,UI-TARS-1.5表現出強大的可擴展性和穩定性,隨著交互輪次的增加,仍能保持高性能,展現出其穩健的設計和先進的推理能力。

字節跳動開源多模態AI Agent—UI-TARS-1.5-AI.x社區

UI-TARS-1.5能獲得如此出色的性能,“統一的動作建模”是其關鍵創新之一,將語義上等效的動作標準化,從而實現跨平臺的無縫操作和知識遷移。


傳統的GUI自動化工具往往依賴于特定平臺的API或系統級權限來執行操作,這限制了它們的通用性和可擴展性。而UI-TARS的統一動作建模模塊則摒棄了這種依賴,轉而采用一種更為通用和靈活的方法。


研究人員首先對各種GUI操作進行了深入分析,識別出它們的共性和差異。他們發現,盡管不同平臺的操作在具體實現上可能有所不同,但在語義上往往是等效的。例如,無論是使用鼠標在Windows系統中點擊一個按鈕,還是在移動設備上輕觸一個圖標,其核心目的都是觸發一個特定的功能或事件。

字節跳動開源多模態AI Agent—UI-TARS-1.5-AI.x社區

基于這一觀察,研究人員設計了一個通用的動作空間,將這些操作抽象為一系列基本動作,如“點擊”、“拖動”、“輸入文本”等。這些基本動作在不同平臺上具有相同的語義含義,但可以根據具體平臺的特性進行適當的調整和優化。


此外,研究人員還引入了一種“動作軌跡增強”技術,進一步提升了智能體的多步操作能力。在實際應用中,許多任務需要模型執行一系列連續的操作才能完成。例如,在一個電商平臺上購買商品可能需要用戶瀏覽商品頁面、選擇商品規格、點擊“加入購物車”按鈕、填寫收貨地址等多個步驟。


為了使智能體能夠更好地理解和執行這類多步任務,研究團隊在數據集中添加了大量包含多個連續操作的軌跡樣本。這些樣本不僅記錄了每個操作的具體內容,還反映了操作之間的邏輯順序和依賴關系。通過學習這些軌跡樣本,模型能夠學會如何將一系列抽象動作組合起來,以完成復雜的任務。


本文轉自 AIGC開放社區  ,作者:AIGC開放社區


原文鏈接:??https://mp.weixin.qq.com/s/EAUrcNzx-34vp4dVact2cQ??


收藏
回復
舉報
回復
相關推薦
欧美特黄一区| 免费观看在线色综合| 久久亚洲精品成人| a在线视频v视频| 亚洲国产精品系列| 日本在线视频一区二区| 久久久91精品| 哺乳挤奶一区二区三区免费看| 久久91亚洲人成电影网站| 亚洲日本va午夜在线电影| 日本国产精品视频| 亚洲一区二区| 日韩久久精品一区二区三区| 国产一区二区三区综合| 日韩av综合在线观看| 中文字幕在线不卡一区| 深夜福利视频在线观看| 精品国产乱码91久久久久久网站| 亚洲精品一级二级| 欧美激情极品视频| 91成人超碰| 国产日韩视频在线播放| 国产日韩欧美高清在线| 色老板视频在线观看| 欧美视频一区二区在线观看| 在线天堂新版最新版在线8| 欧美精品在线观看91| 精品国产乱码| 免费一区二区三区| 99精品偷自拍| 满满都是荷尔蒙韩剧在线观看| 在线免费不卡视频| 345成人影院| 欧美有码在线视频| 在线欧美亚洲| 哪个网站能看毛片| 91传媒视频在线播放| 朝桐光一区二区| 国产女同一区二区| 国产美女av一区二区三区| 男女羞羞网站| 日韩欧美一区二区在线视频| theporn国产在线精品| 国产精品毛片va一区二区三区| 国产91在线观看| 亚洲图片123| 亚洲欧美成人精品| 97视频精品| 国产综合中文字幕| 久久人人九九| 国产91精品一区二区| 男人天堂午夜在线| 亚洲小视频在线观看| 国产精品国产一区| av免费观看国产| 91国偷自产一区二区开放时间| 国产精品久久亚洲不卡| 岛国一区二区三区高清视频| 91麻豆123| 色呦呦在线看| 成人国产精品av| 99re这里只有精品视频首页| 欧美成年黄网站色视频| 欧美亚洲午夜视频在线观看| 精品一区二区三区免费视频| 欧美色18zzzzxxxxx| 欧美激情免费观看| 久久99久久精品| 黄视频在线观看免费| 97超级碰在线看视频免费在线看 | 先锋影音成人资源| 亚洲国产日韩一区| 久久久人成影片免费观看| 99蜜桃臀久久久欧美精品网站| 欧美高清视频不卡网| 亚洲精品推荐| av免费播放网址| 日韩av中文字幕在线| 国产精品99一区二区| 国产免费福利网站| 欧美疯狂做受xxxx高潮| 久久精品免费看| 岛国在线视频| 成人在线一区二区| 亚洲美女淫视频| 一区二区三区四区高清视频 | 国产一区二区高清| 97影院手机在线观看| 久久久久亚洲精品国产| 成人a区在线观看| 密臀av在线播放| 日韩精品久久久毛片一区二区| 午夜成人免费视频| 奇米亚洲欧美| av天天在线| 国产91精品青草社区| 久久伊99综合婷婷久久伊| 澳门av一区二区三区| 欧美性受xxxx黑人猛交88| 精品久久国产字幕高潮| 美女黄网久久| 青草青在线视频| 午夜一区二区三区| 日韩一级片网址| 美女国产精品| 欧美寡妇性猛交xxx免费| 欧美一区二区三区在线免费观看 | 日本韩国一区| 成人美女av在线直播| 欧美日韩国产一区在线| 日韩国产在线| 97在线观看免费高清视频| 国产精品久久久久久久久影视| 亚洲免费观看高清在线观看| 欧美亚洲国产日韩| 922tv免费观看在线| 91精品视频在线看| 欧美天天综合网| 久久精品91| 黄色在线观看www| 91黄色在线看| 欧美激情一区二区三区成人| 国产精品妹子av| 欧美一区电影| 川上优的av在线一区二区| 国产亚洲二区| 精品99久久久久久| 国产福利精品导航| 国产精品1区| 特级全黄一级毛片| 含羞草久久爱69一区| 欧美精品一区二区三区视频 | 伊人久久大香线蕉成人综合网| 亚洲国产高清自拍| 成人av电影免费在线播放| 国产一区二区三区视频在线| 国产小黄视频| 91美女高潮出水| 51午夜精品国产| 青青草97国产精品免费观看| 日本精品网站| 国产激情视频网址| 免费试看一区| 日韩有码在线视频| 亚洲国产精品综合小说图片区| 亚洲精品97| 亚洲少妇视频| 国产福利电影网| 欧美日韩国产一二| 日韩网站免费观看高清| 亚洲黄色尤物视频| 国产日韩高清一区二区三区在线| 欧美中文字幕精在线不卡| 亚洲精品视频导航| 91嫩草国产在线观看| 亚洲人在线视频| 亚洲免费在线观看| 欧美aaaaaa午夜精品| 国产精品免费精品自在线观看| 在线播放的av| 国产精品三级一区二区| 国产精品电影网| 日韩毛片在线观看| 亚洲电影一区二区三区| 久久超碰97中文字幕| 欧美日韩在线网站| 中文av在线全新| 中午字幕在线观看| 日本精品福利视频| 亚洲一区中文字幕| 中文字幕亚洲专区| 欧美性xxxxxxxxx| 久久青草欧美一区二区三区| 亚洲精品九九| y111111国产精品久久久| 自由的xxxx在线视频| 国产私人影院| 特大黑人娇小亚洲女mp4| 亚洲a区在线视频| 欧美大成色www永久网站婷| 欧美一区日本一区韩国一区| 综合久久国产九一剧情麻豆| 精一区二区三区| 天天综合亚洲| 中文字幕视频精品一区二区三区| a视频在线播放| 国产国语**毛片高清视频| 日韩精品福利片午夜免费观看| 亚洲一区二区三| 久久免费视频在线观看| 亚洲第一天堂无码专区| 一本大道久久a久久精品综合| 久久久久久久精| 国内精品在线播放| 亚洲大胆视频| 日韩av免费大片| 免费萌白酱国产一区二区三区| 91av亚洲| 黑人精品视频| 99中文字幕一区|