国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

告別海量標注!浙大團隊提出GUI-RCPO,讓GUI定位在無標簽數據上自我進化

人工智能 新聞
研究團隊首先設計了一種無需訓練的test-time scaling方法——GUI-RC,通過利用模型在采樣過程中呈現出來的空間區域一致性提取出模型的共識區域,從而實現更加精準自信的定位。

無需海量數據標注,智能體也能精確識別定位目標元素了!

來自浙大等機構的研究人員提出GUI-RCPO——一種自我監督的強化學習方法,可以讓模型在沒有標注的數據上自主提升GUI grounding(圖形界面定位)能力。

何謂GUI grounding?為什么要提升這項能力?

簡單而言,近年來,以視覺-語言模型為骨架的GUI智能體正在迅猛發展,只需要一句語言指令,它們就能像人一樣手眼協同地操作電腦、手機、網頁等界面。

GUI智能體的一個關鍵能力在于GUI grounding,也就是根據用戶給出的自然語言指令,GUI智能體需要在用戶界面中精確地識別并定位可操作的目標元素。

良好的GUI grounding能力可以使得GUI智能體更好地理解圖形界面,以及完成更加精準地界面交互。

然而,想要訓練這樣一種看似簡單的能力,卻需要大規模高質量的標注數據——當前絕大多數方法動輒需要上百萬級的標注數據,而構建這樣的高質量的標注數據需要大量的人工和時間成本。

而GUI-RCPO正好解決了上述問題,其核心原理如下:

通過創新性地將Test-time Reinforcement Learning的思想遷移到GUI grounding任務上,利用模型在多次采樣之間呈現出來的區域一致性來引導模型在無標簽的數據上進行自我提升。

具體內容如下——

GUI-RC:模型采樣“求同存異”

當模型針對同一指令進行多次預測時,由于坐標空間的連續性和解碼策略帶來的隨機性,模型會產生不同的預測區域。

盡管這些預測區域的范圍可能互不相同,但是它們會存在一定的空間重疊,這種空間重疊實際上蘊含了一種隱式的置信度信號,重疊程度越高潛在地說明了模型對該區域的置信度越高,研究團隊將這種空間重疊定義為模型采樣中的區域一致性

基于這一洞察,研究團隊首先設計了一種基于區域一致性進行空間投票的test-time scaling方法——GUI-RC

首先構建一張與屏幕截圖相同大小的投票網格來記錄模型每次采樣中預測的區域,對于每一個預測結果,將其在網格上對應的區域記上一票,如果模型的預測結果是點坐標,則將其擴展成大小的方框,再投射到網格上。

全部投票結束后,這張網格便記錄了模型在采樣過程中總體上對每一個像素點的置信度,票數越高的區域代表模型對該區域的信心越強。

隨后,提取出網格中票數最高且面積最大的連續區域作為模型采樣中的“共識區域”。

最后,利用這塊共識區域來進行GUI定位,即可在無需訓練的情況下,得到一個更加精確可靠的預測結果。

GUI-RCPO:讓模型在無標簽數據上自我提升

研究團隊進一步提出了一種test-time reinforcement learning方法——GUI-RCPO,將模型采樣中的區域一致性轉換成一種自監督的獎勵信號來指導模型的策略優化。

對于每一個預測結果,GUI-RCPO會賦予其預測區域內的平均票數與最大票數之比的獎勵,反映出該區域在采樣中的一致性程度,一致性程度越高的區域會被賦予越高的獎勵。

這樣一來,GUI-RCPO便可以在無需任何標注數據和外部監督的情況下,利用這種區域一致性獎勵來指導模型進行策略優化,讓模型的輸出更加精準且自信,進而提高獎勵的可靠性和質量,從而實現在無標簽數據上的自我提升。

實驗分析

研究團隊將GUI-RC和GUI-RCPO兩種方法分別應用到不同的通用模型和GUI專用模型上,并在三個主流的GUI定位基準上進行了全面的評估。

對于GUI-RCPO方法,團隊使用去掉真值標簽的ScreenSpot-v2作為訓練數據集。

實驗結果表明,兩種方法在不同模型上都有一致的提升。

其中GUI-RCPO帶來的提升超過了GUI-RC,說明模型在GUI-RCPO訓練過程中并不是在簡單地擬合共識區域,而是在真正地學會一種更好的定位策略。

此外,GUI-RCPO對于已經在GUI任務上進行過預訓練的模型仍然會帶來進一步的提升,證明了方法的有效性。

此外,GUI-RCPO還展現出良好的泛化能力,盡管模型只在針對通用場景的ScreenSpot-v2數據集上進行訓練,但是在更有挑戰性的針對專業場景的ScreenSpot-Pro基準上依然有顯著的提升。

并且隨著訓練步數的增加,模型在三個基準上的表現都有穩定的提升,進一步證明了GUI-RCPO的泛化能力。

研究團隊還嘗試在GUI-RCPO訓練之后,繼續使用GUI-RC進行空間區域投票,并發現模型的表現還能進一步提升,說明通過這種自我強化的循環,模型可以在沒有任何標注數據和外部監督的情況下,不斷突破預期的性能上限。

案例分析

研究團隊提供了兩個案例,分別展示了GUI-RC可以解決的GUI定位中存在的兩類幻覺。

  • 誤導性幻覺

在一個電商界面里,用戶指令要求GUI智能體在時尚購物區中查看低于50美元的鞋子(圖片中藍色方框框選的區域),而在貪心解碼策略下,模型卻被相近的語義與版面布局迷惑,錯誤地框選到了“低于25美元的上衣”區域(左側圖片中紅色方框框選的區域),這是典型的語義錯配導致的誤導性幻覺。

GUI-RC通過對同一指令進行多次采樣,并投票選出采樣中的共識區域(右側圖片中綠色方框框選的區域),成功地將模型的注意力穩定地聚合到正確的區域,從而糾正了單次預測的誤導性錯誤,給出更精確的定位。

  • 偏差性幻覺

在一個電子平臺界面里,用戶指令要求GUI智能體“聯系銷售”(圖片中藍色方框框選的區域),而在貪心解碼策略下,模型卻把右側的整張信息卡片當作目標(左側圖片中紅色方框框選的區域),而不是精確地框選可點擊的“聯系銷售”按鈕。

GUI-RC通過多次采樣投票的方式,把一次次略有偏差的預測聚合并提取出一個更加精確、自信的共識區域(右側圖片中綠色方框框選的區域),成功地完成了精準的定位,消除了這類偏差性幻覺。

小結一下

研究團隊首先設計了一種無需訓練的test-time scaling方法——GUI-RC,通過利用模型在采樣過程中呈現出來的空間區域一致性提取出模型的共識區域,從而實現更加精準自信的定位。

為了繼續發掘區域一致性的潛力,團隊進一步提出了一種test-time reinforcement learning方法——GUI-RCPO,將區域一致性轉化為一種自監督的獎勵信號,使得模型能夠在無需任何標注數據的情況下不斷地進行自我提升。

實驗證明了該方法有廣泛的適用性和良好的泛化能力。

團隊的研究揭示了test-time training在GUI智能體領域中的潛力,為構建更加數據高效的GUI智能體提供了一個可行的方向。

論文鏈接:https://arxiv.org/abs/2508.05615
項目主頁:https://zju-real.github.io/gui-rcpo/
代碼倉庫:https://github.com/ZJU-REAL/GUI-RCPO

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-08-04 09:13:00

AI智能體技術

2024-03-12 13:27:13

2025-06-04 08:35:00

2025-12-02 08:42:00

AI模型數據

2025-08-18 09:08:00

2025-10-11 13:51:21

2025-03-10 09:15:00

2025-06-03 08:51:00

2023-06-16 14:11:00

研究監督

2025-09-04 11:58:42

2018-06-05 11:10:12

2025-03-10 12:09:37

2024-12-17 12:53:45

AI自我進化谷歌

2024-02-07 12:13:03

AI模型

2025-05-27 15:59:03

AI生成模型

2023-05-26 00:43:08

2025-12-11 02:00:00

AI人工智能

2024-03-18 09:12:09

計算模型

2023-09-10 10:51:22

算法結構
點贊
收藏

51CTO技術棧公眾號

日韩欧美一区二区三区四区五区 | a级片在线免费观看| 亚洲美女黄网| 3atv在线一区二区三区| 日韩av在线一区二区三区| 黄页网站在线| 久久青草国产手机看片福利盒子| 欧美黑人性猛交| 开心丁香婷婷深爱五月| 久久国产精品区| 欧美激情极品视频| 幼a在线观看| 国产精品一区二区在线观看网站| 欧美成人h版在线观看| 成人天堂入口网站| 免播放器亚洲| 91国产视频在线| 中文字幕成在线观看| 国产一区二区你懂的| 亚洲第一激情av| 国产原创中文在线观看| 麻豆视频网站在线观看| 国产成人一区| 欧美成人精品1314www| 久久久亚洲精华液精华液精华液 | 成人av电影观看| 亚洲欧美另类小说视频| 久久亚洲精品无码va白人极品| 精品亚洲欧美日韩| 亚洲欧美大片| 亚洲最大福利网站| 亚洲高清久久| 国产一区二区三区播放| 久久久久久电影| 欧美精品少妇| 精品丝袜一区二区三区| 99国产精品免费网站| 粉嫩av免费一区二区三区| 精品一区二区三区在线观看国产 | 亚洲人成欧美中文字幕| 欧美网站免费观看| 久久免费看少妇高潮| 日本老师69xxx| 91www在线| 日韩视频中午一区| 91电影在线播放| 性欧美freehd18| 国产日韩一区二区三区| 国产在线视频网站| 欧美丝袜一区二区三区| 视频一区二区在线播放| 性做久久久久久免费观看欧美| 中文乱码字幕高清在线观看| 一区二区三区影院| 亚洲校园欧美国产另类| 色伊人久久综合中文字幕| 成年网站在线| 亚洲第一精品夜夜躁人人爽| 芒果视频成人app| 色妞一区二区三区| 欧美精品影院| 国产第一区电影| 我不卡神马影院| 久久久久久99| 精品亚洲免费视频| 日韩欧美猛交xxxxx无码| 国产亚洲欧美日韩在线一区| 国产精品久久久久久精| 欧美女子与性| 久久精品中文字幕一区| 成人免费视频| 久久综合九色九九| 国内自拍一区| 久久免费看毛片| 欧美日韩情趣电影| 久久精品亚洲成在人线av网址| 亚洲最大的av网站| 国产精品婷婷午夜在线观看| 日韩精品美女| 清纯唯美亚洲综合| 久久国产精品99国产| 国产精品入口免费软件| 日韩欧美在线影院| 国产精品美女在线观看直播| 3d动漫精品啪啪一区二区三区免费| 国产91对白在线观看九色| av在线免费网站| 精品高清视频| 欧美一区二区三区思思人| 一区二区日本视频| 伊人在线视频| 欧美精品123| 欧美大片顶级少妇| 蜜臀av性久久久久蜜臀aⅴ流畅 | 最近中文字幕免费mv| 91精品国产综合久久久蜜臀图片| 日韩图片一区| 欧美日韩在线资源| 欧洲精品久久| 亚洲天堂日韩电影| 亚洲欧洲精品一区二区三区| 日韩电影免费网站| √天堂8在线网| 波多野结衣三级在线| 欧美劲爆第一页| 欧美在线观看18| 激情六月婷婷久久| 99精品国产一区二区三区2021| 在线视频99| 久久精品五月婷婷| 亚洲午夜色婷婷在线| 国产精品国产自产拍高清av| 91精品啪在线观看国产81旧版| 97在线超碰| 一级视频在线免费观看| 国产日韩视频在线播放| 日韩av手机在线观看| 日韩毛片中文字幕| 久久青草欧美一区二区三区| 国产精品扒开腿做爽爽爽软件| 激情国产在线| a4yy在线播放免费观看视频| 亚洲高清视频一区二区| 91精品在线影院| 久久精品国产免费观看 | 国产精品拍拍拍| 波多野结衣av一区二区全免费观看 | 日韩av在线免播放器| 最新国产精品视频| 国产精品一区二区久久精品| 美女诱惑一区二区| 国产成人午夜| 日韩在线激情视频| 香蕉加勒比综合久久 | 秋霞av国产精品一区| 欧美电影在线免费观看| 一区二区三区在线观看动漫| 久久久噜噜噜久久人人看| 日韩综合在线视频| 伊人久久亚洲热| 欧美一区二区三区免费看| 国产精品日韩精品中文字幕| 国产精品一区二区三区www| 欧美大片免费| 国产超碰在线| 国产精品入口尤物| 欧美三级乱人伦电影| 色综合视频一区二区三区44| 中文网丁香综合网| 91黄色小视频| 老司机aⅴ在线精品导航| 欧美日韩dvd| 日韩欧美一区二区免费| 国产成人精品一区二区三区在线 | 一道精品一区二区三区| 国产精品国产精品国产专区不蜜 | 久久久久久国产精品免费免费| 日韩肉感妇bbwbbwbbw| 一二三四区在线观看| 99re91这里只有精品| 懂色av一区二区三区蜜臀| 日韩欧美国产系列| 国产精品美女xx| 成年人午夜视频在线观看| 91av在线免费观看| 国产丝袜精品第一页| 一区二区成人在线观看| 久久久影院一区二区三区| 色偷偷一区二区三区| 久久高清免费| 欧美变态视频| free性欧美1819hd| 成人勉费视频| 国产精品77777| 日韩一区二区在线免费观看| 欧美一区亚洲一区| 久久久久久久久久伊人| a黄色在线观看| 欧美熟乱15p| 国产精品国产三级国产aⅴ中文| 亚洲精品美女在线观看播放| 国产亚洲一区二区三区在线播放| 男人久久精品| 久久午夜精品一区二区| 久cao在线| 国产美女免费观看| 成年人观看网站| 欧美著名女优| 日韩精品永久网址| 男男gay无套免费视频欧美 | 欧美色图天堂| 欧美色图激情小说| 亚洲欧美日韩中文播放| 国产91精品青草社区| 亚洲 激情 在线| 日韩一区二区三区精品| 精品国产18久久久久久洗澡| 亚洲区综合中文字幕日日| 亚洲一级影院| 国产在线一区观看|