国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

不靠海量數(shù)據(jù),如何精準喂養(yǎng)大模型?上交Data Whisperer:免訓練數(shù)據(jù)選擇法,10%數(shù)據(jù)逼近全量效果

人工智能 新聞
上海交通大學等團隊提出 Data Whisperer —— 首個免訓練的注意力驅(qū)動數(shù)據(jù)選擇框架。它直接利用預訓練模型的上下文學習(ICL)能力,無需額外微調(diào)打分模型,僅用 10% 數(shù)據(jù)就能讓微調(diào)效果逼近全量數(shù)據(jù)!

本文第一作者王少博為上海交通大學博士生,現(xiàn)于阿里 Qwen 團隊實習,此前有 CVPR 滿分一作論文。通訊作者為其導師、上海交大助理教授張林峰。本文其他作者來自上交 EPIC Lab、NTU、NUS、微軟、上海 AI Lab、港科大(廣州)等。

從未微調(diào)目標數(shù)據(jù)集,一個預訓練模型竟能自己篩選出「黃金訓練樣本」?

上海交通大學等團隊提出 Data Whisperer —— 首個免訓練的注意力驅(qū)動數(shù)據(jù)選擇框架。它直接利用預訓練模型的上下文學習(ICL)能力,無需額外微調(diào)打分模型,僅用 10% 數(shù)據(jù)就能讓微調(diào)效果逼近全量數(shù)據(jù)!

就像一位精通教學的導師,看一眼題庫就知道該讓學生重點練什么題。

圖片

  • 論文標題:Data Whisperer: Efficient Data Selection for Task-Specific LLM Fine-Tuning via Few-Shot In-Context Learning
  • 論文鏈接:arxiv.org/pdf/2505.12212  
  • GitHub 地址:gszfwsb/Data-Whisperer  
  • 關(guān)鍵詞:數(shù)據(jù)選擇、上下文學習、小樣本泛化、結(jié)構(gòu)對齊

精調(diào)大模型,數(shù)據(jù)挑對才關(guān)鍵

模型說:「別給我扔幾百萬條數(shù)據(jù)了,你先告訴我哪些題值得看!」

傳統(tǒng)的數(shù)據(jù)選擇方法:

  • 要先訓練個打分模型;
  • 要調(diào)一堆啟發(fā)式參數(shù);
  • 要花一堆時間還不一定好用;

而 Data Whisperer 就像摸魚同學中的學霸 —— 不看全書也能穩(wěn)拿高分。

方法機制:只靠模型自身,打分挑數(shù)據(jù)

Data Whisperer 是一種以大模型自身為評估器、完全免訓練的數(shù)據(jù)子集選擇方法。

1. ICL 少樣本構(gòu)建

  • 隨機采樣若干「示范樣本」和「查詢樣本」,構(gòu)建 ICL 提示;
  • 讓待精調(diào)的大模型嘗試回答這些查詢?nèi)蝿眨?/span>
  • 根據(jù)回答質(zhì)量,給每個「示范樣本」打一個分。

2. 引入注意力感知權(quán)重

  • 為了讓「題目權(quán)重」更加合理,Data Whisperer 不只看輸出結(jié)果;
  • 它利用 Transformer 的注意力權(quán)重,度量每個示例對模型推理的「影響力」;
  • 最終打分由模型輸出與注意力貢獻共同決定,更穩(wěn)定、更合理。

圖片

這種打分機制是完全無需訓練、無需人工標注的!

Data Whisperer 不是「拍腦袋選題」,理論也站得住腳!

在傳統(tǒng)精調(diào)中,模型通過梯度下降顯式更新參數(shù),比如注意力權(quán)重的關(guān)鍵值(Key)矩陣 W_K 和數(shù)值(Value)矩陣 W_V:

圖片

其中圖片 是通過反向傳播學到的參數(shù)更新。

而在 ICL 過程中,雖然模型參數(shù)固定不變,但通過上下文中的示例(demonstration tokens)對注意力進行加權(quán),使得模型在預測時行為發(fā)生了「類精調(diào)」式的變化:

圖片

這里的 圖片并非真實權(quán)重更新,而是通過注意力機制 「模擬出的權(quán)重調(diào)整」。這正是 Data Whisperer 利用的核心。

也就是說,ICL 就像是在不動參數(shù)的前提下,用「語言上下文」在行為上更新了模型。

精調(diào)誰還全訓?我 10% 數(shù)據(jù)照樣打贏!

讓我們看看 Data Whisperer 的「壓軸戰(zhàn)績」:

  • GSM8K 數(shù)學題:10% 數(shù)據(jù)打出 72.46%,還比全量數(shù)據(jù)(71.39%)更高;
  • DialogSum 總結(jié)任務:用 Qwen 模型達到 43%,比最強 SOTA 方法高出 2.5 個點;
  • BioInstruct 任務也同樣提升顯著。

圖片

別人還在選題,我已經(jīng)開始精調(diào)了

Data Whisperer 引入了一個新的效率指標:Selection-to-Tuning Ratio(STR),即選擇過程耗時與全量精調(diào)耗時之比。

在該指標下,Data Whisperer 以 STR ≈ 0.03~0.2 的水平,大幅領先現(xiàn)有所有方法。相比之下,許多傳統(tǒng)方法(如 Nuggets)STR > 1,意味著「選題還不如直接精調(diào)快」。

Data Whisperer 用極低成本完成了模型適配所需的「預判題型」工作。

圖片

小模型選題,大模型精調(diào),誰用誰知道!

Data Whisperer 支持弱模型作為「選題器」,強模型作為「學習者」的弱選強訓(weak-to-strong)機制。

例如,使用 Qwen-2.5-3B-Instruct 選題、再用 Qwen-2.5-7B-Instruct 精調(diào),最終性能幾乎不降,卻帶來更低計算負擔。

Data Whisperer 成功實現(xiàn)了從小模型到大模型間的「知識前置遷移」,適用于資源受限場景下的精調(diào)任務。

圖片

演示題和查詢題怎么配?精細搭配才能挑好!

Data Whisperer 進一步分析了 ICL 中示例(n_d)與查詢(n_q)數(shù)量對選擇效果的影響。

結(jié)果顯示,n_d=10、n_q=5 是穩(wěn)定優(yōu)選配置。在此之后增加樣本數(shù)量,效果提升趨于飽和。

這表明 Data Whisperer 對輸入規(guī)模具有良好的魯棒性,不是靠堆樣本,而是真挑核心。

圖片

哪層注意力最好用?

Data Whisperer 的注意力打分依賴于 Transformer 的層級結(jié)構(gòu)。作者分別測試了淺層、中層、深層注意力用于打分的效果。

結(jié)果發(fā)現(xiàn),中間層(如 Layer13)提供的語義信息更穩(wěn)定,選題效果更佳,符合語言模型內(nèi)部語義聚合的層次分布規(guī)律。

Data Whisperer 巧妙借力模型結(jié)構(gòu),使「注意力」真正發(fā)揮了「注意」的功能。

圖片

模型偏好什么題?簡單好懂才是王道

進一步的分析中,作者使用 GPT-4o-mini 對被選中樣本的困惑度(perplexity)進行了評估。

發(fā)現(xiàn) Data Whisperer 傾向選擇困惑度較低的樣本,說明模型更喜歡「簡單題」,也符合 Sorscher 等人在小樣本學習中的「易例優(yōu)先」理論。

圖片

對比分析:到底比哪些方法強?

Data Whisperer 在所有主流數(shù)據(jù)選擇方法對比中均展現(xiàn)出領先效果:

  • GraNd:基于梯度;
  • EL2N:基于預測誤差;
  • CCS:注重多樣性;
  • Nuggets:需要額外精調(diào)打分器;
  • STAFF:組合打分策略。

Data Whisperer 在準確率、效率、穩(wěn)定性三個維度全面領先,尤其在低預算(1%、5%、10%)場景中優(yōu)勢明顯。

Data Whisperer 的秘訣:ICL 就是精調(diào)的「影子」

Data Whisperer 并非經(jīng)驗規(guī)則,而是基于理論支撐。

論文從注意力機制視角出發(fā),分析了 ICL 過程中上下文樣本對模型輸出的影響,實質(zhì)上等價于一種隱式的參數(shù)更新。

ICL 調(diào)整注意力權(quán)重 ≈ Fine-Tuning 調(diào)整參數(shù)矩陣

兩者都是為了「讓模型在未來輸入中表現(xiàn)更好」。

這一結(jié)構(gòu)上的對應性解釋了 Data Whisperer 能有效選出訓練子集:它無需調(diào)模型參數(shù),就能「預訓」出訓練效益。

啟示與未來方向

Data Whisperer 所倡導的是一種新范式:結(jié)構(gòu)感知、推理驅(qū)動的數(shù)據(jù)選擇方法,為 LLM 訓練過程引入「自解釋、自判斷」的機制。

值得注意的是,字節(jié) Seed 最新的工作 (https://arxiv.org/abs/2505.07293),也用了類似 few-shot 和 attention 結(jié)合的方法。

接下來值得探索的方向包括:

1. 將方法遷移至法律、醫(yī)療、工程等復雜結(jié)構(gòu)任務;

2. 引入人類反饋或語言理解偏好,進一步增強「任務對齊」能力;

3. 結(jié)合 prompt 工程,控制示例順序以提升效果;

4. 與合成數(shù)據(jù)方法融合,構(gòu)建任務驅(qū)動的多源樣本庫。

總之,Data Whisperer 并不是簡單優(yōu)化效率的技巧,而是揭示了一個事實:

  • 任務對齊不必依賴人類標簽、不必堆數(shù)據(jù)量。
  • 結(jié)構(gòu)化的推理機制與任務映射,本身就可以引導模型學習方向。

未來的大模型訓練也許不再是「知道做什么」,而是「知道問什么」。

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2017-02-09 11:05:11

大數(shù)據(jù)用戶畫像技術(shù)

2024-08-07 15:27:50

2024-10-29 15:00:00

大模型數(shù)據(jù)

2014-05-27 15:14:02

廣告

2023-09-18 16:59:06

數(shù)據(jù)布隆過濾器

2020-08-17 10:53:10

AI

2021-08-03 22:56:01

大數(shù)據(jù)流量軟件

2016-01-07 11:25:12

數(shù)據(jù)模型訓練數(shù)據(jù)

2024-02-07 09:25:52

數(shù)據(jù)處理快手大模型

2020-06-17 13:02:39

金融科技數(shù)據(jù)分析

2022-11-28 09:18:03

2016-04-11 14:35:59

機器學習數(shù)據(jù)挖掘數(shù)據(jù)模型

2014-11-04 09:18:33

安全策略安全管理威脅情報

2011-08-29 14:33:41

2011-11-07 09:31:20

大數(shù)據(jù)Hadoop

2025-03-07 15:30:32

2021-07-19 08:00:00

開源數(shù)據(jù)工具

2022-09-19 15:37:51

人工智能機器學習大數(shù)據(jù)

2018-04-25 14:42:00

決勝策略數(shù)據(jù)

2014-04-18 10:05:38

數(shù)據(jù)分析手游
點贊
收藏

51CTO技術(shù)棧公眾號

粉嫩一区二区三区在线观看 | 亚洲一区二区三区四区在线播放| 一区二区三区四区不卡| 日韩成人久久| 粉嫩老牛aⅴ一区二区三区| 2018日韩中文字幕| 午夜视频在线观看网站| 久久久久国产精品一区二区 | 一区二区av| 极品国产人妖chinesets亚洲人妖| 色噜噜狠狠成人网p站| 综合色婷婷一区二区亚洲欧美国产| 国产丝袜精品丝袜| 国产精品s色| 欧美精品一区二区三区国产精品| 91av入口| 中文字幕不卡在线播放| 国产一区二区三区免费不卡| 国产啊啊啊视频在线观看| 亚洲视频免费看| 日本福利一区二区三区| 国产精品白丝av嫩草影院| 欧美v日韩v国产v| 中文在线最新版天堂8| 欧美日韩视频在线第一区| 成人黄色大片网站| 亚洲少妇一区| 97在线免费视频观看| 国产专区一区| 欧美色videos| **孕交吃奶水一级毛片| www激情久久| 视频一区二区综合| 91久久久精品国产| 国产精品国产三级国产普通话三级| 日本中文视频| 国产精品自拍网站| 久久大香伊蕉在人线观看热2| 日韩在线理论| 亚洲成人自拍偷拍| 日韩在线观看免费av| 国产999精品| 欧美日韩1区2区3区| 一区二区三区在线观看www| 成人黄色在线看| av一级毛片| 欧美日韩高清影院| 天堂中文字幕——hd| 亚洲综合色噜噜狠狠| 四虎影视2018在线播放alocalhost| 成av人片一区二区| 国产午夜视频| 色综合久久久久综合99| 男女视频在线| 国产精品福利在线观看网址| 国产精品毛片| 中文字幕av日韩精品| 99re视频精品| 伊人再见免费在线观看高清版| 亚洲欧美综合色| 美女视频黄a视频全免费观看| 亚洲国产高清在线观看视频| 青青草娱乐在线| 国产一区二区精品丝袜| 成人爱爱网址| 成人h视频在线| 成人av在线播放网站| 香蕉视频网站在线观看| 全球成人中文在线| 一区二区黄色| 国产精品久久久久久精| 欧美国产日韩在线| 久久久91精品国产一区二区精品| 98色花堂精品视频在线观看| 国内视频一区| 日韩欧美你懂的| 日韩高清在线一区| 在线观看特色大片免费视频| 99精品视频网站| 国产视频精品在线| 国产99久久久国产精品潘金网站| 激情小说网站亚洲综合网| 91香蕉视频污| 国模私拍一区二区国模曼安| 久久伦理网站| 日韩欧美一区电影| 精品无码三级在线观看视频| 超碰在线网站| 女同性恋一区二区| 中文字幕成人精品久久不卡| 成人av电影在线| 欧美激情精品| 成人亚洲一区二区三区| 国产一区二区在线免费| 在线观看视频一区二区欧美日韩| 一区在线视频观看| av今日在线| 日本久久精品一区二区| 国产成人综合精品在线| 欧美日韩黄视频| 国产情侣久久| 阿v视频在线观看| 欧美美女黄色网| 68精品国产免费久久久久久婷婷| 亚洲国产成人精品视频| 9色精品在线| av国产精品| 调教在线观看| 日韩在线国产| 久久久欧美精品| 91精品久久久久久久99蜜桃| 91偷拍与自偷拍精品| 欧美国产高潮xxxx1819| 欧美一区久久久| 婷婷国产在线| 日av中文字幕| 神马影院我不卡午夜| 亚洲人成影院在线观看| 国产一区二区三区福利| 91精品国产品国语在线不卡| 99re91这里只有精品| 久久久久久久久久久久久久一区| 久久影院视频免费| 精品国产电影| 91精品办公室少妇高潮对白| 午夜久久久久| 欧美知名女优| 精品夜色国产国偷在线| 国产欧美一级| 精品国产乱码久久久久久蜜坠欲下 | 日本高清视频一区二区三区 | 成人黄色片视频| 国产精品久久久久秋霞鲁丝 | 欧美精品一区二区蜜臀亚洲| 亚洲在线中文字幕| 亚洲免费av高清| 99热精品久久| 97人人在线视频| 国产亚洲依依| www.99色| а√最新版在线天堂| 97国产视频| 国产911网站| 最新av中文字幕| 色琪琪免费视频网站| 欧美一级特黄aaaaaa在线看片| 国产精品10p综合二区| 国产精品久久av| 国产精品丝袜久久久久久高清| 91精品国产色综合| 精品国产一区二区三区av性色| 欧美群妇大交群的观看方式| 欧美疯狂做受xxxx富婆| 日韩av中文字幕在线| 欧美日韩在线不卡| 精品国产乱码久久久久久免费| 91精品国产综合久久国产大片| 国产精品第四页| 在线精品亚洲一区二区不卡| 日韩无一区二区| 欧美日韩成人在线视频| 亚洲国产成人91精品| 久久综合伊人77777蜜臀| 亚洲精品久久久久中文字幕欢迎你| 欧美va亚洲va在线观看蝴蝶网| 欧美性感美女h网站在线观看免费| 成人av网站在线观看免费| 中文字幕综合网| 欧美一区二区三区影视| 欧美男同性恋视频网站| 日日摸夜夜添一区| 91免费欧美精品| 免费看日本黄色| 日韩 欧美 高清| 翔田千里一区| 性欧美video高清bbw| 在线视频1区2区| 一区二区亚洲视频| 日本伊人色综合网| 国产一区 二区 三区一级| 五月婷婷综合激情| 亚洲美女激情视频| 国产视频观看一区| 精品丰满人妻无套内射| 欧美私人情侣网站| 91大神xh98hx在线播放| 国产激情综合| 国产精品一区二区久激情瑜伽| 色综合中文字幕国产| 性金发美女69hd大尺寸| 日韩av免费看网站| 国产精品区二区三区日本| 日本成人中文字幕在线| 伊人久久视频| 最新亚洲激情| 国产成人精品三级| 亚洲欧美日韩国产手机在线| 一本久久a久久精品亚洲| 国语自产在线不卡| 国产免费xxx|