国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

重新審視Prompt優化問題,預測偏差讓語言模型上下文學習更強

人工智能 新聞
LLMs 在 In-context Learning 下取得了良好的表現,但是選取不同的示例會導致截然不同的表現。一項最新的研究工作從預測偏差 (predictive bias) 角度,提出了 prompt 搜索策略,近似找到了最優的示例組合。

圖片

  • 論文鏈接: https://arxiv.org/abs/2303.13217
  • 代碼鏈接: https://github.com/MaHuanAAA/g_fair_searching

研究介紹

大型語言模型在上下文學習中表現出了驚人的能力,這些模型可以通過幾個輸入輸出示例構建的上下文進行學習,無需微調優化直接應用于許多下游任務。然而,先前的研究表明,由于訓練樣本 (training examples)、示例順序 (example order) 和提示格式 (prompt formats) 的變化,上下文學習可能會表現出高度的不穩定性。因此,構建適當的 prompt 對于提高上下文學習的表現至關重要。

以前的研究通常從兩個方向研究這個問題:(1)編碼空間中的提示調整 (prompt tuning),(2)在原始空間中進行搜索 (prompt searching)。

Prompt tuning 的關鍵思想是將任務特定的 embedding 注入隱藏層,然后使用基于梯度的優化來調整這些 embeddings。然而,這些方法需要修改模型的原始推理過程并且獲得模型梯度,這在像 GPT-3 和 ChatGPT 這樣的黑盒 LLM 服務中是不切實際的。此外,提示調整會引入額外的計算和存儲成本,這對于 LLM 通常是昂貴的。

更可行且高效的方法是通過在原始文本空間中搜索近似的演示樣本和順序來優化提示。一些工作從 “Global view” 或 “Local view” 構建提示。基于 Global view 的方法通常將提示的不同元素作為整體進行優化,以達到更優異的性能。例如,Diversity-guided [1] 的方法利用演示的整體多樣性的搜索,或者試圖優化整個示例組合順序 [2],以實現更好的性能。與 Global view 相反,基于 Local view 的方法通過設計不同的啟發式選擇標準,例如 KATE [3]。

但這些方法都有各自的局限性:(1)目前的大多數研究主要集中在沿著單個因素搜索提示,例如示例選擇或順序。然而各個因素對性能的總體影響尚不清楚。(2)這些方法通常基于啟發式標準,需要一個統一的視角來解釋這些方法是如何工作的。(3)更重要的是,現有的方法會全局或局部地優化提示,這可能會導致性能不理想。

本文從 “預測偏差” 的角度重新審視了 NLP 領域中的 prompt 優化問題,發現了一個關鍵現象:一個給定的 prompt 的質量取決于它的內在偏差。基于這個現象,文章提出了一個基于預測偏差的替代標準來評估 prompt 的質量,該度量方法能夠在不需要額外開發集 (development set) 的情況下通過單個前向過程來評估 prompt。

具體來說,通過在一個給定的 prompt 下輸入一個 “無內容” 的測試,期望模型輸出一個均勻的預測分布(一個 “無內容” 的輸入不包含任何有用的信息)。因此,文中利用預測分布的均勻性來表示給定 prompt 的預測偏差。這與先前的后校準方法 [4] 用的指標類似,但與后校準在固定的 prompt 情況下使用這個 metric 進行概率后校準不同的是,文中進一步探索了其在自動搜索近似 prompt 中的應用。并通過大量實驗證實了一個給定 prompt 的內在偏差和它在給定測試集上的平均任務表現之間的相關性。

圖片

此外,這種基于偏差的度量使該方法能夠以 “局部到全局” 的方式搜索合適的 prompt。然而,一個現實的問題是無法通過遍歷所有組合的方式搜索最優解,因為它的復雜度將超過 O (N!)。

該工作提出了兩種新穎的策略以高效的方式搜索高質量的 prompt:(1) T-fair-Prompting (2) G-fair-Prompting。T-fair-Prompting 使用一種直觀的方式,首先計算每個示例單獨組成 prompt 的偏差,然后選擇 Top-k 個最公平示例組合成最終 prompt。這個策略相當高效,復雜度為 O (N)。但需要注意的是,T-fair-Prompting 基于這樣的假設:最優的 prompt 通常是由偏差最小的示例構建的。然而,這在實際情況下可能并不成立,并且往往會導致局部最優解。因此,文章中進一步介紹了 G-fair-Prompting 來改善搜索質量。G-fair-Prompting 遵循貪心搜索的常規過程,通過在每個步驟上進行局部最優選擇來找到最優解。在算法的每一步,所選擇的示例都能使更新的 prompt 獲得最佳的公平性,最壞情況時間復雜度為 O (N^2),搜索質量顯著提高。G-fair-Prompting 從局部到全局的角度進行工作,其中在早期階段考慮單個樣本的偏差,而在后期階段則側重于減少全局預測偏差。

實驗結果

該研究提出了一種有效和可解釋的方法來提高語言模型的上下文學習性能,這種方法可以應用于各種下游任務。文章驗證了這兩種策略在各種 LLMs(包括 GPT 系列模型和最近發布的 LMaMA 系列)上的有效性,G-fair-Prompting 與 SOTA 方法相比,在不同的下游任務上獲得了超過 10%的相對改進。

圖片

與該研究最相近的是 Calibration-before-use [4] 方法,兩者都使用 “無內容” 的輸入提高模型的表現。但是,Calibration-before-use 方法旨在使用該標準來校準輸出,而該輸出仍然容易受到所使用示例的質量的影響。與之相比,本文旨在搜索原始空間找到近似最優的 prompt,以提高模型的性能,而不需要對模型輸出進行任何后處理。此外,該文首次通過大量實驗驗證了預測偏差與最終任務性能之間的聯系,這在 Calibration-before-use 方法中尚未研究。

圖片

通過實驗還能發現,即使不進行校準,該文章所提方法選擇的 prompt 也可以優于經過校準的隨機選擇的 prompt。這表明該方法可以在實際應用中具有實用性和有效性,可以為未來的自然語言處理研究提供啟示。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-06-15 15:45:42

自然語言語言模型

2023-09-16 13:47:47

人工智能數據

2023-07-09 15:09:18

機器學習能力

2025-12-09 09:28:54

2023-02-13 08:00:00

深度學習數據算法

2025-09-09 09:49:36

2025-03-18 08:14:05

2025-09-28 07:00:00

2025-09-16 12:49:11

2017-05-11 14:00:02

Flask請求上下文應用上下文

2023-11-24 17:01:30

模型推理

2023-07-24 12:27:08

論文斯坦福

2024-03-14 08:11:45

模型RoPELlama

2025-08-08 01:45:00

上下文工程優化框架

2012-12-31 10:01:34

SELinuxSELinux安全

2023-10-23 13:23:03

數據訓練

2022-09-14 13:13:51

JavaScript上下文

2025-03-18 09:10:00

MCPAI模型上下文協議

2023-11-26 18:05:00

文本訓練

2025-12-10 01:00:00

點贊
收藏

51CTO技術棧公眾號

久久天天东北熟女毛茸茸| 97成人在线| 欧美三级小说| 91精品国产91久久久久久吃药| 88xx成人网| 91精品婷婷国产综合久久性色| 国产精品久久久久免费| 日本成人精品| 内射国产内射夫妻免费频道| 欧美家庭影院| 日韩成人av在线资源| 亚洲午夜视频在线| 女人扒开屁股爽桶30分钟| 视频一区国产视频| 日韩欧美一二区| 日本中文字幕电影| 欧美精品一区二区三区在线播放| 亚州黄色一级| 欧美性生活大片视频| 亚洲精品在线看| 成年人视频观看| 成人爱爱电影网址| 综合久久国产| 国产精品日韩一区二区免费视频| 成人交换视频| 亚洲第一精品电影| 色的视频在线免费看| 欧美日韩国产专区| 97在线免费| 97成人超碰| 欧美不卡激情三级在线观看| 蜜芽tv福利在线视频| 亚洲国产日韩在线一区模特 | 日韩精品在线观看一区| 国产高清视频在线观看| 亚洲色图欧美偷拍| 欧美在线视频观看| 色综合一区二区日本韩国亚洲| 亚洲精品不卡在线| 草草在线观看| 精品99999| 国产理论在线| 亚洲免费电影一区| 成人爽a毛片免费啪啪| 亚洲精品国产综合区久久久久久久| 亚洲男同gay网站| 欧美巨大另类极品videosbest | 亚洲欧洲日韩综合一区二区| aaa毛片在线观看| 91看片淫黄大片一级在线观看| 亚洲人成无码网站久久99热国产| 99久久婷婷国产综合精品首页| 日韩一区二区三区在线观看 | 亚洲男人的天堂网| 成人淫片免费视频95视频| 国产精品午夜免费| 国产91福利| 欧美日韩国产综合新一区 | 九九热在线精品视频| 日韩中文字幕视频网| 欧美在线免费看| 日韩欧美中字| av日韩中文字幕| 母乳一区在线观看| 久久精品国产精品亚洲精品色| 国产成人av资源| 不要播放器的av网站| 亚洲三级久久久| 狠狠狠综合7777久夜色撩人| 日韩视频在线一区二区| 91大神在线观看线路一区| 韩国三级日本三级少妇99| 色综合久久网| 日韩精彩视频| ww亚洲ww在线观看国产| 天天草夜夜草| 日韩精品一区国产麻豆| 国产精品麻豆成人av电影艾秋| 亚洲日本电影在线| 青娱在线视频| 欧美一区二区不卡视频| mm1313亚洲国产精品无码试看| av成人免费在线| 免费高清特黄a大片| 欧美三级韩国三级日本一级| 亚洲国产福利| 欧美日韩一区二区在线 | 国产精久久一区二区| 国产91久久婷婷一区二区| 国产韩国精品一区二区三区| 欧美日韩大片一区二区三区| av一区二区久久| 翔田千里一区| 亚洲欧美日韩区| 色婷婷热久久| 免费av观看网址| 在线亚洲免费视频| 99视频免费| 欧美性三三影院| 伊人久久一区| y111111国产精品久久婷婷| 成人av在线一区二区| 草久在线视频| 中文字幕亚洲一区在线观看| 亚洲啊v在线观看| 99热在线这里只有精品| 欧洲精品一区二区| 一区二区三区欧洲区| 日本一区免费| 亚洲成人手机在线| 亚洲成人a级片| 国内精品二区| 亚洲欧美视频一区| 91成人在线| 日本不卡高清视频一区| 亚洲国产cao| 日韩成人在线电影| 另类小说综合网| 午夜精品123| av成人资源| 中文字幕精品在线播放| 色哟哟日韩精品| 日韩欧美ww| 午夜国产一区二区三区| 中文字幕国内精品| 美女脱光内衣内裤视频久久影院| 蜜桃视频在线观看网站| 国产精品91一区| 中文乱码免费一区二区| 成人一区视频| 亚洲欧洲精品一区二区| 欧美人成免费网站| 亚洲欧美日韩高清在线| 特黄aaaaaaaaa毛片免费视频| 久久天堂电影网| 久久成人久久爱| 2020国产在线视频| 国产精品一区而去| 欧美视频裸体精品| 国产高清一级毛片在线不卡| 久久久亚洲福利精品午夜| 国产精品自拍在线| 成年网站在线视频网站| 日本视频一区二区不卡| 欧美电影一区二区三区| 亚洲黄色av| www.国产精品.com| 国产精品露出视频| 色哟哟欧美精品| 亚洲视频狠狠| 国产最新在线| 日韩一级裸体免费视频| 精品一区二区三区视频在线观看| 婷婷在线视频| 精品乱码一区| 91精品国产乱码| 国产精品美女久久久| 黄av在线免费观看| 免费国产一区| 日韩午夜精品视频| 人人爽香蕉精品| 99热99re6国产在线播放| 在线一区日本视频| 在线亚洲午夜片av大片| 久久综合九色综合97婷婷女人 | 91麻豆精品秘密| 亚洲精选av| 成人在线看片网站| 国产精品久久久久7777婷婷| 精品久久久久人成| 91久久黄色| 国产va在线视频| 亚洲精品蜜桃久久久久久| 久久视频在线视频| 18涩涩午夜精品.www| 婷婷综合久久| 影音先锋男人资源在线| 国产高清精品软男同| 日韩在线观看你懂的| 国产精品三级av在线播放| 欧美丝袜丝交足nylons172| 二区三区在线播放| 日本xxx免费| 亚洲91精品在线| 色老综合老女人久久久| 蜜臀久久久久久久| 国产日韩欧美中文在线| 最全影音av资源中文字幕在线| 亚洲国产成人av在线| 国产成人在线免费观看| 成人激情自拍| 欧美套图亚洲一区| 亚洲午夜在线观看| 欧美精品生活片| 欧美视频在线观看免费| 精品一区二区三区在线观看国产| 国产高清日韩| 搞黄视频免费在线观看| 国产 日韩 欧美在线| 91牛牛免费视频|