国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

如何評估大語言模型生成結果的多樣性

發布于 2024-7-16 09:57
瀏覽
0收藏

?1、論文的背景

關于大型語言模型(LLM)的一個開放性問題是,這些模型從預訓練數據中學習了哪些模式,以及這些模式是否能夠在下游任務和數據集中普遍適用。雖然先前的研究主要集中在生成質量上,最近也開始關注文本生成的新穎性,但對LLM學習到的模式類型的特征描述還很有限。關于評估大型語言模型(LLM)生成文本多樣性的研究主要集中在詞級特征上。本文提供了一種句法特征分析方法,用以描述模型中的普遍重復現象,超越了n-gram的范疇。

例如,考慮圖1中OLMoInstruct生成的文本,這是從一個生成的電影評論摘要語料庫中采樣的。這是通過提示模型總結一組人工撰寫的電影評論而產生的:"《舊金山的最后一個黑人》是一部感人的、拍攝精美的電影[...] 創造了一種獨特而強烈的觀影體驗[...]"。在這個例子中,論文發現總共有35個重復的詞性(POS)標簽序列,長度為n = 5到8。雖然生成的文本在OLMo的訓練數據中并未出現,但論文發現35個序列中有33個(95%)出現在預訓練數據中。因此,盡管生成的文本本身是新穎的,但它依賴于從訓練數據中學習到的常見句法序列。    

如何評估大語言模型生成結果的多樣性-AI.x社區

2、論文的方法

論文量化并測量了大型語言模型(LLM)在文本生成中使用重復序列的情況。論文引入并聚焦于句法模板,即詞性(POS)序列,這是一種能展示多樣化模式集的句法抽象。論文首先建立了訓練數據中頻繁模板與模型在生成過程中依賴這些模板之間的聯系。利用這一發現,論文直接連接了訓練數據模板統計和模型生成這些模板的傾向。然后,論文評估了幾個封閉源模型及其傾向于生成的句法模板,這讓論文了解了它們訓練數據的屬性。    

論文首先介紹句法模板,并定義在生成文本中檢測和測量這些模板的方法?;谶@個定義,論文試圖回答以下問題:

RQ1 指令微調的LLM生成的輸出有多大程度上是模板化的?

RQ2 論文能否在(預)訓練數據中定位模型生成的模板?

RQ3 句法模板能否用于檢測數據記憶?

3、論文的效果

論文發現模型生成文本中的大部分(76%)模板可以在預訓練數據中找到(相比之下,人類撰寫的文本僅有35%),而且這些模板在RLHF等微調過程中并未被覆蓋。這種與預訓練數據的聯系使論文能夠分析那些論文無法獲取預訓練數據的模型中的句法模板。論文還發現,作為特征的模板能夠區分不同的模型、任務和領域,并且對定性評估常見模型構造很有用。

最后,論文展示了論文的指標也可以用作記憶的一種更軟性版本。例如,雖然Carlini等人(2022)估計有1%的文本被記憶,但論文發現相比逐字記憶,有0.8-3.1%更多的軟記憶文本,通常是通過替換數字和生成同義詞實現的。

如何評估大語言模型生成結果的多樣性-AI.x社區

表2顯示了兩個額外任務的模板率:與Dolma相比(82.6%, 0.012),使用Dolma Cosmopedia進行合成數據生成和數據生成的模板出現率(99.1%)和每個標記的模板數(0.014)更高。

如何評估大語言模型生成結果的多樣性-AI.x社區

圖2顯示了各模型檢查點的平均困惑度。論文發現模板學習得很快 - 在第一個模型檢查點(已訓練40億個標記)就已經出現。非模板標記的平均困惑度下降到約500,而模板的困惑度下降到約200。這些發現令人驚訝,表明模板是在預訓練早期就被學習,而不是在微調過程中學習的。在剩余的訓練過程中,模板標記的平均困惑度一直保持較低水平

本文轉載自 ??AI帝國??,作者: 無影寺

1
收藏
回復
舉報
1條回復
按時間正序
/
按時間倒序
Elina孫
Elina孫

666

回復
2024-7-16 23:19:55
回復
相關推薦
国产精久久一区二区| 日韩欧美国产一区二区在线播放| 自拍偷拍精选| 欧美日韩国内自拍| 波多野结依一区| 久久久久九九九九| 亚洲91视频| 影音先锋亚洲视频| 中文字幕成人在线观看| 黄色片在线播放| 中文一区二区视频| 欧美gvvideo网站| 亚洲欧美日韩不卡| 亚洲日本成人在线观看| 中文国产字幕在线观看| 久久免费视频网站| 日韩va亚洲va欧美va久久| 在线观看免费黄网站| 欧美一区二区三区日韩视频| 久久影院一区二区三区| 91免费在线观看网站| 成年人午夜久久久| 成人影视在线播放| 欧美成年人视频| 乱人伦精品视频在线观看| 最新中文字幕2018| 亚洲国产毛片完整版| 成人中文在线| 妞干网在线观看视频| 欧美视频一区二区在线观看| 久久国产精品美女| 视频一区二区精品| 亚洲午夜羞羞片| 欧美日韩伦理一区二区| 国产一区二区久久久| 中文字幕五月欧美| 国内激情视频在线观看| 成人福利在线观看| 久久人人爽爽爽人久久久| 免费网站免费进入在线| 欧美亚洲视频在线观看| 国内精品写真在线观看| 女人天堂在线| 91sao在线观看国产| 精品一区二区三区香蕉蜜桃 | 日韩av手机在线观看| 日本视频一区二区| 婷婷国产在线| 久久久久久亚洲| 精品一区二区在线视频| 爱久久·www| 国产精品视频中文字幕91| 91丨porny丨首页| 伊人电影在线观看| av资源站久久亚洲| 一级做a爱片久久| 成人av影音| 欧美精品久久久久久久久久久| 欧美区在线观看| 99国产精品一区二区| av污在线观看| xvideos亚洲人网站| 精品亚洲aⅴ乱码一区二区三区| 91网在线播放| 成人在线精品视频| 亚洲精品福利视频网站| 136国产福利精品导航网址应用| 公共露出暴露狂另类av| 欧美一区二区三区喷汁尤物| 午夜精彩国产免费不卡不顿大片| h动漫在线视频| 国产国产精品人在线视| 自拍偷拍欧美精品| 久久久伦理片| 麻豆一区二区三区视频| 久久久久北条麻妃免费看| 国产成人在线免费| 精品极品在线| 日本精品福利视频| 国产丝袜一区视频在线观看| 久久av资源网| 综合另类专区| 潘金莲一级淫片aaaaaa播放1| 精品成人a区在线观看| 日本中文字幕一区二区有限公司| 国产精品实拍| 日本三级中国三级99人妇网站| 欧美精品丝袜久久久中文字幕| 一本综合久久| 黄页网站大全在线免费观看| 婷婷五月色综合| 亚洲国产精品成人精品| 久久99最新地址| 69堂免费精品视频在线播放| 欧美不卡在线播放| 久久99视频精品| 亚洲人精品午夜| 欧美偷拍自拍| 免费在线一级视频| 欧美日韩另类综合| 亚洲女同精品视频| 91欧美一区二区| 三级精品视频| 波多野结衣在线| 国产精品免费一区二区三区在线观看 | 久久99国产精品久久| 厕沟全景美女厕沟精品| 黄色一级视频在线播放| 欧美激情在线视频二区| 亚洲国产一区二区三区青草影视| 99欧美视频| 老司机av在线免费看| 中文字幕人成一区| 欧美成人免费小视频| 亚洲免费观看高清完整版在线 | 最新中文字幕在线视频| 91九色偷拍| 欧美亚洲综合网| 日韩av不卡在线观看| 日韩免费在线电影| 激情小说激情视频| 国产经品一区二区| 日韩经典一区二区三区| 99久精品国产| 亚洲人成精品久久久 | 91精品福利观看| 九七影院97影院理论片免费| 亚洲精品欧美日韩| 亚洲韩国日本中文字幕| 国产欧美一区二区精品久导航| 青青草成人影院| heyzo高清中文字幕在线| www.99在线| 精品视频一区二区三区四区| 在线播放亚洲激情| 97在线资源| 热99在线视频| 精品视频全国免费看| 国产福利一区二区三区视频在线 | 亚洲精品推荐| 免费黄色在线看| 国产免费人做人爱午夜视频| 69堂成人精品视频免费| 亚洲欧洲视频在线| 亚洲aⅴ怡春院| 国产乱色国产精品免费视频| 精品在线手机视频| av伦理在线| 成人xxxx| 精品视频免费在线播放| 国产精品18毛片一区二区| 久久精品久久久久久| 在线看不卡av| 国产精品午夜免费| 久久精品999| 午夜精品一区二区三区国产| 精品久久福利| 色的视频在线免费看| 四虎国产精品成人免费4hu| 一本一道久久a久久综合精品| 国产精品美腿一区在线看| 尤物yw午夜国产精品视频明星 | 欧美下载看逼逼| 国产91成人video| 亚洲国产成人一区| 亚洲福利一二三区| 91在线云播放| 视频一区欧美日韩| 日韩.com| 精品国产乱码久久久久久樱花| 麻豆传媒在线免费看| 黄色毛片av| 日日摸日日碰夜夜爽av| 日韩区国产区| 亚洲影院在线看| 3344国产精品免费看| 国产一区二区三区三区在线观看| 欧美午夜精品一区二区三区| 亚洲欧洲精品成人久久奇米网| 国产成人综合在线| 午夜亚洲一区| 91超碰成人| 九九亚洲精品| 蜜桃精品视频| 中文在线最新版地址| 成人免费网站在线观看视频| 亚洲52av| 97香蕉久久| 男女人搞j网站| 国内外成人免费激情视频| 最新精品视频| 日韩高清国产精品| 狠狠久久综合婷婷不卡| 国产伦精品一区二区三区精品视频| 欧美精品中文字幕一区| 亚洲欧美日韩国产中文| 精品国产伦一区二区三区观看方式| 色婷婷久久久久swag精品| 一区二区三区在线免费观看| 国产精品久久久久久久久免费丝袜|