国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

<ol id="z3xj0"><font id="z3xj0"><menu id="z3xj0"></menu></font></ol>

<input id="z3xj0"><em id="z3xj0"></em></input>

<span id="z3xj0"></span>

<pre id="z3xj0"><noframes id="z3xj0">

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

賈佳亞團(tuán)隊開源全球首個70B長文本大語言模型，讀論文看小說直接ProMax

作者：金磊 2023-10-09 12:36:08

人工智能新聞

最近，香港中文大學(xué)賈佳亞團(tuán)隊聯(lián)合MIT宣布了一項新研究，一舉打破如此僵局。

家人們，苦長文本久矣的大語言模型（LLM），現(xiàn)在終于有解法了！

就在最近，香港中文大學(xué)賈佳亞團(tuán)隊聯(lián)合MIT宣布了一項新研究，一舉打破如此僵局：

發(fā)布全球首個70B參數(shù)的長文本開源大語言模型——LongAlpaca。

值得注意的是，這次團(tuán)隊開源的LongAlpaca不止是一個單一的大語言模型，實(shí)則是一個系列，包括：

中杯：LongAlpaca-7B
大杯：LongAlpaca-13B
超大杯：LongAlpaca-70B

而在它們完整訓(xùn)練和評測的背后，更為關(guān)鍵的是研究團(tuán)隊精挑細(xì)選、千錘百煉得來的長文本數(shù)據(jù)集LongAlpaca-12k。

并且在自研的大語言模型文本長度拓展方案LongLoRA的加持之下，在最終的結(jié)果上取得了驚艷的成績——

只需兩行代碼、一臺8卡A100機(jī)器，便可將7B模型的文本長度拓展到100k tokens，70B模型的文本長度拓展到32k tokens。

要知道，現(xiàn)在主流的大語言模型都只支持短文本的輸入（LLaMa支持2k tokens、Llama2支持4k tokens）；而我們在實(shí)際使用的過程中往往需要的是長文本的輸入。

例如讓大語言模型去解讀一本小說的劇情，再如讓它幫你分析一篇論文等等。

而以往開源大語言模型要想拓展文本的長度，基本上就是堆算力，動輒消耗100塊以上的GPU或TPU的那種。

不僅計算資源上的消耗巨大，更是由于缺少專精的數(shù)據(jù)集，使得長文本輸入得到結(jié)果也并非那么理想。

這也就是開頭我們提到“苦長文本久矣”的由來了。

那么賈佳亞領(lǐng)銜的研究團(tuán)隊發(fā)布的LongAlpaca的效果具體又是如何呢？

現(xiàn)在一同來體驗下。

“全球首個”的一手體驗

既然是一手體驗，我們主打的就是要把LongAlpaca從方方面面來個評測。

分析某篇論文獲獎原因

首先我們小試牛刀一下，將一篇ICLR的Oral論文（共12487 tokens）“投喂”給LongAlpaca，讓它幫忙分析一下獲獎原因。

一篇論文的文本長度定然不會是像我們平時提問普通問題那般簡短，而且通篇的文字在邏輯上也是環(huán)環(huán)相扣，極具嚴(yán)謹(jǐn)性。

而LongAlpaca在面對如此專業(yè)性的論文，依舊是給出了較為完美的回答，分別從論文提出方法的新穎性、框架的綜合評價，以及實(shí)驗結(jié)果等關(guān)鍵要素進(jìn)行了分析。

最后的總結(jié)是：

總而言之，這篇論文獲獎的關(guān)鍵原因是所提出的Domino方法和評估框架的新穎性、有效性和通用性，推動了切片發(fā)現(xiàn)的最新進(jìn)展。全面的實(shí)驗評估和定量分析為支持概念貢獻(xiàn)提供了強(qiáng)有力的經(jīng)驗證據(jù)。

根據(jù)兩篇論文分析會議風(fēng)格的區(qū)別

從第一個評測內(nèi)容來看，LongAlpaca對于一篇論文內(nèi)容長度的處理上是完全拿捏的。

那么如果“投喂”兩篇，還是對比著來看的那種，它是否依舊能hold住呢？

話不多說，直接“丟進(jìn)去”：

根據(jù)這兩篇論文，比較一下兩個會議的區(qū)別（共25802 tokens）。

同樣的，LongAlpaca依舊是從多個角度，方方面面地去回答這個問題——

論文的結(jié)構(gòu)、技術(shù)的深度、理論與實(shí)驗、表示法，甚至是文章的語言風(fēng)格，都給出了具體的分析結(jié)果。

最后LongAlpaca給出的結(jié)論是：

CVPR的文章風(fēng)格更加具備結(jié)構(gòu)化和實(shí)驗性，專注于描述一種計算機(jī)視覺任務(wù)的方法。

ICLR論文風(fēng)格則是更靈活，專注于證明元學(xué)習(xí)見解的關(guān)鍵公式和理論分析。

提問名著章節(jié)

在感受完LongAlpaca對于論文的分析之后，我們繼續(xù)來看下它能否拿捏更具戲劇性的小說名著。

把《西游記》的節(jié)選片段（共36870 tokens）丟進(jìn)去，并提問：

在《西游記》中，孫悟空為什么在大鬧天宮時期很厲害，但取經(jīng)路上卻屢屢受挫？

LongAlpaca按照《西游記》的故事時間線，分析了在大鬧天宮時孫悟空的傲慢，后來被佛祖限制了能力，以及沿途的妖怪越發(fā)強(qiáng)大等種種的原因。

總結(jié)來說就是：

強(qiáng)大的對手、對他力量的限制、欺騙和缺乏同伴是他在旅途中失敗的最初原因；但隨著時間的推移，他獲得了智慧、經(jīng)驗和戰(zhàn)友，使他最終能夠戰(zhàn)勝更為強(qiáng)大的敵人。

與Llama 2同臺競技

在自身縱向的各項評測后，定然也是少不了橫向的比較。

那么跟大語言模型開源界炙手可熱的Llama 2相比，LongAlpaca的表現(xiàn)又會如何呢？

這輪我們派出的是“大杯”——LongAlpaca-13B選手，向它提出的問題是：

根據(jù)《三體》第一部中的章節(jié)（共32252 tokens），葉文潔為什么要聯(lián)系外星人，而后期又為什么后悔？

LongAlpaca-13B可以說是較為精準(zhǔn)地給出了答案：

葉文潔最初與外星人的接觸既是出于理想主義，也是出于復(fù)仇，但隨著時間的推移，她對人性的看法發(fā)生了變化，她意識到自己可能給全人類帶來了危險，她的遺憾也隨之增加。

反觀Llama 2這邊，同樣是13B量級的大語言模型，做出的回答就有些差強(qiáng)人意了，大部分文字并沒有圍繞問題本身。

只是簡單的提了一句：

最后她感到后悔，因為她意識到她的行為導(dǎo)致了她從未想過的后果。

總而言之，從種種的評測表現(xiàn)來看，LongAlpaca在處理長文本輸入的難題上確實(shí)是做到了較大優(yōu)化。

那么接下來的一個問題便是：

怎么做到的？

左手抓數(shù)據(jù)，右手抓策略，這便是LongAlpaca的應(yīng)對之道。

在數(shù)據(jù)方面，正如我們剛才提到的，訓(xùn)練長文本大語言模型的難點(diǎn)一方面在于缺少公開的長文本對話數(shù)據(jù)。

而且此前長文本模型的訓(xùn)練，大多是在非對話的語料上用 “next-token-generation”的方式進(jìn)行繼續(xù)預(yù)訓(xùn)練。

這種方式雖然能夠align模型對于長文本的位置編碼格式，但缺點(diǎn)也很明顯，就是很難讓模型有較好的對話能力。

因此，賈佳亞團(tuán)隊收集了9k條長文本問答語料對，包含針對名著、論文、深度報道甚至財務(wù)報表的各類問答。

其中，論文相關(guān)問答最為詳細(xì)，包括了“審稿”、“論文對比”、“會議風(fēng)格對比”、“修改意見”，以及針對論文內(nèi)容的提問等。

但畢竟揚(yáng)了“長”也不能忘了“短”，因此賈佳亞團(tuán)隊還從原有的Alpaca數(shù)據(jù)集中挑選了3k左右的短問答語料混合訓(xùn)練。

最終，也就成功構(gòu)建了我們前文提到的LongAlpaca-12k。

接下來，便是策略層面。

正如我們剛才提到的，此前在大語言模型長文本輸入問題上，另一個老大難的問題便是計算資源消耗量巨大。

具體而言，主要就是集中在了自注意力機(jī)制（self-attention）的計算上——開銷隨著文本長度成平方次地增加。

因此，研究團(tuán)隊以此作為突破口，提出了在研的大語言模型文本長度拓展方案LongLoRA；與此同時，還采用了分組和偏移的方式來對全局自注意力機(jī)制進(jìn)行模擬。

△LongLoRA設(shè)計概覽

其中，LongLoRA具體的關(guān)鍵技術(shù)點(diǎn)就是shift short attention，我們姑且稱之為偏置短注意力。

它的核心思想就是用sparse local attention（稀疏局部注意力）替換掉dense global attention（密集全局注意力）。

大概可以理解為檢索時的思想，只需要將匹配度、相似性高的centext拿過來用即可。

如此一來便可以大幅降低計算資源的消耗了。

△shift short attention示意圖

更重要的一點(diǎn)是，LongLoRA的訓(xùn)練只需要2行代碼即可實(shí)現(xiàn)！

此外，LongLoRA還探索了低秩訓(xùn)練的方式。原有的低秩訓(xùn)練方式，如LoRA，無法在文本長度遷移上取得良好的效果。

而LongLoRA在低秩訓(xùn)練的基礎(chǔ)上，引入嵌入層（Embedding layer和 Normalization layers）進(jìn)行微調(diào)，從而達(dá)到可以和全參數(shù)微調(diào)（Full fine-tune）逼近的效果。

對于8k長度的模型訓(xùn)練，相比于全參數(shù)微調(diào)，LongLoRA將顯存消耗從46.3GB降低到25.6GB。

對于64k長度的模型訓(xùn)練，相比于常規(guī)LoRA，LongLoRA將訓(xùn)練時間從90～100小時左右降低到52.4小時。

△全參數(shù)微調(diào)、常規(guī)LoRA和LongLoRA的性能比較

值得一提的是，LongLoRA在各類語言任務(wù)上，包括文本建模（Proof-pile、PG-19）、信息檢索（topic retrieval, passkey retrieval），都展現(xiàn)了優(yōu)異的性能。

并且LongLoRA可以僅在一臺8卡A100機(jī)器上將7B模型的文本長度拓展到100k tokens，將70B模型的文本長度拓展到32k tokens，并且保持出色的語言建模性能。

如何部署？

對于如此“快、好、省”的項目，你是不是迫不及待地想要嘗鮮了呢？

現(xiàn)在，它已經(jīng)在GitHub上開源，并給出了十分詳細(xì)的部署教程。

例如在安裝方面，僅需要簡單六步：

1、在GitHub中fork這個repo。

2、在本地機(jī)器上克隆存儲庫，使用git Clone并粘貼此項目的url。

3、運(yùn)行如下代碼：

pip install -r requirements.txt
pip install flash-attn --no-build-isolation

4、根據(jù)偏好，使用“已發(fā)布模型”和“微調(diào)模型”。

5、通過對話測試模型。

6、部署到自己的demo。

以及還有各種“杯型”的模型、訓(xùn)練過程代碼等等，團(tuán)隊都在GitHub項目中詳細(xì)地展示了出來。

有需求的小伙伴可戳下方鏈接自取了~

GitHub項目地址：https://github.com/dvlab-research/LongLoRA

論文地址：https://browse.arxiv.org/pdf/2309.12307.pdf

責(zé)任編輯：張燕妮來源：量子位

人工智能數(shù)據(jù)

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

亚洲香肠在线观看| 国产亚洲免费的视频看| 日韩欧美亚洲一区| 亚洲人成网站色在线观看| 青梅竹马是消防员在线| 精品国产网站在线观看| 日韩精品一区二区三区中文| 成人精品网站在线观看| 久久精品久久99精品久久| 久久九九国产视频| 色94色欧美sute亚洲线路一久| 1区2区3区在线视频| 欧美老少配视频| 亚洲视频高清| 国产精品久久..4399| 性做久久久久久免费观看| 中文在线资源| 成人黄色午夜影院| 国产精品主播直播| 最新中文在线视频| 色偷偷偷综合中文字幕;dd| 亚洲视频在线免费| avav在线看| 91成人在线观看喷潮| 成人不卡视频| 2014亚洲精品| 久久综合狠狠综合久久激情| 国产三区四区在线观看| 久久成人一区二区| 国产视频一区在线观看一区免费| 国产日韩成人内射视频| 欧美一区二区三区成人| 亚洲第一福利社区| 亚洲精品一区二区三区四区五区| 亚洲黄色av一区| 三级成人在线| 久久99精品久久久久久秒播放器| 亚洲国产高清不卡| 国产后进白嫩翘臀在线观看视频 | 一区二区三区短视频| 国产精品视频免费在线观看| 不卡的av网站| 激情在线小视频| 国产精品白嫩初高中害羞小美女| 国产成人精品一区二区三区四区 | 中文字幕一区二区三区乱码图片 | jlzzjlzz欧美大全| 亚洲色图13p| 欧美freesex交免费视频| 9久久婷婷国产综合精品性色| 亚洲激情视频在线| 99国产精品久久久久久久| 2019一级黄色毛片免费看网| 一区二区三区精品99久久 | 天天av综合| www99热| 日韩亚洲欧美中文在线| 日本中文字幕一区二区有限公司| 色就是色亚洲色图| 青青草原成人在线视频| 久久久久久久网| 新片速递亚洲合集欧美合集| 欧美高清性xxxxhd| 在线免费观看一区| 久久中文字幕av| 四虎免费av| 欧美丰满老妇厨房牲生活| 国产美女久久久久| av漫画网站在线观看| 欧美日韩三区四区| 欧美日韩一区久久| 亚洲激情另类| 二区在线观看| 国产精品国产精品国产专区蜜臀ah| 亚洲美女少妇撒尿| 久久久免费毛片| 亚洲少妇久久久| 九九热这里只有在线精品视| 99re视频精品| 欧美videos粗暴| 日韩伦理在线免费观看| 国产一区二区美女视频| 国产精品99久| 超碰一区二区| 男女日批视频在线观看| xvideos亚洲人网站| 91在线观看高清| 欧美成人精品午夜一区二区| 人妻丰满熟妇av无码区app| 欧美国产在线视频| 亚洲天天做日日做天天谢日日欢| 四虎影视精品| 最近中文字幕在线| 91久久伊人青青碰碰婷婷| 欧美在线免费视屏| 日韩午夜在线电影| 麻豆福利在线观看| 久久观看最新视频| 久久精品电影网站| 国产精品色在线观看| 亚洲精华一区二区三区| 久草网在线视频| 国产精品一区二区三区免费观看 | 精品国产一区二区亚洲人成毛片| 麻豆精品网站| 三妻四妾的电影电视剧在线观看| 日本aa在线观看| 九九久久综合网站| 亚洲综合一二三区| 黄色国产精品| 国产精品25p| 欧洲黄色一级视频| 97视频在线观看网址| 亚洲国产成人tv| 伊人久久婷婷| 爱情岛亚洲播放路线| heyzo亚洲| 国产成人一区二| 在线观看日韩高清av| 免费亚洲电影在线| 国产精久久一区二区| 1024欧美极品| 国产视频不卡| 在线视频免费一区二区| 亚洲免费三区一区二区| 成年人三级视频| 青青草原综合久久大伊人精品| 伊人资源视频在线| 久久久久久a亚洲欧洲aⅴ| 亚洲全黄一级网站| 亚洲精品免费电影| 亚欧成人精品| 精品视频一二| 欧美婷婷久久五月精品三区| 亚洲国产精品www| 欧美激情精品久久久| 色狠狠综合天天综合综合| 久久成人免费日本黄色| 亚洲涩涩av| 欧美日韩在线视频免费观看| 毛片av免费在线观看| 99久久伊人精品影院| 国产亚洲免费的视频看| 五月激情综合网| 国产成人免费高清| 欧美激情1区2区| 国产日韩欧美中文在线| 成年人视频网站在线| 国产麻花豆剧传媒精品mv在线| 国产精品毛片一区视频| 蜜臀久久99精品久久久久久宅男 | 中文字幕亚洲一区二区va在线| 一区二区国产精品| 黑人久久a级毛片免费观看| 超碰在线免费播放| 日本xxxxwwww| www亚洲国产| 成人在线精品视频| 日韩在线观看免费全| 欧美影片第一页| 欧美激情一二三区| 久久国产夜色精品鲁鲁99| 国产精品久久观看| 日韩成人18| 国产伦久视频在线观看| 日韩av成人| 亚洲国产日韩欧美在线观看| 亚洲国产一区二区精品视频 | 椎名由奈jux491在线播放 | 欧美精品videos另类| 欧美三级理论片| 亚洲国产精品一区二区第四页av| 国产国语videosex另类| 国产一区二区三区网站| 精品视频在线免费看| 亚洲欧美一区二区三区孕妇| 处破女av一区二区| 亚洲一区网站| 日韩美女一区二区三区在线观看| 日韩中文视频| 性欧美ⅴideo另类hd| 在线观看一级片| 先锋影音成人资源| 无码制服丝袜国产另类| 蜜桃视频在线观看91| 国产在线久久久| 97精品国产97久久久久久春色 | 99久久人爽人人添人人澡| 51精品在线| 尤物在线视频| 最色在线观看| 国产天堂在线观看| 五月婷婷激情久久| 97国产在线播放| 日本大胆人体视频| 一区高清视频| 天堂√在线观看一区二区| 久久精品一二三区| 国产在线一区二区三区四区| 亚洲最大的免费|

<label id="puoa6"><pre id="puoa6"></pre></label>