国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

信息抽取哪家強?ChatGLM3、Qwen、Baichuan2、ChatGPT

發布于 2024-6-18 10:21
瀏覽
0收藏

信息抽取中文開源大模型評測

信息提取(IE)在自然語言處理(NLP)中扮演著至關重要的角色,它通過從非結構化文本中提取結構化信息,從而促進與依賴結構化數據的各種現實世界應用的無縫集成。深入探討了主流中文開源LLMs在處理IE任務時的表現,特別是零樣本條件下,即模型未針對特定任務進行微調。

模型選擇:共選擇了5個大型語言模型(LLMs)進行實驗:ChatGLM3-6B、Qwen-7BChat和Qwen-14B-Chat、Baichuan2-13B-Chat以及ChatGPT2。除了ChatGPT外,所有其他大型語言模型都是開源的。

實驗設置:所有的實驗都可以在1個A40 GPU上完成。

數據集

信息抽取哪家強?ChatGLM3、Qwen、Baichuan2、ChatGPT-AI.x社區

NER實驗結果:

在MSRA和微博數據集上進行的零樣本實驗的結果。加粗的值代表了在相同數據集上所有大型語言模型(LLMs)和開源大型語言模型中最高的分數。

信息抽取哪家強?ChatGLM3、Qwen、Baichuan2、ChatGPT-AI.x社區

  • 在所有大型語言模型中,ChatGPT-3.5-Turbo表現最佳,在所有數據集和方法中實現了最高的F1分數。在所有開源大型語言模型中,Qwen-14B-Chat在MSRA數據集上取得了最高的F1分數,而Baichuan-13B-Chat在微博數據集上記錄了最高的F1分數。
  • 在所有開源大型語言模型中,具有13B/14B參數的LLM一致性地在相同方法和數據集的準確性上超過了具有6B/7B參數的LLM。除了Baichuan13B-Chat在微博數據集上使用2-Stage方法得到的F1分數比Qwen-7B-Chat低0.55之外,所有具有13B/14B參數的模型在相同方法和數據集上都展示了比具有6B/7B參數的模型更好的F1分數。背后的可能原因是更大的LLM可能包含更多與實體識別相關的知識,從而帶來更準確的分類結果。
  • 在模型保持不變的情況下,MSRA數據集上的F1分數高于微博數據集。這種差異可以歸因于幾個因素。首先,兩個數據集的固有難度水平不同。其次,MSRA數據集的來源是報紙媒體,包含書面語言,而微博數據集來源于社交媒體,更加口語化。在這些因素中,模型的內在知識與書面語言更為一致,使其更擅長從書面文本中提取信息。


RE實驗結果:

零樣本關系抽取在DuIE2.0數據集的20000個子集上的實驗結果(%)。對于每個大型語言模型(LLM),我們用加粗標記更好的結果,以比較兩個框架。

信息抽取哪家強?ChatGLM3、Qwen、Baichuan2、ChatGPT-AI.x社區

  • 大多數大型語言模型(LLMs)在使用類型約束時表現良好,但沒有類型約束時性能顯著下降。沒有類型約束時,每個LLM需要從50種關系類型中選擇一個,而約束可以減少LLMs的大量干擾信息。值得注意的是,在某些實體對上,只保留了唯一正確的關系和NoTA(無上述關系)關系。
  • 在傳統的Vanilla框架上的性能優于QA4RE框架。一方面,DuIE2.0數據集的關系抽取(RE)任務對LLMs來說可能并不十分困難,而引入問答(QA)增加了理解的難度。另一方面,在無約束實驗中,向提示中添加了許多不合理的選項(例如,Alice是Bob的出版商)。這些信息干擾了LLMs對關系類型的選擇。
    ?

EE實驗結果:

零樣本事件抽取(EE)實驗的結果。加粗的值代表了所有大型語言模型(LLMs)中的最高分數。

信息抽取哪家強?ChatGLM3、Qwen、Baichuan2、ChatGPT-AI.x社區

考慮到EE任務對模型閱讀理解能力的更高要求,只有兩階段分解方法能夠產生更清晰的回答。ChatGPT繼續在所有LLMs中以最高的F1分數領先,這在很大程度上歸功于其在提示中把握復雜輸出格式要求的卓越能力。在開源模型中,Baichuan2-13B-Chat展示了最佳性能;然而,其F1分數仍然比ChatGPT低31.22分。

NER、EE、RE的Prompt模板

信息抽取哪家強?ChatGLM3、Qwen、Baichuan2、ChatGPT-AI.x社區

信息抽取哪家強?ChatGLM3、Qwen、Baichuan2、ChatGPT-AI.x社區

信息抽取哪家強?ChatGLM3、Qwen、Baichuan2、ChatGPT-AI.x社區

https://arxiv.org/pdf/2406.02079
Assessing the Performance of Chinese Open Source Large Language Models in Information Extraction Tasks

兼看開源IE大模型:YAYI-UIE

雅意信息抽取統一大模型 (YAYI-UIE)在百萬級人工構造的高質量信息抽取數據上進行指令微調,統一訓練信息抽取任務包括命名實體識別(NER),關系抽取(RE)和事件抽取(EE),實現通用、安全、金融、生物、醫療、商業、個人、車輛、電影、工業、餐廳、科學等場景下結構化抽取。

信息抽取哪家強?ChatGLM3、Qwen、Baichuan2、ChatGPT-AI.x社區

訓練數據,百萬級語料中文54%,英文46%;其中數據集包括12個領域包括金融,社會,生物,商業,工業制造,化學,車輛,科學,疾病醫療,個人生活,安全和通用。覆蓋數百個場景

信息抽取哪家強?ChatGLM3、Qwen、Baichuan2、ChatGPT-AI.x社區

指令樣例/Sample Prompts

實體抽取任務/NER task

文本:xx
【實體抽取】抽取文本中可能存在的實體,并以json{人物/機構/地點:[實體]}格式輸出。
Text:
From the given text, extract all the entities and types. Please format the answer in json {person/organization/location:[entities]}.

關系抽取任務/RE tasks

文本:xx
【關系抽取】已知關系列表是[注資,擁有,糾紛,自己,增持,重組,買資,簽約,持股,交易]。根據關系列表抽取關系三元組,按照json[{'relation':'', 'head':'', 'tail':''}, ]的格式輸出。
Text:
From the given text, extract the possible head entities (subjects) and tail entities (objects) and give the corresponding relation triples.The relations are [country of administrative divisions,place of birth,location contains]. Output the result in json[{'relation':'', 'head':'', 'tail':''}, ].

事件抽取任務/EE tasks

文本:xx
已知論元角色列表是[質押方,披露時間,質權方,質押物,質押股票/股份數量,事件時間,質押物所屬公司,質押物占總股比,質押物占持股比],請根據論元角色列表從給定的輸入中抽取可能的論元,以json{角色:論元,}格式輸出。
Text:
Given the text and the role list [seller, place, beneficiary, buyer], identify event arguments and roles, provide your answer in the format of json{role:name}.

github:https://github.com/wenge-research/YAYI-UIE
模型:https://huggingface.co/wenge-research/yayi-uie
數據集:https://huggingface.co/datasets/wenge-research/yayi_uie_sft_dat

本文轉載自??PaperAgent??

收藏
回復
舉報
回復
相關推薦
色视频网站在线| 在线视频cao| 蜜臀av色欲a片无码精品一区| 色综合老司机第九色激情| 国产综合色在线视频区| 国产一二区在线观看| 亚洲伊人一本大道中文字幕| 一区二区三区日韩欧美| 一区二区成人在线| www久久久久| 成人黄色小视频| 成人黄色免费电影| 高清一区二区三区视频| 欧美日韩成人一区| 免费成人av资源网| 偷拍自拍一区| 中文字幕一区二区三区精彩视频| 97人人模人人爽人人喊38tv| 成人精品久久久| 国产在线精品一区| 成人做爽爽免费视频| 久久久精品在线观看| 欧美午夜www高清视频| 在线视频日本亚洲性| 日韩精品视频在线观看免费| 日韩精品一区二区三区swag| 中文字幕综合在线| 国产福利视频一区二区| 亚洲风情亚aⅴ在线发布| 影音先锋欧美精品| 欧美成人h版在线观看| 天天综合天天做天天综合| 国产主播福利在线| 一区二区三区精品99久久| 日韩一二三区| 蜜桃视频www网站在线观看| 日韩av在线播放网址| 亚洲永久精品免费| 日韩经典中文字幕一区| 中文精品电影| 亚洲无限乱码一二三四麻| 亚洲综合欧美日韩| 国产精品18久久久久久vr| 国产一区久久| 日韩不卡手机在线v区| 999久久久国产999久久久| 中文在线√天堂| 中文字幕校园春色| 传媒在线观看| 簧片在线观看| 自拍一区在线观看| h片在线播放| 精品一区二区三区视频在线播放| 国产麻豆一区二区三区| 成人影院在线| 91久久黄色| 国产欧美一区二区精品性| 色久优优欧美色久优优| 日韩欧美国产三级电影视频| 色播五月激情综合网| 欧美成人精品一区二区男人看| 8x海外华人永久免费日韩内陆视频 | 97国产精品久久| 国产在线久久久| 日韩欧美99| 浮妇高潮喷白浆视频| 欧美色图天堂| 国产sm精品调教视频网站| 久久婷婷成人综合色| 欧美日韩一区二区三区视频| 国产精品女主播视频| 亚洲高清在线免费观看| 交视频在线观看国产| 日本在线看片免费人成视1000| 久热久精久品这里在线观看 | 一区二区精品在线观看| 成人信息集中地欧美| 国产成人av影视| 少妇av在线| 爽爽淫人综合网网站| 中文字幕欧美国内| 最新天堂中文在线| 水蜜桃久久夜色精品一区的特点| 精品国产自在精品国产浪潮 | 97香蕉久久| 欧美动物xxx| 亚洲美女少妇无套啪啪呻吟| 久久久精品2019中文字幕之3| 亚洲男女性事视频| 婷婷四月色综合| 99在线播放| 亚洲**毛片| 天使萌一区二区三区免费观看| 一级特黄大欧美久久久| 亚洲免费中文字幕| 欧美激情第一页在线观看| 99在线视频影院| 久久午夜色播影院免费高清 | 国产精品福利影院| 亚洲三级av在线| 免费无码毛片一区二三区| 日韩精品一卡二卡三卡四卡无卡| 97人人澡人人爽| 美日韩中文字幕| 欧美激情第99页| 中文av资源在线| 99精品视频在线免费观看| 在线电影av不卡网址| 玖草视频在线| 中文在线日韩| 91精品国产品国语在线不卡| 国产成人综合久久| 日本私人网站在线观看| 国产亚洲一区在线| 国产清纯白嫩初高生在线观看91 | 国产日韩欧美一区二区三区乱码 | 99re久久最新地址获取| 欧美激情视频免费观看| 成人免费网站www网站高清| 2023国产精品| 91在线免费观看网站| 天天在线女人的天堂视频| 欧美人成网站| 成人午夜免费视频| 亚洲欧美制服丝袜| 欧美r片在线| 亲子伦视频一区二区三区| 26uuu精品一区二区| 欧美黑人极品猛少妇色xxxxx| 国产免费一区二区三区视频| 一区二区亚洲视频| 天涯成人国产亚洲精品一区av| 白白操在线视频| 亚洲经典自拍| 欧美极品美女电影一区| 992tv在线影院| 麻豆国产欧美日韩综合精品二区| 日韩中文字幕亚洲| 亚洲日本视频在线| 国产精品专区h在线观看| 国产精品羞羞答答在线观看| 国产精品h片在线播放| 夜夜春成人影院| 欧美一级淫片播放口| 午夜小视频在线| 成人性生交大片免费看视频在线| 国产精品手机视频| 一区二区三区四区日本视频| 国产精品久久久久久户外露出 | 亚洲国产欧美在线人成| jizz大全欧美jizzcom| 老牛国产精品一区的观看方式| 久久久中文字幕| 超碰个人在线| 亚洲444eee在线观看| 国产女主播在线观看| 曰本一区二区三区视频| 欧美日韩国产91| 快播电影网址老女人久久| 1000部国产精品成人观看| 欧美超碰在线| 久久高清精品| 91一区在线| 99久久综合| 亚洲精品国产首次亮相| 天堂av在线电影| 精品免费在线观看| 日韩一中文字幕| 亚洲成人av在线播放| 国产精品美腿一区在线看| 米奇在线777| 91一区二区| 欧美日韩国产综合久久| 久久亚洲国产精品日日av夜夜| 中文字幕在线免费播放| 精品入口麻豆88视频| 亚洲国产cao| 亚洲一区二区三区午夜| 蜜臀va亚洲va欧美va天堂| heyzo国产| 国产亚洲精品va在线观看| 亚洲欧洲在线播放| 伊人激情综合网| 久久久av一区| 久久久久久久999| 18性欧美xxxⅹ性满足| 97色伦亚洲国产| 国产精品都在这里| 91久久极品少妇xxxxⅹ软件| 久久精品亚洲| 91a在线视频| 亚洲精品自拍| 欧美一级片免费看| 国产精品人人妻人人爽人人牛| 欧美先锋影音| 久久久91精品国产一区不卡| 午夜国产福利在线| 亚洲精品写真福利| 97影院秋霞午夜在线观看| 色呦呦网站在线观看|