国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

超越GPT-4o!開源科研神器登場,4500萬篇論文檢索增強生成靠譜回答

人工智能 新聞
這是由華盛頓大學和艾倫人工智能研究所(Ai2)打造的最新模型OpenScholar。

只需幾秒鐘,開源模型檢索4500篇論文,比GPT-4o還靠譜!

這就是由華盛頓大學和艾倫人工智能研究所(Ai2)打造的最新模型OpenScholar

它還是首個從論文到數據集、模型檢查點都完全開源的科研助手模型。

圖片

在由20位專家進行的500次對比實驗中,72%的情況下他們都覺得OpenScholar的輸出結果超越了人類。

圖片

而且OpenScholar還會附上參考文獻列表,非常貼心:

圖片

圖片

它的功能也非常豐富。

你可以詢問OpenScholar某個研究課題的現狀:“有沒有人嘗試過將檢索增強型LM的檢索庫擴大到萬億級tokens?”

圖片

尋找最新的數據集

圖片

針對某篇論文詢問技術細節

圖片

或者詢問算法的細節,比如機器人算法/ReLU算法等等:

圖片
圖片

有多位網友使用過后表示:做復雜課題也能快速搜集有用的資料,真是科研神器!

圖片
圖片

僅調用8B模型

一句話總結:它存儲了4500萬篇論文的大規模數據,并使用自定義訓練的檢索器、重排器和8B參數語言模型進行檢索,并根據最新的科學文獻內容回答問題。

圖片

具體來說,OpenScholar-8B(OS-8B)系統包括以下組件:

1.開放學者數據存儲:包含超過4500萬篇論文、以及對應的約2.5億段落嵌入。底層論文數據截止到2024年10月。

2.專業檢索器和重排序器:這些工具專門用于從科學文獻數據存儲庫中識別相關段落。

3.專業8B語言模型:這是一個針對科學文獻綜合任務優化的8B參數語言模型,在性能與計算效率之間取得了很好平衡。團隊基于來自迭代自我反饋生成管道生成的合成數據訓練并微調了Llama 3.1 8B。

4.迭代自我反饋生成:在推理過程中,團隊使用迭代自我反饋來通過自然語言反饋精煉模型輸出。每次迭代都額外檢索更多論文,使模型能夠提高回答質量并縮小引用差距。

為了評估 OpenScholar,團隊還開發了ScholarQABench——一個專門用于評估從多篇論文中綜合信息以解決開放式科學問題的基準。

ScholarQABench包含七個數據集:三個專注于單篇論文評估的現有數據集,以及四個需要跨多篇論文綜合的新收集數據集。

圖片

最終在實驗自動評估以及人工評估中,OpenScholar模型的表現優于很多主流模型,包括GPT-4o和Llama 3.1 70B。

圖片

搜索的可靠性方面,OpenScholar更是遠超GPT-4o。

GPT-4o在90%以上的情況下都引用了不存在的論文,而OpenScholar的結果都是來自確定來源。

以及在信息覆蓋率、實用性、相關性等多個維度方面,OpenScholar撰寫的結果都優于GPT-4o。

圖片

運營成本便宜100倍

對比基于OpenAI的GPT-4o和Anthropic的Claude的科研模型可以發現,它們雖然性能很強,但價格昂貴、而且工作原理也不透明。

而OpenScholar正是為了挑戰這些現有的大模型玩家入局的!

據開發人員稱,OpenScholar是首個完全開源的科學助手語言模型——從數據到訓練食譜再到模型檢查點,全部公開!

研究人員可以非常清除地看到模型的訓練過程和數據集的內容等,也可以根據自己的工作進行調整。

這樣一來,規模較小、架構簡單的OpenScholar-8B的運營成本比基于GPT-4o構建的同期系統PaperQA2便宜100倍

對于小型機構、資金不足的實驗室以及發展中國家的研究人員來說,這樣的運營成本非常有吸引力。

不過,目前OpenScholar也有很多局限,比如:

1.OpenScholar可能會引用不那么具有代表性的論文。

例如,在描述特定方法時,它可能未能引用提出該方法的原始論文,而是引用了提及該方法的另一篇論文。

2.OpenScholar有時可能會生成沒有參考文獻支持的響應,或者檢索到該領域不是最相關或最新的論文。

例如:當被問及機器人學中的大型基礎模型時,此響應引用了一篇具有3.07億參數模型的論文,而截至2024年11月,機器人學中當前最大的基礎模型(RT-2)具有550億參數。

3.OpenScholar可能仍然可能生成帶有幻覺的結果,而不是依賴于它檢索到的真實論文。

4.許多科學論文都設置了付費墻

目前出于對版權的尊重,OpenScholar數據存儲庫僅包含公開的論文。這可能會降低模型在較封閉領域回答問題的能力。

團隊表示,未來他們會納入更多論文、升級檢索增強算法,也會對各個領域的經典研究問題和論文進行深入整合,增強OpenScholar的專業程度。

不過,從實驗結果來看,OpenScholar已經是目前表現最好的AI學術研究助理之一啦,感興趣的小伙伴可以直接戳下面的公開資料進行嘗試!

Demo: https://openscholar.allen.ai/
論文: https://openscholar.allen.ai/paper
OpenScholar代碼: https://github.com/AkariAsai/OpenScholar
ScholarQABench數據集代碼: https://github.com/AkariAsai/ScholarQABench
更多測試code: https://github.com/AkariAsai/OpenScholar_ExpertEval

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-05-26 09:05:00

2025-01-03 10:55:22

2025-02-11 08:00:00

大語言模型檢索增強生成CAG

2023-09-11 09:00:00

檢索增強生成大數據模型自然語言處理

2023-10-14 17:46:17

RAG提示工程GPT-3

2025-06-06 14:17:11

模型訓練AI

2025-04-15 08:01:12

2025-06-27 16:06:55

AI網絡模型

2024-09-06 13:00:29

2024-08-14 14:30:00

AI訓練

2024-05-20 08:31:33

檢索增強生成LLM大型語言模型

2025-04-08 02:26:00

2025-07-23 09:32:02

2025-08-07 14:05:40

OpenAI大模型開源

2024-09-05 08:24:09

2024-05-21 12:23:17

2025-04-29 08:20:51

2024-06-05 08:29:35

2024-11-11 09:47:00

AI開源

2025-03-31 08:50:00

AI生成模型
點贊
收藏

51CTO技術棧公眾號

国产色产综合产在线视频| 九九视频免费观看视频精品 | 欧美牲交a欧美牲交| 你懂的一区二区| 国产成人高潮免费观看精品| 99久久国产免费看| 久久久91精品国产一区二区精品| 精品视频在线播放色网色视频| 国产精品丝袜高跟| 欧美色图五月天| 国产偷亚洲偷欧美偷精品| 色在线免费视频| av在线国产精品| 欧美色偷偷大香| 亚洲国产欧美国产第一区| 男人天堂手机在线| 牛牛视频精品一区二区不卡| 国产欧美中文在线| 久久久久久久一区二区| 影音先锋在线亚洲| 奇米777日韩| 亚洲免费网站| 91色九色蝌蚪| 欧美成人午夜剧场免费观看| 99在线观看视频免费| 国产精品一区二区在线观看不卡 | 国产综合香蕉五月婷在线| 人人狠狠综合久久亚洲婷婷| 国产精品久久视频| 欧美va亚洲va日韩∨a综合色| 国产福利一区二区三区在线观看| 在线看片一区| 亚洲一区二区精品在线观看| 国产精品一区二区久激情瑜伽| 国产免费黄色小视频| 国产精品青草久久| 五月天天在线| 6080亚洲精品一区二区| 偷拍自拍在线看| 精品自在线视频| 国产精品福利在线观看播放| 日韩成人av电影在线| 成人av免费观看| 色资源网在线观看| 欧美成人精精品一区二区频| 亚洲欧美在线人成swag| 国产精品99久久久久久久久久久久| 亚洲精品一区二区妖精| 99re99热| 亚洲日本丝袜连裤袜办公室| 在线日本视频| 久久视频在线免费观看| 欧美jizz| 丰满的少妇愉情hd高清果冻传媒 | 五月天激情视频在线观看| 午夜影院在线观看欧美| 七七久久电影网| 97国产成人精品视频| 一区二区福利| 午夜精品在线免费观看| 欧美午夜免费电影| 国产午夜精品一区在线观看| 91久久伊人青青碰碰婷婷| 国产91在线看| 欧美成人综合在线| 久久精品中文字幕一区| 中文字幕亚洲精品乱码| 大伊香蕉精品视频在线| 欧美视频第一页| 成人在线视频免费| 成人一区二区电影| 99久久精品99国产精品| 免费黄色在线| 国产精品成人久久久久| 成人视屏免费看| 在线观看美女网站大全免费| 国语自产精品视频在线看一大j8| 国产欧美日韩综合一区在线播放| 欧美日韩一区二区在线免费观看| 91精品在线一区二区| 国产精品三级| 操bbb操bbb| 欧美性大战久久| 欧洲亚洲成人| 成人免费在线视频播放| 欧美电影一区二区| 色综合五月天| 高清一区在线观看| 最近中文字幕2019免费| 日日夜夜精品视频天天综合网| 成人动漫av| 超在线视频97| 国产老妇另类xxxxx| 免费在线观看av| 国产欧美久久久久久| 91一区在线观看| 99热国产在线| 99re在线国产| 亚洲综合在线免费观看| www.久久热| 国产一二三区在线播放| 精品国产不卡一区二区三区| 国产精品99免费看| 亚洲精品无码专区在线播放| 欧美中文字幕在线观看| 国产欧美日韩综合| 成人免费在线观看视频| 日韩欧美一区二区视频在线播放 | 欧美挠脚心网站| 国产精品高潮呻吟视频| 久久久久亚洲蜜桃| 国产精品99| 国产精品免费看久久久无码| 欧美成人欧美edvon| 国语精品一区| 国产香蕉在线| 国产999精品视频| 中文字幕欧美日韩一区| 91亚洲精品视频在线观看| www.玖玖玖| 久热99视频在线观看| 本田岬高潮一区二区三区| 涩涩在线视频| 黑人巨茎大战欧美白妇| 亚洲国产精品久久久久| 日韩和欧美一区二区三区| 99中文字幕一区| 国产一区二区三区高清| 51精品秘密在线观看| 一区二区高清| 国产乱码在线| 好色先生视频污| 亚洲欧美一区二区三区在线| 国产乱淫av一区二区三区 | 日本网站在线观看一区二区三区 | jizz视频在线观看| 性欧美亚洲xxxx乳在线观看| 亚洲综合精品| 超碰国产精品一区二页| 欧美日韩综合网| 中文字幕一区二区三区不卡在线 | 精品麻豆剧传媒av国产九九九| 91香蕉视频网址| 中文字幕av一区二区| 国产一区二区视频在线| 一级毛片免费高清中文字幕久久网| 黄色av免费在线观看| 好看的日韩精品视频在线| 亚洲人成网站色在线观看| 亚洲视频一区| 欧美一级精品| 激情视频网址| 色综合电影网| 777午夜精品视频在线播放| 五月开心六月丁香综合色啪| 一二三区在线观看| 成人两性免费视频| 亚洲综合色丁香婷婷六月图片| 欧美成人一品| 欧美va在线观看| 色老板在线视频| 国产精品偷伦一区二区| 88在线观看91蜜桃国自产| 男女精品网站| 欧美韩国日本| 国产精品后入内射日本在线观看| 亚洲欧美精品伊人久久| 久久综合九色综合欧美亚洲| 亚洲三级性片| 欧美高清电影在线| 91最新国产视频| 亚洲国产成人在线播放| 亚洲国产视频直播| 成人免费视频国产在线观看| 欧美日韩亚洲一区二区三区在线| 精品毛片免费观看| 日韩电影大全网站| 久久久久久久久久久99| 精品久久久久99| av电影天堂一区二区在线 | 国内视频一区| 亚洲国产精品久久精品怡红院| 91美女片黄在线观看| 无码日韩精品一区二区免费| 牛牛精品在线| 欧洲亚洲精品久久久久| 毛片无码国产| 最新av网站在线观看| 四虎在线观看| 9色porny| 久久国内精品一国内精品| 亚洲国产毛片aaaaa无费看| 日本va欧美va精品| 国产欧美日韩在线观看视频| 6699嫩草久久久精品影院| 99reav| 四虎永久免费网站| 成人激情av在线| 日韩一区二区精品视频| 欧美色图第一页|