国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

一文讀懂大模型 RAG:檢索、增強與生成的技術詳解

人工智能
本文筆者將從RAG所解決的問題及模擬場景入手,詳細總結相關技術細節,與大家分享。

大模型(Large Language Model,LLM)的浪潮已經席卷了幾乎各行業,但當涉及到專業場景或行業細分領域時,通用大模型往往面臨專業知識不足的問題。相對于成本昂貴的“Post-Training”或“Supervised Fine-Tuning”(監督微調,SFT),基于RAG的技術方案成為了一種更優選擇。

本文筆者將從RAG所解決的問題及模擬場景入手,詳細總結相關技術細節,與大家分享~

一、初識:RAG所解決的問題及模擬場景

1. 大模型“幻覺”問題

在探討RAG技術的必要性之前,我們首先需要理解大模型中有名的“幻覺”問題。

所謂“幻覺”,是指大模型在試圖生成內容或回答問題時,輸出的結果并不完全正確,甚至會有錯誤,即通常所說的“一本正經地胡說八道”。因此,「這種“幻覺”可以提現在對事實的錯誤陳述與編造、錯誤的復雜推理或在復雜語境下處理能力不足等。」

而產生這種“幻覺”的主要原因是:

  • 訓練知識存在偏差:在訓練大模型時輸入的海量知識可能包含錯誤、過時,甚至帶有偏見的信息。這些信息在被大模型學習后,就可能在未來的輸出中被重現。
  • 過度泛化地推理:大模型嘗試通過大量的語料來學習人類語言的普遍規律與模式,這可能導致“過度泛化”的現象,即把普通的模式推理用到某些特定場景,就會產生不準確的輸出。
  • 理解存在局限性:大模型并沒有真正“理解”訓練知識的深層含義,也不具備人類普遍的常識與經驗,因此可能會在一些需要深入理解與復雜推理的任務中出錯。
  • 缺乏特定領域的知識:通用大模型雖然掌握了大量人類通用知識且具備超強的記憶與推理能力,但可能不是某個垂直領域的專家(比如醫學或者法律專家)。當面臨一些復雜度較高的領域性問題或私有知識相關的問題時(比如介紹企業的某個新產品),它就可能會編造信息并將其輸出。

除了“幻覺”問題,大模型還可能存在知識落后、輸出難以解釋、輸出不確定等問題。

這也決定了大模型在大規模商業生產應用中面臨著挑戰:很多時候,我們不僅需要大模型具備理解力和創造力,還需要極高的準確性。例如,在金融風險評估、醫療診斷、法律咨詢等領域,任何錯誤的輸出都可能導致嚴重的后果。因此,解決“幻覺”問題是提升大模型實際應用價值的關鍵。

2. RAG如何解決“幻覺”問題?

RAG(Retrieval-Augmented Generation,檢索增強生成)技術正是為了盡可能解決大模型在實際應用中面臨的一些問題,特別是“幻覺”問題而誕生的。其基本思想可以簡單表述如下:

將傳統的生成式大模型與實時信息檢索技術相結合,為大模型補充來自外部的相關數據與上下文,以幫助大模型生成更豐富、更準確、更可靠的內容。這允許大模型在生成內容時可以依賴實時與個性化的數據與知識,而不只是依賴訓練知識。

換句話說,RAG給大模型增加了一個可以快速查找的知識外掛,使得它在面對特定問題時能夠參考最新的、權威的信息源,從而減少錯誤輸出和“幻覺”的發生。

為了更進一步幫助我們理解RAG的概念,舉個例子。

如果把大模型比喻成一個經過大量醫學知識與治療技能訓練的優秀學生,大模型響應的過程比喻成一場醫學考試,那么這個學生在考試時仍然可能會對某些最新的治療方法并不熟悉,他可能會根據自己的記憶和推理能力編造答案(即“幻覺”),導致錯誤。 而RAG會從最新的醫學文獻中檢索相關信息,并提供給學生作為參考。這樣,學生就可以基于最新的專業知識來回答問題,避免了“幻覺”,提高了答題的準確性和可靠性。

3. 模擬簡單的RAG場景

假如你需要開發一個在線的自助產品咨詢工具,允許客戶使用自然語言進行交互式的產品問答,比如“請介紹一下您公司這款產品與××產品的不同之處”。為了讓客戶有更好的體驗,你決定使用大模型來構造這樣的咨詢功能并將其嵌入公司的官方網站。如果你直接使用通用大模型,那么結果很可能如下所示。

用戶提問:

請介紹小麥公司的最新手機產品小麥Pro與iPhone有什么區別?

[引用]

不出意外,大模型顯然不具備貴公司的最新手機產品知識,因此無法回答客戶的問題(有時候可能會嘗試編造答案)。現在,如果你使用RAG的思想,那么可以先從企業私有的知識庫中「檢索出下面一段相關的補充知識」:

小麥Pro手機參數簡覽:

  • 系統:安卓最新版本
  • 處理器:高性能八核處理器
  • 顯示屏:6.7英寸AMOLED全面屏,2K分辨率
  • 后置攝像頭:主攝像頭6400萬像素,四攝系統
  • 前置攝像頭:3200萬像素,AI美顏、HDR功能
  • 內存與存儲:最高可選12GB運行內存,最高512GB存儲空間
  • 電池:5000mAh大容量電池,支持快速充電
  • 網絡:支持5G網絡,Wi-Fi6,藍牙5.2

其他特性:IP68防水防塵,面部識別和指紋識別解鎖 小麥Pro以其強大的性能、清晰的顯示效果、出色的攝像能力以及長久續航等特點,為用戶提供優質的手機體驗。

你再把檢索出的補充知識組裝到提示詞中,將其輸入大模型,并要求大模型基于提供的知識來回答你的問題。大模型很聰明地“吸收”了補充的外部知識,并結合自己已經掌握的知識,成功推理并給出了答案:

RAG增強后的回答:

小麥Pro手機與iPhone12之間的主要區別可以從以下幾個方面來比較:

操作系統:

  • 小麥Pro采用安卓最新版本作為操作系統,而iPhone12運行的是蘋果自家的iOS操作系統。這意味著兩者的用戶界面、應用生態系統、功能和定制性可能會有所不同。 處理器性能:
  • 小麥Pro配備了一款高性能的八核處理器,而iPhone12搭載了蘋果自家設計的A14仿生芯片。盡管具體的性能表現可能需要進行實際測試來比較,但兩者都應該能夠提供流暢的用戶體驗。 顯示屏:
  • 小麥Pro采用了6.7英寸的AMOLED全面屏,分辨率達到了2K級別,而iPhone12則配備了6.1英寸的屏幕。 其他特性:
  • 小麥Pro擁有更大的電池容量(5000mAh),支持更快的充電速度,并且具備更高的防水防塵等級(IP68)。

二、RAG基礎概念

1. 什么是RAG?

「RAG(Retrieval-Augmented Generation,檢索增強生成)」是一種結合了檢索和生成技術的自然語言處理(NLP)模型。該模型由Facebook AI提出,旨在提升生成式模型在處理開放域問答、對話生成等任務中的性能。

RAG模型通過引入外部知識庫,利用檢索模塊(Retriever)從大量文檔中提取相關信息,并將這些信息傳遞給生成模塊(Generator),從而生成更加準確和有用的回答或文本。

其核心思想是通過檢索和生成的有機結合,彌補生成模型(如GPT-3、BERT等)在處理知識密集型任務時的不足。在傳統的LLM(大語言模型)應用中,模型僅依賴訓練時學到的知識來回答問題,這導致了知識更新困難、回答可能過時或不準確等問題。而RAG系統通過在生成回答前主動檢索相關信息,將實時、準確的知識作為上下文提供給模型,從而顯著提升了回答的質量和可靠性。

RAG本質上是一種借助“外掛”的提示工程,但絕不僅限于此。它不僅僅是簡單地將外部知識拼接到提示詞中,而是通過一系列優化手段,確保大模型能夠更好地理解和利用這些外部知識,從而提高輸出答案的質量。

2. RAG架構

RAG模型的技術架構可以分為兩個主要模塊:檢索模塊(Retriever)和生成模塊(Generator)。

  • 檢索模塊:負責從大規模的知識庫或文檔集合中,使用預訓練的雙塔模型(dual-encoder)進行高效的向量化檢索,快速找到與查詢最相關的若干個文檔或段落。
  • 生成模塊:根據檢索到的文檔和輸入查詢生成最終的回答或文本。并使用強大的生成模型(如T5、BART等)對輸入進行處理,確保生成的內容連貫、準確且信息豐富。

3. RAG工作流程

通過結合檢索增強技術,將用戶查詢與外部知識庫中的信息融合,利用大語言模型生成準確、可靠的回答。以下是RAG的完整工作流程:

(1) 知識準備

  • 收集知識文檔:從企業內部文檔、公開數據集、專業數據庫等來源收集相關知識文檔。
  • 預處理:對文檔進行清洗、去重、分段等操作,確保數據質量。
  • 索引化:將處理后的文檔分割為適合檢索的單元(如段落或句子),并建立索引以便快速查找。

(2) 嵌入與索引

  • 使用嵌入模型:利用預訓練的嵌入模型(如BERT、Sentence-BERT等)將文本轉換為高維向量表示。
  • 存儲向量:將生成的向量存儲在向量數據庫(如FAISS、Elasticsearch、Pinecone等)中,構建高效的索引結構。

(3) 查詢檢索

  • 用戶查詢向量化:將用戶的自然語言查詢通過嵌入模型轉換為向量表示。
  • 相似度計算:在向量數據庫中計算查詢向量與存儲向量之間的相似度(通常使用余弦相似度或歐氏距離)。
  • 檢索結果排序:根據相似度得分,選擇若干個最相關的文檔或段落作為檢索結果。

(4) 提示增強

組裝提示詞:將檢索到的相關文檔內容與原始用戶查詢組合成一個新的輸入序列。

優化提示模板:根據任務需求設計提示模板,確保生成模塊能夠充分利用檢索到的信息。例如:

用戶查詢:請介紹小麥Pro手機與iPhone的區別。 檢索結果:小麥Pro采用安卓系統,配備高性能八核處理器,6.7英寸AMOLED屏幕,5000mAh電池。 增強提示:基于以下信息回答問題:“小麥Pro采用安卓系統,配備高性能八核處理器,6.7英寸AMOLED屏幕,5000mAh電池。”

(5) 生成回答

  • 輸入增強提示:將增強提示模板輸入生成模塊(如T5、BART、GPT等)。
  • 生成文本:生成模塊根據提示模板生成最終的回答,綜合考慮檢索到的知識和自身的訓練知識。
  • 后處理:對生成的回答進行格式調整、語法檢查等后處理,確保輸出的質量和一致性。
責任編輯:趙寧寧 來源: 小喵學AI
相關推薦

2025-05-20 11:55:22

人工智能Vision RAGLLM

2024-07-08 12:44:11

2025-04-10 00:12:00

2024-06-24 14:32:33

2025-04-01 07:00:00

2025-04-29 09:15:49

AI數據模型

2022-07-26 00:00:03

語言模型人工智能

2025-03-10 08:00:00

RAG檢索Reranker

2025-05-09 09:00:00

模型融合人工智能神經網絡

2025-05-28 01:25:00

RAG人工智能語言模型

2024-06-24 08:05:00

人工智能AI

2022-09-27 13:34:49

splice零拷貝原理

2024-03-20 10:31:27

2023-10-14 17:46:17

RAG提示工程GPT-3

2018-10-30 11:10:05

Flink數據集計算

2023-11-20 14:58:30

人工智能AI Agents

2024-05-28 09:24:32

2025-05-30 01:00:00

RAG大模型流程

2024-05-20 08:31:33

檢索增強生成LLM大型語言模型

2022-05-12 08:01:18

KubernetesDocker容器
點贊
收藏

51CTO技術棧公眾號

欧美jizz| 久久综合社区| 久久激五月天综合精品| 精品国产一区二区三区四区在线观看 | 亚洲黄色大片| 欧美成人激情图片网| 久草在线青青草| 国产精品沙发午睡系列990531| 国产免费一区二区三区| 国产伦理久久久久久妇女 | 免费欧美一级视频| 国产一区二区三区四区三区四 | 日韩电影免费看| 91成人免费在线| 黄色三级电影网站| 国产欧美精品一区二区色综合| 亚洲欧洲精品一区二区| 久久婷婷亚洲| 国产另类自拍| 亚欧美无遮挡hd高清在线视频| 欧美夫妻性生活视频| 国产精品探花在线| 精品国产人成亚洲区| 国产美女福利在线| 欧美挠脚心视频网站| 国产高清一区在线观看| 亚洲aaa精品| 香蕉自在线视频| 亚洲永久精品大片| 亚洲图区欧美| 狠狠色狠狠色综合日日小说| 在线看片你懂得| 色久优优欧美色久优优| 国产精品一级伦理| 日韩欧美亚洲另类制服综合在线 | 久久九九精品| 日韩高清av电影| 国产精品一区在线| 黄色三级视频在线| 色综合久久综合网97色综合| 嫩草在线播放| 国产丝袜一区视频在线观看| 美女搞黄视频在线观看| 国产亚洲欧美aaaa| 国偷自产视频一区二区久| 国产成人精品久久二区二区| 日本国产亚洲| 欧美一区三区三区高中清蜜桃| 成人无号精品一区二区三区| 成人精品网站在线观看| 蜜臀av亚洲一区中文字幕| 亚洲熟妇av一区二区三区漫画| 亚洲综合在线观看视频| 羞羞视频在线观看不卡| 中文字幕欧美日韩在线| 精品久久中文| 粉嫩喷白浆久久| 国产精品入口久久| 亚洲精品国产拍免费91在线| 波多野吉衣av| 国产精品久久久久久av福利软件| 91视视频在线观看入口直接观看www | 欧美精品做受xxx性少妇| 网曝91综合精品门事件在线| 久久99精品久久久久久水蜜桃| 激情综合色播五月| 免费在线你懂的| 午夜精品久久久久久久男人的天堂 | 最新国产在线拍揄自揄视频| 555www成人网| 国产精品中文字幕日韩精品 | 亚洲影院在线看| 久久这里只精品最新地址| 99re6在线精品视频免费播放| 午夜精品久久久久久久男人的天堂| 男人的天堂成人在线| 四虎精品成人影院观看地址| 51精品在线观看| 99久久精品一区二区| 欧美极品少妇videossex| 91黄色免费版| 久久综合99| 亚洲91av| 成人免费在线小视频| 国产欧美精品久久久| 亚洲欧美日韩成人| 欧美性生交xxxxxdddd| 欧美极品xxx| 久久国内精品视频| 99久久99热这里只有精品| 另类中文字幕国产精品| 日漫免费在线观看网站| 免费毛片小视频| 欧美 日韩 国产 在线观看| 日韩视频免费观看高清在线视频| 久久国产婷婷国产香蕉| 四季av在线一区二区三区| 久久免费影院| 伊人在线视频| 国产九九在线视频| 久久99精品久久久久子伦| 欧美激情2020午夜免费观看| 欧美性色黄大片| 国产精品久久久久久久午夜片| 国产精品久久久久久模特| 日韩高清影视在线观看| 中文字幕日本一区二区| 在线观看操人| 美女激情网站| 日韩精品一区二区三区蜜臀| 久久国产亚洲精品| 国产95亚洲| 国产精品亚洲一区二区在线观看| 中文字幕在线播放网址| 免费黄色在线视频网站| 一个人免费视频www在线观看| 在线观看成人影院| 中文字幕视频在线免费观看| 久久夜色精品国产亚洲aⅴ| 国产视频精品va久久久久久| 欧美高清性hdvideosex| 欧美日韩在线视频一区| 午夜久久久久久久久久一区二区| 福利视频导航一区| 一区二区三区av电影| 一区二区不卡在线播放 | 一女二男3p波多野结衣| aa在线观看视频| 日韩亚洲欧美视频| 天天综合狠狠精品| 欧美一卡2卡3卡4卡无卡免费观看水多多| 日本高清视频精品| 日产精品久久久一区二区福利| 国产91ⅴ在线精品免费观看| 青青久久aⅴ北条麻妃| 亚洲free嫩bbb| 亚洲国产一区二区三区在线| 日本久久久久久久久久久久| 九色在线视频蝌蚪| 欧美肥婆姓交大片| 影音先锋久久| 欧美a级在线| 欧美国产偷国产精品三区| 国产福利资源一区| 成人在线免费| 成人性生活视频| 666av成人影院在线观看| 国产传媒在线| 青草av在线| 天堂аⅴ在线地址8| 在线观看麻豆| 亚洲丝袜一区| 成人国产一区| 亚洲精品18| 久久91精品| 欧美日韩1区2区3区| 视频一区在线视频| 99久久综合国产精品| 成人高清视频在线观看| 亚洲人成7777| 欧美性生活大片免费观看网址| 婷婷六月综合网| 精品性高朝久久久久久久| 亚洲毛片在线免费观看| 日韩有码视频在线| 国产国产精品人在线视| 色播亚洲视频在线观看| 青青草原国产免费| 成人蜜桃视频网站网址| 伪装者免费全集在线观看| 九色porny在线| 国产精品第一| 91精品天堂福利在线观看| 欧美手机在线| 国产激情91久久精品导航 | 日韩中文字幕在线观看| 国产成一区二区| 欧美12av| 免费毛片aaaaaa| 久草在线资源站手机版| 亚洲日本视频在线| 国产精品嫩草99av在线| av欧美精品.com| 亚洲超碰精品一区二区| 日韩最新在线视频| 91亚洲精品久久久久久久久久久久| 超碰97在线看| av在线资源站| 欧美系列电影免费观看| 国产一区二区中文字幕| 亚洲另类在线一区| 在线播放国产一区中文字幕剧情欧美| 成人av资源在线播放| 国产a级片网站| 青青草原国产在线| 韩国一区二区三区在线观看| 中文字幕av一区二区三区免费看| 国产婷婷色综合av蜜臀av| 精品视频导航| 啦啦啦啦免费高清视频在线观看1|