国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

如何使用自己的數據和文檔自定義像ChatGPT這樣的大型語言模型

人工智能
本文將展示一個框架,通過使用文檔嵌入為用戶自己的數據提供ChatGPT或GPT-4(或任何其他大型語言模型)的場景。

如果企業提示ChatGPT關于其企業的文檔中包含的內容,它將提供不準確的響應。如果用戶正在處理的應用程序的語言是高度技術性的或特定于某個領域的,那么這可能會出現問題。

為了解決這個問題,用戶可以用自己的定制文檔來增強大型語言模型。本文將展示一個框架,通過使用文檔嵌入為用戶自己的數據提供ChatGPT或GPT-4(或任何其他大型語言模型)的場景。

為大型語言模型提供場景

大型語言模型對場景敏感。如果用戶給它一個簡單的提示,就會根據它們從訓練數據中提取的知識做出反應。但是,如果在提示符前添加自定義信息,則可以修改它們的行為。

例如,如果用戶問ChatGPT這個問題,“使用運行率的風險是什么?”,它會提供一個很長的答案。

ChatGPT給出的一般性答案

但是,用戶可以提示ChatGPT根據特定文檔提供答案。在下面的例子中,問了ChatGPT同樣的問題,但是在提示符前加上了“根據以下文檔回答我的問題”,后面是來自Investopedia公司的一篇關于運行率的文章。這一次,ChatGPT提供了一個不同的答案,從文章的文本中提取。

從文檔中給出ChatGPT場景

ChatGPT根據文檔場景進行響應

這種技術的價值是顯而易見的,特別是在場景非常重要的應用程序中。但是,人工向提示添加場景是不切實際的,特別是有數千個文檔時。

假設企業有一個網站,該網站有數千個頁面,其中包含有關金融主題的豐富內容,并且希望創建一個基于ChatGPT API的聊天機器人,以幫助用戶瀏覽這些內容。用戶需要一種系統的方法來將其提示與正確的頁面相匹配,并使用大型語言模型來提供場景感知的響應。這就是文檔嵌入的用武之地。

使用嵌入捕獲語義

在進入嵌入之前,先為聊天機器人創建一個高級框架:

  1. 用戶輸入提示。
  2. 檢索與提示相關的最佳文檔。
  3. 創建一個新的提示,其中包括用戶的問題以及文檔中的場景。
  4. 給語言模型提供新制作的提示。
  5. 將答案返回給用戶。

為ChatGPT提供場景

從編程的角度來看,除了第2步之外,這個過程非常簡單。那么如何決定哪個文檔與用戶的查詢相關?一個基本的答案是使用經典的索引和關鍵字搜索。更好的解決方案是使用嵌入。

嵌入是一個數字向量(一個數字列表),它捕獲了一條信息的不同特征。嵌入的維度越多,它可以學習的特征就越多。

用戶可以對不同類型的數據使用嵌入。例如,在與圖像相關的任務中,嵌入可以表示不同物體的存在與否,不同顏色的強度,不同物體之間的距離等。

在文本中,嵌入捕獲文本的不同語義方。例如,單詞嵌入可能包含有關單詞是否與城市或國家、動物物種、體育活動、政治概念等相關的信息。在同樣的意義上,短語嵌入創建了單詞序列內容的數字表示。通過測量兩個嵌入向量之間的距離,可以得到它們對應內容的相似度。

通過訓練機器學習模型(通常是深度神經網絡)在大量示例數據集上創建嵌入。在許多情況下,嵌入模型是用于最終應用(例如,文本生成或圖像分類)的相同模型的修改版本。

為文檔創建嵌入數據庫

要將嵌入集成到聊天機器人工作流中,用戶需要一個包含所有文檔嵌入的數據庫。如果文檔已經在數據庫中以純文本形式存在,那么就可以創建嵌入了。如果沒有,需要使用某種技術,例如使用Python Beautiful Soup的網頁抓取來從網頁中提取文本。如果其文檔是PDF文件,例如研究論文,則需要從中提取文本(可以使用Python PyPDF庫執行此操作)。

要為文檔創建嵌入,用戶可以使用在線服務,例如OpenAI的嵌入API。用戶向API提供文檔的文本,它將返回其嵌入。OpenAI的嵌入有1536個維度,是最大的嵌入之一?;蛘呖梢允褂闷渌度敕眨鏗ugging Face或用戶自己的自定義Transformer模型。

一旦有了嵌入,就必須將它們存儲在“矢量數據庫”中。向量數據庫專門用于嵌入,并提供不同的功能,例如基于不同度量(歐幾里得距離,余弦相似度等)的查詢。

Facebook公司的Faiss是一個流行的開源矢量數據庫,它提供了一個豐富的Python庫來托管用戶自己的嵌入數據。另外,可以使用Pinecone,這是一個在線矢量數據庫系統,它抽象了存儲和檢索嵌入的技術復雜性。

現在,用戶已經擁有了創建針對自己的專有數據定制的大型語言模型應用程序所需的一切?,F在可以像下面這樣改變應用程序的邏輯:

  1. 用戶輸入提示
  2. 為用戶提示創建嵌入
  3. 在嵌入數據庫中搜索最接近提示嵌入的文檔
  4. 檢索文檔的實際文本
  5. 創建一個新的提示,其中包括用戶的問題以及文檔中的場景
  6. 給語言模型提供新制作的提示
  7. 將答案返回給用戶
  8. 獎勵:提供一個鏈接到文件,用戶可以進一步獲取信息

使用嵌入和矢量數據庫檢索相關文檔

為了避免人工創建整個工作流,用戶可以使用LangChain,這是一個用于創建大型語言模型應用程序的Python庫。LangChain支持不同類型的大型語言模型和嵌入式,包括OpenAI、Cohere、AI21Labs以及開源模型。它還支持不同的矢量數據庫,包括Pinecone和FAISS。它為不同類型的應用程序提供了現成的模板,包括聊天機器人、問答和活動代理。

關于嵌入的重要考慮

為了正確使用大型語言模型的嵌入,需要記住以下事項:

  • 在用戶使用的嵌入框架中保持一致:確保在整個應用程序中使用相同的嵌入模型。例如,如果用戶選擇OpenAI嵌入,需要確保使用相同的API和模型來創建文檔嵌入、用戶提示嵌入和搜索矢量數據庫。否則,將得到不一致的結果。
  • 令牌限制:每個大型語言模型都有令牌限制。例如,ChatGPT可以保留多達4096個令牌的場景。GPT-4有8000個和32000個令牌限制。許多開源模型限制為2048個令牌。這包括文檔場景、用戶提示和模型響應。因此,用戶必須確保場景數據不會填滿大型語言模型的內存。一個良好的經驗法則是將文檔限制為1000個令牌。如果文檔比這個大,可以將其分成幾個塊,每個部分之間有一點重疊(大約100個令牌)。
  • 使用多個文檔:用戶的回復不必局限于單個文檔??梢詸z索嵌入與提示符相似的幾個文檔,并使用它們來獲取響應。為了確保不會遇到令牌限制,可以為每個文檔分別提示模型。

為什么不微調大型語言模型呢?

為什么不用微調大型語言模型來代替場景嵌入?微調是一個很好的選擇,使用它取決于用戶的應用程序和資源。通過適當的微調,用戶可以從大型語言模型中獲得良好的結果,而無需提供場景數據,從而降低了付費API的令牌和推理成本。然而,微調可能是昂貴和復雜的。使用場景嵌入是一種簡單的選擇,能夠以最小的成本和努力實現。

最后,如果用戶有一個良好的數據收集管道,可以通過根據其目的的微調模型來改進系統。

責任編輯:姜華 來源: 企業網D1Net
相關推薦

2021-07-16 11:00:40

Django用戶模型Python

2024-03-29 15:43:32

大型語言模型人工智能

2023-07-10 08:00:00

2024-03-29 09:00:00

大型語言模型ChatGPT

2023-05-24 14:33:08

GPT-4語言模型

2025-08-19 10:10:46

2023-03-26 00:24:15

2023-07-21 19:16:59

OpenAIChatGPT

2024-04-16 16:14:01

人工智能LLMRAG

2010-10-25 16:05:07

oracle自定義函數

2024-11-21 16:30:21

2023-11-17 15:44:01

2023-02-10 13:12:50

ChatGPTAI

2023-11-23 19:36:58

2024-10-25 08:30:57

計算機視覺神經網絡YOLOv8模型

2024-12-23 08:03:13

2023-04-27 19:02:30

語言模型管理企業數據

2020-11-19 10:50:43

ImportPython代碼

2025-03-04 08:42:19

2024-05-08 17:05:44

點贊
收藏

51CTO技術棧公眾號

91影院未满十八岁禁止入内| 国内精品免费午夜毛片| 成黄免费在线| 欧美群妇大交群的观看方式| 国产尤物视频在线| 中国人与牲禽动交精品| 夜夜春成人影院| 国产一区二区精品免费| 国内久久精品视频| 毛片毛片毛片毛片毛片毛片| 欧美精品aⅴ在线视频| 欧美激情啪啪| 精品免费国产| 亚洲视频一区二区在线| av天在线观看| 久久久视频免费观看| 久久国产精品第一页| 女生裸体视频网站免费观看| 欧美成人video| 永久91嫩草亚洲精品人人| 99蜜桃臀久久久欧美精品网站| 欧美日韩视频专区在线播放| 欧美一级色片| www.中文字幕在线| 欧美一区二区三区爱爱| 天天做天天爱综合| 高清孕妇孕交╳╳交| 中文字幕av一区| 国产精品123区| 手机av免费在线| 蜜桃传媒视频麻豆第一区免费观看 | 波多野结衣一区二区三区 | 精品国产一区av| 免费在线成人网| 天堂在线免费av| 日韩美女中文字幕| 中文字幕一区二区三| 婷婷视频一区二区三区| 污污的网站18| 色综合久久88| 奇米精品一区二区三区在线观看一| 97电影在线看视频| 精品婷婷色一区二区三区蜜桃| 在线亚洲精品福利网址导航| ririsao久久精品一区| 成人在线免费观看一区| 欧美日韩亚洲高清一区二区| 国产精品日本| 亚洲黄色中文字幕| 国产资源第一页| 日韩视频在线观看一区二区| 免费高清特黄a大片| 久久久久久久久久久av| 91性感美女视频| 日本高清视频网站www| 激情久久av一区av二区av三区| 国产福利视频一区二区| 欧美色婷婷久久99精品红桃| 91亚洲精品久久久| 国产成人啪免费观看软件| 亚洲精品高清无码视频| 成人性生交大片| 日本精品专区| 欧美三级在线看| 黄瓜视频免费观看在线观看www| 欧美午夜免费电影| 日韩国产欧美三级| 亚洲成人五区| www 四虎| 18一19gay欧美视频网站| 樱花影视一区二区| 在线国产一区二区| 99精品视频在线免费播放 | 中文精品无码中文字幕无码专区| 日韩精品视频在线| 91麻豆国产香蕉久久精品| 亚洲伦理久久| 男人的天堂在线视频| 久久国产乱子伦免费精品| 国产日产精品一区二区三区四区| 欧美日韩国产综合一区二区| 免费在线看成人av| 午夜国产精品视频| 国内精品久久久久久99蜜桃| 中文在线8资源库| 无码aⅴ精品一区二区三区浪潮| 色综合久久88| 亚洲一区二区三区四区不卡| 久久国产精品露脸对白| 99热在线成人| 国产探花在线精品一区二区| 久久亚洲精品人成综合网| 杨幂毛片午夜性生毛片| 亚洲欧美99| 亚洲在线色站| 亚洲国产精品久久久久婷婷老年| 欧美在线性爱视频| 日本一区二区不卡| 久久国产精品久久久久久| 欧美色综合天天久久综合精品| 中文字幕成人在线观看| 国产一区二区三区免费观看| 男女男精品网站| 日韩午夜精品| 欧美bbbbb| 欧美裸体在线版观看完整版| 99亚洲乱人伦aⅴ精品| 中文字幕av一区二区三区四区| 亚洲私人影吧| 国产91在线免费| 一区二区三区国| 国产特级黄色大片| 亚洲一区三区在线观看| 精品亚洲欧美日韩| 天堂社区 天堂综合网 天堂资源最新版 | 亚洲一区二区在| 亚洲乱码一区二区三区三上悠亚| 欧美一区2区三区4区公司二百| 久久66热这里只有精品| 久久国产一区| 亚欧精品在线| 东京热加勒比无码少妇| 色诱视频在线观看| av三级在线播放| 男人在线资源站| 日本一区二区三区视频在线| 欧美大片网址| 伊人久久大香线蕉综合网站 | 国产99久久久精品| bt欧美亚洲午夜电影天堂| 国产精品久久久爽爽爽麻豆色哟哟| 夜夜嗨av一区二区三区四季av| 亚洲精品视频一区| 欧美少妇xxx| 日韩小视频在线| 日本精品视频在线播放| 欧美日韩一区在线播放 | 日韩一级大片在线观看| 综合网中文字幕| 国产精品久久久久久婷婷天堂| 久久精品中文字幕一区二区三区| 中文字幕一区二区中文字幕| 尤物av无码色av无码| 亚洲校园欧美国产另类| 免费一区二区三区四区| 日韩午夜高潮| 亚洲国产成人tv| 色阁综合伊人av| 欧美一区二区三区在线免费观看| 狠狠干婷婷色| 天堂在线中文网官网| 手机亚洲手机国产手机日韩| 久久精品国产精品亚洲综合| 亚洲一级在线观看| www.亚洲一区| 精品一区二区三区免费毛片| 精品少妇人妻av一区二区| 鲁一鲁一鲁一鲁一av| 91精品国产黑色瑜伽裤| 色天天综合网| 伊人一区二区三区| 久久99精品久久久久久青青91| 一区二区三区一级片| 成人av视屏| 黄网站视频在线观看| 国产免费不卡| 国产一区二区三区四区五区| 日本美女一区二区三区视频| 中文字幕日韩一区| 久久久99久久精品女同性| 欧美二级三级| 老司机精品视频在线观看6| 久久久加勒比| jlzzjlzz亚洲日本少妇| 最新中文字幕亚洲| 在线观看日韩片| 男同在线观看| 亚洲自啪免费| 亚洲国产精品一区二区久| 亚洲免费av网| 我爱我色成人网| 久久久综合视频| 国产不卡精品视男人的天堂| 日本三级免费观看| 亚洲区综合中文字幕日日| 亚洲va天堂va国产va久| 樱空桃在线播放| 在线观看a视频| 四虎影视4hu4虎成人| 日本中文字幕一区二区视频| 亚洲综合丁香| 日韩主播视频在线| 91精品国产入口| 99在线影院| 高清美女视频一区| 天堂99x99es久久精品免费| 欧美日韩国产色| 免费网站在线观看视频 | 久久最新网址| 又紧又大又爽精品一区二区|