国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

基于開源AI數據框架LlamaIndex構建上下文增強型LLA應用

譯文 精選
人工智能
本文將向你介紹一款新的免費開源的AI開發數據框架,它支持向量存儲、LLM和數據源集成,適用于Q&A問答、結構化提取、聊天、語義搜索和代理開發等場景下的應用。?

譯者 | 朱先忠

審校 | 重樓

引言

“將你的企業數據轉化為可用于實際生產環境的LLM應用程序,”LlamaIndex主頁用60號字體這樣高亮顯示。其副標題是“LlamaIndex是構建LLM應用程序的領先數據框架。”我不太確定它是否是業內領先的數據框架,但我認為它是一個LangChainSemantic Kernel一起構建大型語言模型應用的領先數據框架。

LlamaIndex目前提供兩開源語言框架和一個云端支持。一開源語言是Python;另一開源語言是TypeScript。LlamaCloud目前處于個人預覽版本)通過LlamaHub提供存儲、檢索、數據源鏈接,以及針對復雜文檔的付費方式的專有解析服務LlamaParse,該服務也可作為獨立服務提供。

LlamaIndex在加載數據、存儲和索引數據、通過編排LLM工作流進行查詢以及評估LLM應用程序的性能方面具有優勢。當前,LlamaIndex集成了40多個向量存儲、40多個LLM和160多個數據源。其中,LlamaIndex Python代碼存儲庫已獲得超過30K的星級好評

典型的LlamaIndex應用程序執行問答、結構化提取、聊天或語義搜索,和/或充當代理。們可以使用檢索增強生成(RAG)技術將LLM與特定的數據源聯系起來,這些源通常不包括在模型的原始訓練中。

顯然,LlamaIndex框架將會與LangChain、Semantic Kernel和Haystack等框架展開市場競爭。不過,并非所有這些框架都有完全相同的應用范圍和功能支持,但就流行程度而言,LangChain的Python代碼倉庫有超過80K的星級好評,幾乎是LlamaIndex(超過30K的星級好評)的三倍,而相對最晚出現的Semantic Kernel已經獲得超過18K的星級好評,略高于LlamaIndex的一半,Haystack的代碼倉庫有超過13K的星級好評

上述好評結果是與代碼倉庫的年齡密切相關的,因為星級好評會隨著時間的推移而積累;這也是為什么我用“超過”來修飾星級好評數的原因。GitHub上的星級好評數與歷史進程中的流行度存在松散的相關性。

LlamaIndex、LangChain和Haystack都擁有許多大公司作為用戶,其中一些公司使用了不止一個這樣的框架。Semantic Kernel來自微軟,除了案例研究之外,微軟通常不會公布用戶數據

LlamaIndex框架可幫助你將數據、嵌入、LLM、向量數據庫和求值連接到應用程序中。這些支持可以用于問答、結構化提取、聊天、語義搜索和代理等環境

LlamaIndex框架的功能

從高層來看,LlamaIndex框架的開發主旨在幫助你構建上下文增強的LLM應用程序,意味著你可以將自己的私有數據與大型語言模型相結合。上下文增強LLM應用程序的示例包括問答聊天機器人、文檔理解和提取以及自動化代理等領域

LlamaIndex提供的工具可執行數據加載、數據索引和存儲、使用LLM查詢數據以及評估LLM應用程序的性能:

  • 數據連接器從其本機源和格式中獲取現有數據。
  • 數據索引,也稱為嵌入,以中間表示形式構建數據。
  • 引擎提供對數據的自然語言訪問。其中包括用于回答問題的查詢引擎,以及用于與你的數據進行多消息對話的聊天引擎。
  • 代理是LLM驅動的知識工具結合其他軟件工具增強性能
  • 可觀察性/評估集成使你能夠對應用程序進行實驗、評估和監控。

上下文增強

LLM受過大量文本的訓練,但不一定是關于你的領域的文本信息當前,存在三種主要方法可以執行上下文增強并添加有關域的信息,即提供文檔、執行RAG和微調模型。

首先,最簡單的上下文擴充方法是將文檔與查詢一起提供給模型,為此你可能不需要LlamaIndex。除非文檔的總大小大于你正在使用的模型的上下文窗口否則提供文檔是可以正常工作的,這在最近還是一個常見問題。現在有了具有百萬個標記上下文窗口的LLM,這可以使你執行許多任務避免繼續下一步操作。如果你計劃對一百萬個標記語料庫執行許多查詢,那么需要文檔進行緩存處理;是,這是另一個待討論的話

檢索增強生成在推理時將上下文與LLM相結合,通常與向量數據庫相結合。RAG過程通常使用嵌入來限制長度并提高檢索到的上下文的相關性,這既繞過了上下文窗口的限制,又增加了模型看到回答問題所需信息的概率。

從本質上講,嵌入函數獲取一個單詞或短語,并將其映射到浮點數的向量;這些向量通常存儲在支持向量搜索索引的數據庫中。然后,檢索步驟使用語義相似性搜索,通常使用查詢嵌入和存儲向量之間的角度的余弦,來找到“附近”的信息,以便在增強提示中使用。

微調LLM是一個有監督的學習過程,涉及到根據特定任務調整模型的參數。這是通過在一個較小的、特定于任務或特定于領域的數據集上訓練模型來完成的,該數據集標有與目標任務相關的樣本。使用許多服務器級GPU進行微調通常需要數小時或數天時間,并且需要數百或數千個標記的樣本

安裝LlamaIndex

你可以通過三種方式安裝Python版本的LlamaIndex:從GitHub存儲庫中的源代碼,使用llama index starter安裝,或者使用llama-index-core結合選定的集成組件starter方式的安裝如下所示:

pip install llama-index

除了LlamaIndex核心之外,這種安裝方式將安裝OpenAI LLM和嵌入。注意,你需要提供OpenAI API密鑰(請參閱鏈接https://platform.openai.com/docs/quickstart),然后才能運行使用這種安裝方式的示例。LlamaIndex starter程序示例非常簡單,基本上僅包含經過幾個簡單的設置步驟后的五行代碼。官方的代碼倉庫中還提供了更多的例子和有關參考文檔。

進行自定義安裝可能看起來像下面這樣:

pip install llama-index-core llama-index-readers-file llama-index-llms-ollama llama-index-embeddings-huggingface

這將安裝一個Ollama和Hugging Face嵌入的接口。此安裝還提供一個本地starter級的示例。無論從哪種方式開始,你都可以使用pip添加更多的接口模塊。

如果你更喜歡用JavaScript或TypeScript編寫代碼,那么你可以使用LlamaIndex.TS。TypeScript版本的一個優點是,你可以在StackBlitz上在線運行示例,而無需任何本地設置。不過,你仍然需要提供一個OpenAI API密鑰。

LlamaCloud和LlamaParse

LlamaCloud是一個云服務,允許你上傳、解析和索引文檔,并使用LlamaIndex進行搜索。當前,該項服務仍處于個人alpha測試階段,我無法訪問它。

LlamaParse作為LlamaCloud的一個組件,允許你將PDF解析為結構化數據它可以通過REST API、Python包和Web UI獲得。這個組件目前處于公測階段。在每周前7K頁的免費試用之后,你可以注冊使用LlamaParse,只需支付少量的使用費。官網上提供的有關針對蘋果10K大小文件基礎上的對于LlamaParse和PyPDF比較的例子令人印象深刻,但我自己沒有測試過。

LlamaHub

LlamaHub讓你可以訪問LlamaIndex的大量集成,其中包括代理、回調、數據加載程序、嵌入以及大約17個其他類別。通常,這些集成內容位于LlamaIndex存儲庫、PyPI和NPM中,可以使用pip-install或NPM-install加載使用

create-llama CLI

create-lama是一個命令行工具,用于生成LlamaIndex應用程序。這是開始使用LlamaIndex的快速方法。生成的應用程序中包含一個Next.js驅動的前端和三后端方案可供選擇。

RAG-CLI

RAG CLI是一個命令行工具,用于與LLM交流你在計算機上本地保存的文件。這只是LlamaIndex的眾多使用場景案例之一,不過這種情況非常普遍

LlamaIndex組件

LlamaIndex組件指南為你提供有關LlamaIndex各個部分的具體幫助。下面的第一個屏幕截圖顯示了組件指南菜單。第二個顯示了提示的組件指南,滾動到關于自定義提示的部分。

LlamaIndex組件指南記錄了構成框架的不同部分,其中介紹了相當多的組件。

我們正在研究這種提示的使用模式。這個特殊的例子展示了如何自定義問答提示,以莎士比亞戲劇的風格回答問題。值得注意的是,這是一個零樣本提示,因為它沒有提供任何示例。

學習LlamaIndex

一旦你閱讀、理解并用你喜歡的編程語言(Python或TypeScript)運行了入門示例,我建議你盡可能多地閱讀、理解和嘗試其他看起來有趣的一些示例。下面的屏幕截圖顯示了通過運行essay.ts并使用chatEngine.ts詢問相關問題來生成一個名為essay的文件的結果。這是一個使用RAG進行問答的示例。

其中,chatEngine.ts程序使用LlamaIndex的ContextChatEngine、Document、Settings和VectorStoreIndex組件。當我分析其源代碼時,我看到它依賴于OpenAI gpt-3.5-turb-16k模型;這種情況可能會隨著時間的推移而改變。如果我文檔的分析是正確的話那么VectorStoreIndex模塊使用了開源的、基于Rust的Qdrant向量數據庫。

在用我的OpenAI密鑰設置了終端環境后,我運行essay.ts來生成一個散文題材的文件,并運行chatEngine.ts來實現有關文章的查詢。

為LLM提供上下文

正如你所看到的,LlamaIndex非常容易用于創建LLM應用程序。我能夠針對OpenAI LLM和RAG Q&A應用程序的文件數據源進行測試。值得注意的是,LlamaIndex集成了40多個向量存儲、40多個LLM和160多個數據源;它適用于幾種使用場景,包括Q&A問答、結構化提取、聊天、語義搜索和代理應用等

最后,我建議你認真評估LlamaIndexLangChain、Semantic Kernel和Haystack等框架其中一個或多個可能會滿足你的需求。當然,我不能籠統地推薦其中一個,因為不同的應用程序有不同的要求。

LlamaIndex優點

  1. 幫助創建問答、結構化提取、聊天、語義搜索和代理等類型的LLM應用程序
  2. 支持Python和TypeScript
  3. 框架是免費和開源的
  4. 提供大量示例和集成組件

LlamaIndex不足

  1. 環境僅限于私人預覽
  2. 營銷有點言過其實

LlamaIndex費用

開源:免費。

LlamaParse導入服務:每周免費支持7K頁的文檔,然后每1000頁需要支付3美元。

平臺支持

支持Python和TypeScript,以及云SaaS(目前處于私人預覽狀態)。

譯者介紹

朱先忠,51CTO社區編輯,51CTO專家博客、講師,濰坊一所高校計算機教師,自由編程界老兵一枚。

原文標題:LlamaIndex review: Easy context-augmented LLM applications,作者:Martin Heller


責任編輯:華軒 來源: 51CTO
相關推薦

2025-08-08 01:45:00

上下文工程優化框架

2017-05-11 14:00:02

Flask請求上下文應用上下文

2024-09-05 08:24:09

2024-06-06 08:42:01

2025-12-19 11:08:38

2025-10-14 01:55:00

AI應用上下文工程機器人

2012-12-06 10:34:36

戴爾

2025-07-08 08:34:04

2012-12-31 10:01:34

SELinuxSELinux安全

2025-12-12 08:19:49

2022-09-14 13:13:51

JavaScript上下文

2020-08-23 08:59:35

number修飾鍵代碼

2024-04-07 08:50:00

谷歌框架

2025-07-25 10:06:05

2022-09-15 08:01:14

繼承基礎設施基礎服務

2025-12-09 09:28:54

2025-05-26 01:45:00

LLMAI信任

2020-10-21 09:11:52

Spring Boot源碼分析代碼

2025-05-09 09:15:00

2025-03-04 08:42:19

點贊
收藏

51CTO技術棧公眾號

在线免费看黄网站| 国产精品男人的天堂| 亚洲精品中文字幕无码蜜桃| 午夜在线视频一区二区区别 | 国产91porn| 亚洲欧美不卡| 99影视tv| 韩国自拍一区| 国产日本一区二区三区| 欧美日一区二区三区在线观看国产免| 欧美性一区二区三区| 国产一区二区三区视频在线| 国产综合久久久久久鬼色| 91精品网站| 波多野结衣在线播放一区| 久久综合久久88| 激情综合网五月激情 | 国产精品网站在线观看| 4444欧美成人kkkk| 精品伊人久久| 欧美激情网友自拍| 福利资源在线久| 日韩午夜在线电影| 国产精品久久久久久久小唯西川| 日韩电影二区| 18成人免费观看网站下载| 一区二区在线| 亚洲精品美女在线观看播放| 日本成人不卡| 国产亚洲一区字幕| 老头吃奶性行交视频| 中文字幕一区二区三区久久网站| 国产精品av电影| 久久精品国产99久久| 国产精品嫩草在线观看| 99精品国产99久久久久久福利| 欧美二区三区在线| 韩国精品在线观看| 免费成人午夜视频| 亚洲精品成人无限看| 91欧美日韩一区| 韩国主播福利视频一区二区三区| 亚洲图片欧美日产| 欧美日韩一区二区三区在线电影 | 成a人片国产精品| 国产成人欧美在线观看| 99精品美女| 精品无人区一区二区三区竹菊| 91精品xxx在线观看| 在线观看久久av| 日韩视频在线直播| 成人a视频在线观看| 久久精品国语| 欧美亚洲成人精品| 91精品婷婷色在线观看| 日韩久久不卡| 深夜福利久久| 久久99热只有频精品91密拍| 国产伦精品一区二区三区免费迷 | 天天综合天天操| 色呦呦国产精品| yellow在线观看网址| 欧美激情影音先锋| 女生裸体视频一区二区三区| 中日韩美女免费视频网站在线观看 | 在线日韩欧美| 久久精品xxx| 亚洲一级二级三级| 中文字幕有码在线视频| 亚洲精品日日夜夜| 亚洲三区在线| 国产午夜亚洲精品羞羞网站| 亚洲男人天堂| 尤物yw午夜国产精品视频| 久久91麻豆精品一区| 天堂av一区二区| 91精品国产乱码久久久久久| 夜夜春亚洲嫩草影视日日摸夜夜添夜| 久久久国产精品麻豆| 天堂v在线视频| 亚洲三级小视频| 国产亚av手机在线观看| 狠狠干狠狠久久| 日韩高清中文字幕一区二区| 国产精品大陆在线观看| 国产一区二区免费在线| 你懂的视频在线播放| 亚洲丝袜精品丝袜在线| 国产网红在线观看| 成人久久久久久| 久久影音资源网| 噜噜噜久久亚洲精品国产品麻豆| 日韩欧美亚洲范冰冰与中字| 亚洲精品一区av| 视频一区视频二区视频| 亚洲国产另类av| 欧美h版在线观看| 一本久久a久久精品vr综合| 亚洲高清久久久| 欧美另类激情| 亚洲精品不卡| 日本乱人伦一区| 欧美交a欧美精品喷水| 无码毛片aaa在线| 国产精品综合久久| www在线免费观看| 久久久亚洲福利精品午夜| 国产一区二区三区免费观看| 高清日韩av电影| 欧美资源在线观看| 久久综合久久99| 在线最新版中文在线| 精品久久一区二区三区蜜桃| 一区二区三区免费看视频| 9999精品| 91精品国产毛片武则天| 欧美一区二区三区的| 在线中文字幕第一区| 宅男深夜国产| 茄子视频成人在线| 中文字幕乱码久久午夜不卡 | 色婷婷综合久久久| 国产亚洲第一伦理第一区| 91看片在线免费观看| 日韩在线欧美在线| 国产成人免费视| 希岛爱理一区二区三区av高清| 亚洲成人蜜桃| 欧美v国产在线一区二区三区| 在线国产精品一区| 999国产在线视频| 精品一区二区三区国产| 欧美日本在线播放| 亚洲人成免费| gogo在线高清视频| 亚洲欧美精品在线| 国内精品伊人| 99中文字幕在线观看| 国产视频精品免费播放| www.豆豆成人网.com| 97国产精东麻豆人妻电影 | 四虎久久免费| 亚洲国产三级网| 另类中文字幕网| 9765激情中文在线| 中国一级黄色录像| 一区二区三区www| 成人动漫av在线| 欧美视频在线视频精品| 国产精品无码av无码| 久久久久久久久国产精品| 中文字幕一区二区三区在线播放| 亚洲理论电影| 佐山爱痴汉视频一区二区三区 | 一区二区三区在线视频免费| 91这里只有精品| 久久99久久精品国产| 日韩免费福利电影在线观看| 国产一区二区三区精品在线观看| av在线播放亚洲| 欧美国产日韩中文字幕在线| 欧美激情一区二区三区全黄| 在线免费av电影| 日韩久久精品一区二区三区| 亚洲人在线视频| 中文字幕精品三区| 欧美激情aⅴ一区二区三区| 欧美理论电影| 国产男女在线观看| 国产精品专区一| 精品剧情v国产在线观看在线| 国产激情视频一区二区三区欧美 | 中文字幕一区二区三区四区五区六区| 国产亚洲精品一区二555| 亚洲国产成人午夜在线一区 | 蜜臀av一区二区| 视频一区日韩精品| 男女污污视频在线观看| 制服丝袜综合日韩欧美| 精品久久久91| 黑人巨大精品欧美一区免费视频| 视频一区在线播放| 亚洲一区网址| freemovies性欧美| 99热自拍偷拍| www.久久久| 精品国产一区二区三区久久狼黑人| 亚洲精品日韩综合观看成人91| 久久综合狠狠| 青青一区二区| 丁香影院在线| 啊灬啊灬啊灬啊灬高潮在线看| 日韩激情久久| 国产精品黄色av| 亚洲美女视频网| 日韩欧美在线观看| 久久精品一区二区三区不卡| 国产视频一区欧美| 伊人久久综合影院| 国产不卡网站|