国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

圖像也能通過 RAG 加入知識庫啦!

發布于 2025-5-14 00:37
瀏覽
0收藏

我們知道,檢索增強生成 RAG 通過整合外部知識庫與生成模型,有效緩解了大模型在專業領域的知識局限性。傳統的知識庫以文本為主,通常依賴于純文本嵌入來實現語義搜索和內容檢索。

然而,隨著多模態數據需求的增長和復雜文檔處理場景的增多,傳統方法在處理混合格式文檔(如包含文本、圖像、表格的 PDF)或長上下文內容時,往往面臨性能瓶頸。??Cohere Embed v4?? 的出現為這些挑戰提供了創新解決方案,其多模態嵌入能力和長上下文支持顯著提升了 RAG 系統的性能和適用性。

??Cohere Embed v4?? 是一個能夠滿足企業需求的多模態嵌入模型,發布于 2025 年 4 月 15 日。它可以處理文本、圖像和混合格式(如 PDF),非常適合需要處理復雜文檔的場景。它的關鍵功能如下,

  • 多模態支持:可以統一嵌入包含文本和圖像的文檔,如 PDF 和演示幻燈片。
  • 長上下文:支持高達 128K 的上下文長度,約 200 頁,適合長文檔。
  • 多語言能力:覆蓋 100 多種語言,支持跨語言搜索,無需識別或翻譯語言。
  • 安全性和效率:優化用于金融、醫療等行業,可在虛擬私有云或本地部署,并提供壓縮嵌入,節省高達 83% 的存儲成本。

下面,我們來測試一下這個 ??Cohere Embed v4??,它作為嵌入模型,需要配合大模型來一起搞事情,比如 ??Gemini Flash 2.5??

首先,我們不妨先來理一下??Cohere Embed v4?? 和 ??Gemini Flash 2.5?? 在這個任務中是什么關系以及具體是如何協作的呢?

我們要實現一個基于視覺的檢索增強生成 (RAG) 系統。在這個系統中,??Cohere Embed v4?? 和 ??Gemini Flash 2.5?? 扮演著不同的角色,它們相互配合完成了任務:

  • Cohere Embed v4 負責檢索部分。它將圖像和文本轉換為向量表示(嵌入),然后利用這些嵌入來搜索與用戶問題最相關的圖像。
  • Gemini Flash 2.5 負責生成部分。它是一個強大的視覺語言模型 (VLM),能夠理解圖像和文本,并根據它們生成答案。

它們如何配合完成任務的?以下是它們協作的流程:

  1. 圖像嵌入: 首先,使用 ??Cohere Embed v4?? 對所有圖像進行編碼,生成圖像嵌入,并存儲起來。
  2. 問題嵌入: 當用戶提出一個問題時,??Cohere Embed v4?? 也會將問題編碼成嵌入。
  3. 檢索: 系統將問題嵌入與圖像嵌入進行比較,找到與問題最相關的圖像。
  4. 答案生成: 將檢索到的圖像和用戶的問題一起發送給 ??Gemini Flash 2.5??,它會根據圖像和問題生成最終的答案。

小結

簡而言之,??Cohere Embed v4?? 充當信息檢索器,找到與問題相關的圖像,而 ??Gemini Flash 2.5?? 充當答案生成器,根據檢索到的圖像和問題生成答案。它們協同工作,實現了基于視覺的 RAG 系統,讓用戶可以通過自然語言提問來獲取圖像中的信息。

下面,我們給出的實驗代碼主要是給出一個思路供實際用圖像或 PDF 等構建知識庫時參考。

實驗代碼

以下代碼展示了一種基于純視覺的 RAG 方法,甚至適用于復雜的信息圖表。它由兩個部分組成:

  • Cohere 最先進的文本和圖像檢索模型 Embed v4。它允許我們嵌入和搜索復雜的圖像,例如信息圖表,而無需任何預處理。
  • Vision-LLM:我們使用谷歌的 Gemini Flash 2.5。它允許輸入圖像和文本問題,并能夠基于此回答問題。

首先,我們來看一下搭建好以后的問答示例。

代碼,

# 定義查詢 query
question = "請用中文解釋一下有鵝的圖"
# 搜索最相關的圖像
top_image_path = search(question)
# 使用搜索到的圖像回答查詢
answer(question, top_image_path)

根據搜索的圖像回答如下,

圖像也能通過 RAG 加入知識庫啦!-AI.x社區

這回答可以吧,竟然看出來了這張圖像被上下顛倒過了。根據問題搜到庫中的圖像是 cohere 的功勞,解讀這張圖像是 Gemini 的功勞。

再來一張試試。

# 定義查詢 query
question = "我記得有個圖里有貓,請解釋一下那個圖是講什么來著?"
# 搜索最相關的圖像
top_image_path = search(question)
# 使用搜索到的圖像回答查詢
answer(question, top_image_path)

回答如下,

圖像也能通過 RAG 加入知識庫啦!-AI.x社區

圖像也能通過 RAG 加入知識庫啦!-AI.x社區

以下是安裝和具體的代碼。

訪問 cohere.com,注冊并獲取 API key。

pip install -q cohere

# Create the Cohere API client. Get your API key from cohere.com
import cohere
cohere_api_key = "<<YOUR_COHERE_KEY>>" #Replace with your Cohere API key
co = cohere.ClientV2(api_key=cohere_api_key)

到 Google AI Studio 為 Gemini 生成一個 API 密鑰。然后,安裝 Google 生成式 AI SDK。

pip install -q google-genai

from google import genai
gemini_api_key = "<<YOUR_GEMINI_KEY>>"  #Replace with your Gemini API key
client = genai.Client(api_key=gemini_api_key)

import requests
import os
import io
import base64
import PIL
import tqdm
import time
import numpy as np


# Some helper functions to resize images and to convert them to base64 format
max_pixels = 1568*1568  #Max resolution for images


# Resize too large images
def resize_image(pil_image):
    org_width, org_height = pil_image.size


    # Resize image if too large
    if org_width * org_height > max_pixels:
        scale_factor = (max_pixels / (org_width * org_height)) ** 0.5
        new_width = int(org_width * scale_factor)
        new_height = int(org_height * scale_factor)
        pil_image.thumbnail((new_width, new_height))


# Convert images to a base64 string before sending it to the API
def base64_from_image(img_path):
    pil_image = PIL.Image.open(img_path)
    img_format = pil_image.format if pil_image.format else "PNG"


    resize_image(pil_image)


    with io.BytesIO() as img_buffer:
        pil_image.save(img_buffer, format=img_format)
        img_buffer.seek(0)
        img_data = f"data:image/{img_format.lower()};base64,"+base64.b64encode(img_buffer.read()).decode("utf-8")


    return img_data


# 圖像列表,有本地的,也有網絡的。
images = {
    "test1.webp": "./img/test1.webp",
    "test2.webp": "./img/test2.webp",
    "test3.webp": "./img/test3.webp",
    "tesla.png": "https://substackcdn.com/image/fetch/w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fbef936e6-3efa-43b3-88d7-7ec620cdb33b_2744x1539.png",
    "netflix.png": "https://substackcdn.com/image/fetch/w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F23bd84c9-5b62-4526-b467-3088e27e4193_2744x1539.png",
    "nike.png": "https://substackcdn.com/image/fetch/w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa5cd33ba-ae1a-42a8-a254-d85e690d9870_2741x1541.png",
    "google.png": "https://substackcdn.com/image/fetch/f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F395dd3b9-b38e-4d1f-91bc-d37b642ee920_2741x1541.png",
    "accenture.png": "https://substackcdn.com/image/fetch/w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F08b2227c-7dc8-49f7-b3c5-13cab5443ba6_2741x1541.png",
    "tecent.png": "https://substackcdn.com/image/fetch/w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F0ec8448c-c4d1-4aab-a8e9-2ddebe0c95fd_2741x1541.png"
}


# 下載圖像并計算每張圖像的嵌入
img_folder = "img"
os.makedirs(img_folder, exist_ok=True)


img_paths = []
doc_embeddings = []
for name, url in tqdm.tqdm(images.items()):
    img_path = os.path.join(img_folder, name)
    img_paths.append(img_path)


    # Download the image
    if not os.path.exists(img_path):
        response = requests.get(url)
        response.raise_for_status()


        with open(img_path, "wb") as fOut:
            fOut.write(response.content)


    # Get the base64 representation of the image
    api_input_document = {
        "content": [
            {"type": "image", "image": base64_from_image(img_path)},
        ]
    }


    # Call the Embed v4.0 model with the image information
    api_response = co.embed(
        model="embed-v4.0",
        input_type="search_document",
        embedding_types=["float"],
        inputs=[api_input_document],
    )


    # Append the embedding to our doc_embeddings list
    emb = np.asarray(api_response.embeddings.float[0])
    doc_embeddings.append(emb)


doc_embeddings = np.vstack(doc_embeddings)
print("\n\nEmbeddings shape:", doc_embeddings.shape)

看這些圖像的嵌入:??Embeddings shape: (9, 1536)??。

以下展示了一個基于視覺的 RAG(檢索增強生成)的簡單流程。

  1. 首先執行 search():我們為問題計算嵌入向量。然后,我們可以使用該嵌入向量在我們預先嵌入的圖像庫中進行搜索,以找到最相關的圖像,然后返回該圖像。
  2. 在 answer() 中,將問題和圖像一起發送給 Gemini,以獲得問題的最終答案。

# Search allows us to find relevant images for a given question using Cohere Embed v4
def search(question, max_img_size=800):
    # Compute the embedding for the query
    api_response = co.embed(
        model="embed-v4.0",
        input_type="search_query",
        embedding_types=["float"],
        texts=[question],
    )


    query_emb = np.asarray(api_response.embeddings.float[0])


    # Compute cosine similarities
    cos_sim_scores = np.dot(query_emb, doc_embeddings.T)


    # Get the most relevant image
    top_idx = np.argmax(cos_sim_scores)


    # Show the images
    print("Question:", question)


    hit_img_path = img_paths[top_idx]


    print("Most relevant image:", hit_img_path)
    image = PIL.Image.open(hit_img_path)
    max_size = (max_img_size, max_img_size)  # Adjust the size as needed
    image.thumbnail(max_size)
    display(image)
    return hit_img_path


# Answer the question based on the information from the image
# Here we use Gemini 2.5 as powerful Vision-LLM
def answer(question, img_path):
    prompt = [f"""Answer the question based on the following image.
Don't use markdown.
Please provide enough context for your answer.


Question: {question}""", PIL.Image.open(img_path)]


    response = client.models.generate_content(
        model="gemini-2.5-flash-preview-04-17",
        cnotallow=prompt
    )


    answer = response.text
    print("LLM Answer:", answer)

然后,針對圖像進行問答。

# Define the query
question = "請用中文解釋一下 Nike 的數據"


# Search for the most relevant image
top_image_path = search(question)


# Use the image to answer the query
answer(question, top_image_path)

以下是回答,

圖像也能通過 RAG 加入知識庫啦!-AI.x社區

圖像也能通過 RAG 加入知識庫啦!-AI.x社區

圖像也能通過 RAG 加入知識庫啦!-AI.x社區

圖像也能通過 RAG 加入知識庫啦!-AI.x社區

參考代碼:??https://colab.research.google.com/drive/1RdkYOTpx41WNLCA8BJoh3egQRMX8fpJZ#scrollTo=eUYg4r7JrDS2??

本文轉載自???機器學習與數學???,作者:大師兄

收藏
回復
舉報
回復
相關推薦
日韩你懂的在线播放| 国产精品99久久久久久www| 久久久久国产精品熟女影院| 亚洲精品二区三区| 精品国产一区久久久| a√资源在线| 久久午夜电影网| 午夜精品一区二区在线观看| 九九热爱视频精品视频| 日韩精品在线免费| jizz在线观看视频| 亚洲精品老司机| 日韩国产欧美亚洲| 日本午夜一区二区| 亚洲va久久久噜噜噜久久天堂| 国产高清日韩| 亚洲精品日韩久久久| 日韩免费网站| 欧美性开放视频| 啦啦啦在线视频免费观看高清中文| 国产白丝精品91爽爽久久| 蜜桃导航-精品导航| 日韩精品久久| 久久精品国产一区二区三区| 国产无遮挡裸体视频在线观看| 欧美手机在线视频| 日本福利片高清在线观看| 亚洲视频资源在线| 日本人视频jizz页码69| 99麻豆久久久国产精品免费| 亚洲五码在线观看视频| 免费精品视频在线| 日本电影一区二区三区| 精品动漫一区| 亚洲精品日韩av| 成人在线免费视频观看| 热re99久久精品国产66热| 国产精品99久久免费| 中文字幕精品网| 成人在线免费电影网站| 色偷偷888欧美精品久久久| 狠狠操一区二区三区| 亚洲国产精品99| 午夜影院在线观看国产主播| 日韩国产精品一区| 成年男女免费视频网站不卡| 精品日韩欧美在线| 97久久人人超碰caoprom| 亚洲娇小xxxx欧美娇小| 91破解版在线观看| 亚洲欧洲日本专区| 成人自拍视频网| 久久这里只有精品99| 一区二区三区视频播放| 国内精品中文字幕| 给我免费播放日韩视频| 日韩av免费看网站| 欧美wwwww| 鲁鲁狠狠狠7777一区二区| 丝袜美腿亚洲一区| 免费观看亚洲视频| 国产亚洲欧洲一区高清在线观看| av无码精品一区二区三区| 国产精品你懂的在线| 伊人精彩视频| 欧美日韩精品一区二区在线播放| 成人在线网址| 亚洲欧洲激情在线| 97精品久久| 国产精品日韩一区| 99精品国产99久久久久久福利| 一本久道久久综合狠狠爱亚洲精品| 国产一区二区三区国产| 又色又爽又高潮免费视频国产| 亚洲六月丁香色婷婷综合久久 | 69久久夜色精品国产69蝌蚪网| caoporn国产精品免费视频| 日韩欧美国产综合在线一区二区三区| 中文在线а√在线8| 久久久久久久久久国产| 99久久99久久精品国产片桃花| 国产精品jizz视频| 黑人精品欧美一区二区蜜桃| 欧美日韩亚洲一二三| 欧美性猛交xxxx乱大交3| 香蕉久久aⅴ一区二区三区| 国产一区二区三区高清在线观看| 成人看片爽爽爽| 99九九电视剧免费观看| 国产suv精品一区二区883| 在线观看成人网| 在线播放欧美女士性生活| 高清在线一区| 91亚洲精品久久久久久久久久久久| 日韩国产在线观看| 小泽玛利亚视频在线观看| 欧美二区在线观看| 国产亚洲高清在线观看| 国产精品麻豆免费版| 99久久久国产精品免费蜜臀| 在线播放av网站| 国产一区二区美女视频| 成人三级视频| 男女激情免费视频| 欧美色国产精品| 国产精品45p| 青青草久久网络| 自拍偷拍亚洲激情| 色戒汤唯在线观看| 亚洲一区二区三| 国产视频一区二区在线观看| 国产不卡在线| 日韩av黄色在线观看| 风流少妇一区二区| 男人在线资源站| 国产精品扒开腿做| 成人av电影在线观看| 欧美性猛交xxx乱大交3蜜桃| 欧美在线视频导航| 国产成人免费在线观看不卡| 国产福利免费在线观看| 69久久夜色精品国产7777 | 国产成人福利网站| 国产一区91精品张津瑜| 尤物网站在线| 欧美大片免费观看| 国内外成人在线| 国产综合在线观看| 2019日本中文字幕| 99re视频精品| 成人影院入口| 亚洲欧美日韩精品久久久| 欧美在线free| 欧美一站二站| 国产天堂av| 久久91精品国产91久久久| 国产高清视频一区| ririsao久久精品一区| 国产亚洲一区在线播放 | 亚洲ww精品| 日韩欧美在线观看强乱免费| 精品日本美女福利在线观看| 日韩成人午夜| 先锋影音资源综合在线播放av| 色青青草原桃花久久综合| 久久99精品久久久久婷婷| 国产传媒在线播放| 国产三级精品在线不卡| 欧美性xxxxhd| 欧美成人tv| 黄色大片在线免费观看| 91亚洲精品久久久| 精品久久中文字幕| 日本欧美国产| 香蕉国产在线| 亚洲xxxxx电影| 91久久精品一区二区三区| 久久伦理在线| av成人动漫| 91在线色戒在线| 色94色欧美sute亚洲线路一久| 亚洲乱码精品| 色的视频在线免费看| 免费99视频| 亚洲精品电影在线| 欧美超级免费视 在线| 久久精品99国产精品日本| 牛牛电影国产一区二区| 视频一区二区在线观看| 精品国产99国产精品| 国产精品一区在线观看乱码| 国产精品13p| 女人色极品影院| 欧美人成在线视频| 久久久久久久电影| 99re6热只有精品免费观看| 国产xxxxx18| 成人免费视频在线观看超级碰| 91黄色免费看| 日日骚欧美日韩| 国产成人亚洲一区二区三区| caoporn超碰97| 国产精品日韩专区| 欧美精品成人一区二区三区四区| 青青草国产成人99久久| 丝袜美腿一区| 九热视频在线观看| 国产成人久久久| 制服丝袜国产精品| 成人国产在线观看| 亚洲裸色大胆大尺寸艺术写真| 日韩一二三四| 一区二区成人国产精品 | 免费观看在线色综合| 亚洲综合在线电影| 日本a级片免费观看| 国产999视频| 成人午夜免费av| 99视频有精品| 高清毛片在线观看|