国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

LanceDB:為 AI 應(yīng)用打造的高效嵌入式向量數(shù)據(jù)庫

發(fā)布于 2024-12-24 11:41
瀏覽
0收藏

當(dāng)前,向量數(shù)據(jù)庫已經(jīng)成了一個(gè)紅海市場,新興的還是傳統(tǒng)數(shù)據(jù)庫廠商都在做這方面的工作。然而,在嵌入式,端上的向量數(shù)據(jù)庫比較少,chromaDB算是其中一個(gè),但它不算是一個(gè)純原生、深度優(yōu)化的的嵌入式向量數(shù)據(jù)庫,仍采用parquet格式(讀一行數(shù)據(jù)需要讀取整個(gè)塊解壓,比較慢,另外副本占用空間),功能也比較少,那有沒有更好的選擇呢?很多人自然想到關(guān)系型嵌入式數(shù)據(jù)庫王者——Sqlite,奈何它的向量版本 sqlite-vec還處于開發(fā)中,那有沒有文檔性能還好的替代品呢?LanceDB是一個(gè)選擇。

LanceDB 是一個(gè)專為構(gòu)建 AI 應(yīng)用而設(shè)計(jì)的開源向量數(shù)據(jù)庫。它采用嵌入式架構(gòu),無需部署獨(dú)立服務(wù)器,可以輕松集成到各種應(yīng)用場景中。

LanceDB:為 AI 應(yīng)用打造的高效嵌入式向量數(shù)據(jù)庫-AI.x社區(qū)

核心功能和優(yōu)勢在于:

  1. 嵌入式架構(gòu)。與需要部署服務(wù)器的 Qdrant 等產(chǎn)品不同,LanceDB 采用嵌入式設(shè)計(jì),作為應(yīng)用的一部分運(yùn)行,易于集成且無需額外的基礎(chǔ)設(shè)施管理。
  2. 專為AI設(shè)計(jì)的Lance 數(shù)據(jù)格式(最大亮點(diǎn))。LanceDB 使用專門優(yōu)化的 Lance 列式存儲(chǔ)格式,相比傳統(tǒng)的 Parquet 格式具有更快的掃描速度。它支持?jǐn)?shù)據(jù)分片,只加載必要的數(shù)據(jù)片段,大大減少 IO 開銷。同時(shí)具有機(jī)器學(xué)習(xí)所需的自動(dòng)數(shù)據(jù)版本管理能力,不同的版本會(huì)關(guān)聯(lián)該版本相關(guān)文件、模式及 blob 的元數(shù)據(jù),更新數(shù)據(jù)時(shí)無需完整重寫(Zero-copy)。

LanceDB:為 AI 應(yīng)用打造的高效嵌入式向量數(shù)據(jù)庫-AI.x社區(qū)

相較于其他的常見格式對比,在機(jī)器學(xué)習(xí)場景場景中優(yōu)勢明顯:

LanceDB:為 AI 應(yīng)用打造的高效嵌入式向量數(shù)據(jù)庫-AI.x社區(qū)

數(shù)據(jù)cap理論


Lance

Parquet & ORC

JSON & XML

TFRecord

Database

Warehouse

Analytics

Fast

Fast

Slow

Slow

Decent

Fast

Feature Engineering

Fast

Fast

Decent

Slow

Decent

Good

Training

Fast

Decent

Slow

Fast

N/A

N/A

Exploration

Fast

Slow

Fast

Slow

Fast

Decent

Infra Support

Rich

Rich

Decent

Limited

Rich

Rich

  1. 高性能向量搜索。基于 Rust 語言開發(fā),具有優(yōu)秀的性能表現(xiàn)。根據(jù)官方基準(zhǔn)測試,在同等硬件條件下,對于 128 維向量的 10 億規(guī)模數(shù)據(jù)集,查詢延遲可以控制在 100ms 以內(nèi)。并且支持GPU加速。
  2. 豐富的生態(tài)集成。LanceDB 原生支持 Python 和JavaScript/TypeScript,并與 LangChain 、LlamaIndex 等主流 AI 框架無縫集成。同時(shí)也支持 Apache Arrow 、Pandas 、Polars 、DuckDB 等數(shù)據(jù)處理工具。
  3. 多模態(tài)數(shù)據(jù)支持。除了向量數(shù)據(jù),LanceDB 還能高效存儲(chǔ)和檢索文本、圖像、音頻等非結(jié)構(gòu)化數(shù)據(jù),無需額外的存儲(chǔ)解決方案。

使用 LanceDB 非常簡單,下面是使用示例:

  • Python版本:

import lancedb

# 連接數(shù)據(jù)庫
db = lancedb.connect("data/sample-lancedb")

# 創(chuàng)建表并插入數(shù)據(jù)
table = db.create_table("my_table",
    data=[{"vector": [3.1, 4.1], "item": "foo", "price": 10.0},
          {"vector": [5.9, 26.5], "item": "bar", "price": 20.0}])

# 執(zhí)行向量搜索
result = table.search([100, 100]).limit(2).to_pandas()
  • js版本,搭配transformers使用。

async function example() {

    const lancedb = require('vectordb')

    // Import transformers and the all-MiniLM-L6-v2 model (https://huggingface.co/Xenova/all-MiniLM-L6-v2)
    const { pipeline } = await import('@xenova/transformers')
    const pipe = await pipeline('feature-extraction', 'Xenova/all-MiniLM-L6-v2');


    // Create embedding function from pipeline which returns a list of vectors from batch
    // sourceColumn is the name of the column in the data to be embedded
    //
    // Output of pipe is a Tensor { data: Float32Array(384) }, so filter for the vector
    const embed_fun = {}
    embed_fun.sourceColumn = 'text'
    embed_fun.embed = async function (batch) {
        let result = []
        for (let text of batch) {
            const res = await pipe(text, { pooling: 'mean', normalize: true })
            result.push(Array.from(res['data']))
        }
        return (result)
    }

    // Link a folder and create a table with data
    const db = await lancedb.connect('data/sample-lancedb')

    const data = [
        { id: 1, text: 'Cherry', type: 'fruit' },
        { id: 2, text: 'Carrot', type: 'vegetable' },
        { id: 3, text: 'Potato', type: 'vegetable' },
        { id: 4, text: 'Apple', type: 'fruit' },
        { id: 5, text: 'Banana', type: 'fruit' }
    ]

    const table = await db.createTable('food_table', data, embed_fun)


    // Query the table
    const results = await table
        .search("a sweet fruit to eat")
        .metricType("cosine")
        .limit(2)
        .execute()
    console.log(results.map(r => r.text))

}

example().then(_ => { console.log("Done!") })

更多參考資源:??https://github.com/lancedb/vectordb-recipes??

相比需要部署服務(wù)器的向量數(shù)據(jù)庫,LanceDB 的嵌入式架構(gòu)特別適合:

  • 需要在本地運(yùn)行的桌面應(yīng)用
  • 資源受限的邊緣計(jì)算環(huán)境
  • 對數(shù)據(jù)隱私有嚴(yán)格要求的場景
  • 快速原型開發(fā)和測試

雖然在處理海量數(shù)據(jù)時(shí),LanceDB 展現(xiàn)出了顯著的性能優(yōu)勢,但對于大多數(shù)中小規(guī)模的 AI 應(yīng)用來說,開發(fā)效率和易用性可能是更重要的考慮因素。LanceDB 簡單直觀的 API 設(shè)計(jì)和完善的生態(tài)支持,使其成為構(gòu)建各類 AI 應(yīng)用的理想選擇。

小結(jié)

事實(shí)上,當(dāng)前很多的應(yīng)用都選擇lancedb作為其實(shí)現(xiàn)方案,比如微軟的GraphRAG,Character AI , MidJourney等,它們也獲得了YC 800 萬美元的種子輪融資。2025年,我們將迎來多模態(tài)LLM應(yīng)用的爆發(fā),這也將會(huì)帶來向量數(shù)據(jù)庫的新一輪的熱潮,作為嵌入式向量數(shù)據(jù)庫的最佳代表,無論是用于構(gòu)建原型還是部署生產(chǎn)環(huán)境,都是一個(gè)值得考慮的選擇,甚至可能是不二選擇。

參考:

??https://blog.lancedb.com/new-funding-and-a-new-foundation-for-multimodal-ai-data/??

??https://lancedb.github.io/??

??https://github.com/lancedb/lancedb??

本文轉(zhuǎn)載自 ??AI工程化??,作者: ully

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
老司机午夜精品视频| 亚洲欧美日韩中文视频| 精品1区2区3区| 成人免费在线视频播放| 免费看成人吃奶视频在线| 国产盗摄视频在线观看| 日本福利在线| 99久久久国产精品| 欧美精品一区在线| 国产精品久久观看| 欧美激情二区三区| 桃色一区二区| 日韩欧美国产精品一区| 欧美视频免费一区二区三区| 国产精品免费av| 国产午夜福利100集发布| 精品久久久久久电影| 久久国产精品久久精品| 18video性欧美19sex高清| 欧美性猛交99久久久久99按摩| 少妇人妻互换不带套| 国产一区二区视频在线| 欧美日韩一区在线播放| 日韩视频在线你懂得| 免费成人深夜夜行视频| 久色国产在线| 日韩高清二区| 午夜激情一区二区| 日韩欧美在线播放视频| 久久福利视频一区二区| 狠狠色丁香婷婷综合| 亚洲国产成人私人影院tom| 在线视频精品一区| 一本综合久久| 成人亲热视频网站| 欧州一区二区| 97在线观看视频国产| 日韩欧美激情电影| 久久久极品av| 日本一区二区三区中文字幕| 亚洲视频欧洲视频| 影视一区二区三区| 中文字幕少妇一区二区三区| 美女福利一区二区三区| 精品丝袜一区二区三区| 亚洲性受xxx喷奶水| 亚洲天堂精品在线| 成人自拍视频网| 中文国产成人精品久久一| 日本不卡一二三| 这里只有精品久久| 日韩电影精品| 欧美国产精品人人做人人爱| 日本一区二区三区电影免费观看| 久久久av电影| 一区二区三区四区视频免费观看| 欧美国产极速在线| 日韩欧美黄色| 国产精品专区h在线观看| 亚洲成人精品| 国产精品一区二区免费看| 亚洲国产二区| 欧美污视频久久久| 美女爽到高潮91| av女优在线播放| 国产精品国产馆在线真实露脸| 裸体免费网站| 欧美日韩亚洲综合一区| 丁香花视频在线观看| 亚洲丝袜一区在线| 成午夜精品一区二区三区软件| 日本精品一区二区三区在线播放视频| 久久中文视频| 日本不卡一区| 免费成人美女在线观看.| 免费成人小视频| 欧美大片在线观看| 欧美成人ⅴideosxxxxx| 国产黄色片免费在线观看| 91视频xxxx| 在线免费看黄av| 欧美日韩国产在线观看| 不卡一二三区| 国产91精品黑色丝袜高跟鞋 | 国产婷婷色一区二区三区在线| 成年人黄视频网站| 91精品国产一区二区三区| 精品免费av一区二区三区| 91av在线播放| 一区二区三区高清视频在线观看| 日韩精品视频在线观看视频| 亚洲中国最大av网站| 欧美精品久久久久久久久25p| 色综合网站在线| 天天插天天狠天天透| 欧美视频在线观看免费| 97se亚洲国产综合自在线不卡| 日韩网址在线观看| 美腿丝袜亚洲综合| 久久色成人在线| 在线看片免费人成视久网| 精品美女在线播放| 国产劲爆久久| 久久偷看各类wc女厕嘘嘘偷窃| 91色在线porny| 香港伦理在线| 欧美美女操人视频| 亚洲精品护士| 91午夜国产| 日韩av最新在线观看| 精品视频免费| 男人插女人视频在线观看| 欧日韩精品视频| 九九热hot精品视频在线播放| 日韩av电影免费在线观看| 亚洲一区二区三区四区中文字幕| av有声小说一区二区三区| 97人人模人人爽人人少妇| 欧美国产欧美亚州国产日韩mv天天看完整| 精品国产丝袜高跟鞋| 国产精品免费小视频| 99久久婷婷国产综合精品电影| 中文日本在线观看| 国产成人在线一区二区| 成人美女视频在线看| 日本一二三不卡| 欧美a级在线观看| 日韩暖暖在线视频| 亚洲色图第一区| 久操视频在线| 麻豆精品网站| 久久九九影视网| 九七久久人人| 国产精品第七十二页| 国产大陆a不卡| 日本暖暖在线视频| 一区二区三区欧美成人| 欧美黑人巨大videos精品| 日本不卡二区| 日韩欧美在线播放| 国产精品1luya在线播放| 91亚洲精品国产| 欧美成人欧美edvon| 成人综合一区| 97福利电影| 欧美精品激情在线观看| 不卡av在线网| 台湾佬成人网| 91九色国产ts另类人妖| 亚洲аv电影天堂网| 国产欧美一级| 免费成人黄色| 国产一区二区不卡视频在线观看| 午夜激情久久久| 日韩夫妻性生活xx| 日本欧美亚洲| 国产精品户外野外| 日韩成人影音| 在线中文字幕播放| 在线看片你懂得| 天天综合网日韩| 就去色蜜桃综合| 成人免费在线网址| 一区二区三区视频免费在线观看| 日本精品视频一区二区| 久久色在线播放| 麻豆国产91在线播放| 精品极品在线| 午夜精品一区二区在线观看的| 欧美三级欧美一级| 精品69视频一区二区三区Q| av中文在线| 久久久久se| 精品国产亚洲在线| 国产馆精品极品| 99精品美女视频在线观看热舞| 欧美精品99久久| 久久免费精品视频| 夜夜操天天操亚洲| 欧美在线免费一级片| 国产精品无码2021在线观看| 激情视频在线观看一区二区三区| 日韩亚洲欧美一区| 国产一区二区三区在线观看免费视频| 色综合桃花网| 日本激情视频在线| 国产美女主播一区| 欧美日韩你懂得| 国产乱码精品一区二区三区av| 青草综合视频| 嫩草嫩草嫩草| 精品久久久久久一区| 日韩高清av一区二区三区| 成人三级在线视频| 亚洲欧美日本伦理| 免费a在线看| 国产极品粉嫩福利姬萌白酱 | 最近中文字幕mv第三季歌词| 92国产精品视频| 亚洲国产精品久久久久秋霞不卡|