国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

一文帶你全面理解向量數據庫

譯文 精選
數據庫 其他數據庫
我經常(已經)遇到的一個問題是:我們不能只使用NumPy數組來存儲嵌入嗎?——當然,如果你沒有很多嵌入,或者你只是在做一個有趣的愛好項目,你可以這樣做。但正如你已經猜到的,當你有很多嵌入時,向量數據庫會明顯更快,而且你不必把所有東西都保存在內存中。

作者丨Leonie Monigatti

譯者丨朱先忠

審校丨重樓

近些年來,向量數據庫引起業界的廣泛關注,一個相關事實是許多向量數據庫初創公司在短期內就籌集到數百萬美元的資金。

你很可能已經聽說過向量數據庫,但也許直到現在才真正關心向量數據庫——至少,我想這就是你現在閱讀本文的原因……

如果你閱讀本文只是為了簡單回答上面的問題,那就讓我們直接進入話題吧。

1、定義:什么是向量數據庫?

向量數據庫是一種以向量嵌入(高維向量)方式存儲和管理非結構化數據(如文本、圖像或音頻)的數據庫,以便于快速查找和檢索類似對象。

如果這個定義只會引起人們更多的理解上的混亂,那么就讓我們一步一步來進行解釋。本文的靈感來自WIRED的5級視頻系列(https://www.wired.com/video/series/5-levels),本文將揭示向量數據庫在以下三個難度級別中的內容:

  • 最淺顯的解釋
  • 向數字原住民和技術愛好者解釋向量數據庫
  • 向工程師和數據專業人員解釋向量數據庫

2、向量數據庫:最淺面的解釋

這有點離題,但你知道我不明白的是什么嗎?當人們按顏色排列書架時,哎喲!當他們不知道書的封面是什么顏色時,他們是如何找到書的?

圖片圖片


1)向量數據庫背后的直覺

如果你想快速找到一本特定的書,那么,按類型和作者排列書架比按顏色排列更有意義。這就是為什么大多數圖書館都是這樣組織的原因,以便幫助你快速找到你想要的東西。

但是,你如何根據一個查詢而不是一個流派或作者來找到可以閱讀的書籍呢?如果你想讀一本書,例如:類似于《饑餓的毛毛蟲》或關于一個和你一樣喜歡吃美食的主角?

如果你沒有時間瀏覽書架,最快的方法是向圖書管理員征求他們的推薦,因為他們讀過很多書,會確切地知道哪本書最適合你的查詢。

在組織書籍的例子中,你可以將圖書管理員視為向量數據庫,因為向量數據庫旨在存儲關于對象(例如書籍)的復雜信息(例如書籍的情節)。因此,向量數據庫可以幫助你根據特定的查詢(例如,一本關于…的書)而不是一些預定義的屬性(例如,作者)來查找對象,就像圖書管理員一樣。

3、向數字原住民和技術愛好者解釋向量數據庫

現在,讓我們繼續探討圖書館的例子,并獲得更多的技術知識:當然,現在,在圖書館中搜索書籍的技術比只按類型或作者搜索更先進了一些。

如果你去圖書館,通常角落里會有一臺電腦,可以幫助你找到一本具有更具體屬性的書,比如書名、國際標準圖書編號、出版年份或一些關鍵詞。根據輸入的值,就可以查詢存儲可用書籍信息的數據庫。不過,這個數據庫通常是一個傳統的關系數據庫。

圖片圖片

1)關系數據庫和向量數據庫之間的區別是什么?

關系數據庫和向量數據庫之間的主要區別在于它們存儲的數據類型。雖然關系數據庫是為適合表的結構化數據而設計的,但是,向量數據庫即是為非結構化數據(如文本或圖像)而設計的。

存儲的數據類型也會影響數據的檢索方式:在關系數據庫中,查詢結果基于特定關鍵字的匹配。在向量數據庫中,查詢結果是基于相似性進行的。

你可以把傳統的關系數據庫想象成電子表格。它們非常適合存儲結構數據,例如關于一本書的基本信息(例如,標題、作者、ISBN等),因為這類信息可以存儲在列中,非常適合過濾和排序。

使用關系數據庫,你可以快速獲取所有書籍,例如兒童書籍,并且標題中有“毛蟲”。

但是,如果你喜歡《饑餓的毛毛蟲》是關于食物的呢?你可以試著搜索關鍵詞“食物”,但除非在書的摘要中提到關鍵詞“食品”,否則你甚至找不到“非常饑餓的毛毛蟲”。相反,你可能會以一堆烹飪書和失望告終。

這是關系數據庫的一個限制:你必須添加你認為某人可能需要的所有信息才能找到該特定項目。但是,你怎么知道該添加哪些信息以及添加多少信息呢?添加所有這些信息往往非常耗時,并且不能保證完整性。

然而,這正是向量數據庫發揮作用的地方!

不過,你首先需要先來了解一下一個叫做向量嵌入(vector embeddings)的概念。

今天的機器學習(ML)算法可以將給定的對象(例如,單詞或文本)轉換為保留該對象信息的數字表示。想象一下,你給一個ML模型一個詞(例如,“食物”),然后這個ML模型發揮了它的魔力,給你返回了一長串數字。這個長長的數字列表是單詞的數字表示,即稱為向量嵌入。

因為這些嵌入是一長串數字,所以我們稱之為高維。讓我們假設這些嵌入只是三維的,以便將它們可視化,如下所示。

圖片圖片

你可以看到,類似的單詞,如“饑餓”(hungry)、“口渴”(thirsty)、“食物”(food)和“飲料”(drink),都被分組在一個相似的角落里,而其他單詞如“自行車”(bicycle)和“汽車”(car),則在這個向量空間中靠近在一起,但在不同的角落里。

數字表示使我們能夠將數學計算應用于通常不適合計算的對象,如單詞。例如,除非將單詞替換為其嵌入;否則,以下計算將不起作用:

drink - food + hungry = thirsty

因為我們可以使用嵌入進行計算,所以我們也可以計算一對嵌入對象之間的距離。兩個嵌入對象之間的距離越近,它們就越相似。

正如你所看到的,向量嵌入非常酷。

讓我們回到前面的例子,假設我們將每本書的內容嵌入到圖書館中,并將這些嵌入存儲在向量數據庫中。現在,當你想找到一本“主角喜歡食物的童書”時,你的查詢也會被嵌入,并返回與你的查詢最相似的書籍,例如《饑餓的毛毛蟲》或《金發姑娘與三只熊》。

2)向量數據庫的使用情況是什么?

事實上,向量數據庫在大型語言模型(LLM)的宣傳開始之前就已經存在了。最初,它們被應用于推薦系統中,因為它們可以快速找到給定查詢的相似對象。但是,由于它們可以為大型語言模型提供長期記憶,因此最近也被應用于問答應用程序中。

4、向工程師和數據專業人員解釋向量數據庫

如果在打開本文之前,你已經猜到向量數據庫可能是存儲向量嵌入的一種方式,并且只想知道向量嵌入的背后是什么,那么,現在讓我們來深入了解并討論一下相關的算法。

1)向量數據庫是如何工作的?

向量數據庫能夠快速檢索查詢中的類似對象,因為它們已經預先計算過了。其基本概念被稱為近似最近鄰(Approximate Nearest Neighbor:ANN)搜索,它使用不同的算法來索引和計算相似性。

正如你所能想象的,當你有數百萬個嵌入時,用簡單的k近鄰(kNN)算法計算查詢和每個嵌入對象之間的相似性可能會變得相當耗時。而使用ANN搜索算法,你可以以一定的準確性換取速度,并檢索與查詢近似最相似的對象。

索引:為此,向量數據庫對向量嵌入進行索引。此步驟將向量映射到數據結構,從而實現更快的搜索。

你可以把索引看作是把圖書館里的書分成不同的類別,比如作者或流派。但由于嵌入可以包含更復雜的信息,進一步的分類可能是“主角的性別”或“情節的主要位置”。因此,索引可以幫助您檢索所有可用向量的較小部分,從而加快檢索速度。

我們不會討論索引算法的技術細節;但是,如果你有興趣進一步閱讀,你可能想從查找分層導航小世界(Hierarchical Navigable Small World:HNSW)開始。

相似性度量:為了從索引向量中找到查詢的最近鄰居,向量數據庫應用相似性度量。常見的相似性度量包括余弦相似性、點積、歐幾里得距離、曼哈頓距離和漢明距離(Hamming distance)。

2)向量數據庫相對于將向量嵌入存儲在NumPy數組中的優勢是什么?

我經常(已經)遇到的一個問題是:我們不能只使用NumPy數組來存儲嵌入嗎?——當然,如果你沒有很多嵌入,或者你只是在做一個有趣的愛好項目,你可以這樣做。但正如你已經猜到的,當你有很多嵌入時,向量數據庫會明顯更快,而且你不必把所有東西都保存在內存中。

最后,我僅會簡短地說一句,因為伊桑·羅森塔爾在解釋使用向量數據庫和使用NumPy數組之間的區別方面做得比我寫的要好得多。有關此內容的更多信息,請參考他的文章《你真的需要向量數據庫嗎?》,網址是:www.ethanrosenthal.com。

——譯者介紹——

朱先忠,51CTO社區編輯,51CTO專家博客、講師,濰坊一所高校計算機教師,自由編程界老兵一枚。

原文鏈接:https://towardsdatascience.com/explaining-vector-databases-in-3-levels-of-difficulty-fc392e48ab78

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2024-05-22 09:45:49

2023-12-26 08:08:02

Spring事務MySQL

2021-07-21 09:24:25

MongoDB數據庫 Python

2023-02-06 18:10:00

前端

2019-10-11 08:41:35

JVM虛擬機語言

2022-08-18 09:00:00

自動駕駛合成控制邁阿密

2021-09-08 17:42:45

JVM內存模型

2020-03-18 13:40:03

Spring事數據庫代碼

2022-07-18 21:53:46

RocketMQ廣播消息

2020-10-08 14:32:57

大數據工具技術

2023-07-31 08:18:50

Docker參數容器

2021-05-29 10:11:00

Kafa數據業務

2022-11-11 19:09:13

架構

2023-11-06 08:16:19

APM系統運維

2022-07-28 09:02:41

文件存儲系統

2019-04-08 15:17:15

Windows操作系統功能

2022-05-11 07:38:45

SpringWebFlux

2023-11-20 08:18:49

Netty服務器

2022-12-20 07:39:46

2023-12-21 17:11:21

Containerd管理工具命令行
點贊
收藏

51CTO技術棧公眾號

欧美一区二区三区小说| 久久综合久久八八| 奇米一区二区三区| 国产suv精品一区二区6| 韩国在线一区| 香蕉综合视频| 3d性欧美动漫精品xxxx软件| 欧美电影免费看| 情se视频网在线观看| 日本www在线视频| 在线免费激情视频| 欧美zozo| 亚洲国产中文在线二区三区免| 久久66热re国产| 久久久久久久综合| 国产欧美日韩伦理| 欧美aaaaaa| 高潮白浆女日韩av免费看| 国产精品99久久久久久人| 天天干天天玩天天操| 日韩欧美在线中字| 亚洲国产精品va在线| 男人的天堂99| 国产做a爰片久久毛片| 国产综合福利在线| 91jq激情在线观看| 一区二区三区中文在线| 国产亚洲精品自在久久| 九色porny丨国产首页在线| 91丨九色丨尤物| 日韩电影在线播放| 黄色美女久久久| 亚洲成色777777在线观看影院| 国产在线精品自拍| 日韩欧美在线中字| 欧美国产日韩一区二区在线观看 | 福利片免费在线观看| 久久精品一区二区三区不卡牛牛 | 特大黑人娇小亚洲女mp4| 影音先锋日韩资源| 成人性生交大片免费观看嘿嘿视频| 国产精品任我爽爆在线播放| h网站在线播放| 精品国产一区二区三区久久久蜜月| 天堂网www中文在线| 国产一区二区福利视频| 神马久久久久久| 三级毛片在线免费看| 日本午夜精品一区二区三区电影| 日韩视频不卡中文| www.浪潮av.com| 7777精品久久久久久| 亚洲电影二区| 欧美xxxx做受欧美.88| 三级欧美日韩| 4p变态网欧美系列| 欧美69wwwcom| 色乱码一区二区三区熟女| 国产视频视频一区| 黄页网站视频在线观看| 一道本成人在线| 女人让男人操自己视频在线观看 | 2020国产精品| 波多野结衣在线| 日韩一区二区在线看| avav成人| 成人免费看黄网站| 国产精品亚洲午夜一区二区三区| 免费黄视频网站| 亚洲成人网在线| 欧美最顶级丰满的aⅴ艳星| 不卡av在线免费观看| 欧美三级午夜理伦三级| 欧美日韩dvd| 日韩精品在线观看一区| 欧美日韩p片| 国产精品欧美在线| 日本在线不卡一区| 欧美色老女人| 欧美v日韩v国产v| 日韩激情网站| 亚洲人成网站在线播放2019| 亚洲人成精品久久久久| 久久久男人天堂| 国产日产久久高清欧美一区| 国产精品一二三区| 成人欧美一区| 日韩免费黄色av| 成人av网站在线观看免费| 成人p站proumb入口| 97在线视频精品| 国产成人午夜精品5599| 91福利在线视频| 国产激情视频一区| 国产日韩一区二区三免费高清| 国产精品美女xx| 91女厕偷拍女厕偷拍高清| av日韩一区二区三区| 欧美一区二区三区在| 欧美偷窥清纯综合图区| 国产日韩在线看| 狠狠色伊人亚洲综合成人| 黄色一级视频片| 欧美性大战久久久久久久 | 欧美极品一区二区三区| 亚洲不卡1区| 一本大道av伊人久久综合| 久久97精品| 国产综合av在线| 日韩精品福利在线| 免费亚洲网站| 免费一级在线观看播放网址| 欧洲亚洲妇女av| 91视频xxxx| 欧美专区福利免费| 在线视频一区观看| 欧美巨大另类极品videosbest | 精品一区二区三区四区在线| 在线成人激情黄色| 国产一区日韩一区| 亚洲qvod图片区电影| 国产精品欧美精品| 日韩伦理视频| 99精品全国免费观看视频软件| 青春草国产视频| 日韩国产精品亚洲а∨天堂免| 亚洲免费综合| 麻豆影院在线| 国产免费一区| 欧美三级蜜桃2在线观看| 羞羞答答成人影院www| 未来日记在线观看| 成人国产亚洲精品a区天堂华泰| 亚洲精品第1页| 欧美精品国产精品日韩精品| 国内精品视频一区二区三区八戒 | 在线观看免费一区| 日韩精品午夜| 久久国产精品一区| 7777kkk亚洲综合欧美网站| 91精品久久久久久蜜桃| 欧美性xxxxx极品| 午夜日韩激情| 在线观影网站| 91精品国产91久久久久青草| 欧洲精品一区二区| 精品999成人| 青春草在线视频| 91精品国产吴梦梦| 日韩中文字幕视频| 久久综合狠狠综合久久综合88| 国产伦理久久久久久妇女| 黄网免费视频| 国产美女久久精品香蕉69| 亚洲三级理论片| 亚洲欧洲国产日韩| 91影院在线观看| 亚洲一区 二区 三区| 国产精品麻豆成人av电影艾秋| 久久久久久久激情视频| 亚洲男女性事视频| 精品国产成人在线影院 | 中文字幕亚洲区| 韩日欧美一区二区三区| 在线视频亚洲| 欧美极品在线| 欧美成人视屏| 亚洲国产伊人| 成人全视频在线观看在线播放高清| 国产三级av在线| 18岁视频在线观看| 久久精品成人一区二区三区蜜臀| 亚洲日本aⅴ片在线观看香蕉| 欧美午夜寂寞影院| 一区二区三区在线免费| 国产精品老牛| 99久久99久久精品国产片桃花| 亚洲精品一区| 少妇视频在线| 欧美激情久久久久久久久久久| 日韩av网站在线免费观看| 成人羞羞动漫| 国产美女视频91| 欧美日韩激情视频8区| 性感美女久久精品| 成人免费毛片aaaaa**| 中国精品18videos性欧美| 亚洲成人a级片| 国产精品xxx| 香蕉免费一区二区三区在线观看| 亚洲四虎影院| 国产精品嫩草99av在线| 一区二区国产精品视频| 在线免费国产视频| 欧美亚洲在线| 色av一区二区| 亚洲国产精品成人| 亚洲欧美中日韩| 欧美精品在线免费| 国产成人jvid在线播放|