国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

表格增強(qiáng)生成TAG登場(chǎng):解鎖AI自然語(yǔ)言與數(shù)據(jù)庫(kù)的完美結(jié)合

人工智能 新聞
與 Text2SQL 或 RAG 不同,TAG 充分利用了數(shù)據(jù)庫(kù)系統(tǒng)和 LLM 的功能。

人工智能已經(jīng)改變了人們的工作方式和與數(shù)據(jù)交互的方式。回想幾年前,研究人員必須編寫(xiě) SQL 查詢(xún)和代碼才能從大量數(shù)據(jù)中提取有用信息。如今,他們只需輸入問(wèn)題,由語(yǔ)言模型驅(qū)動(dòng)的底層系統(tǒng)會(huì)完成其余工作,讓用戶(hù)只需與數(shù)據(jù)對(duì)話(huà)即可立即獲得答案。

這些新系統(tǒng)向數(shù)據(jù)庫(kù)提供自然語(yǔ)言交互,這種轉(zhuǎn)變?nèi)〉昧素S碩成果,但仍存在一些問(wèn)題。從本質(zhì)上講,這些系統(tǒng)仍然無(wú)法處理各種查詢(xún)。

本文,來(lái)自 UC 伯克利和斯坦福大學(xué)的研究人員現(xiàn)在正努力用一種名為表格增強(qiáng)生成 (TAG,Table-Augmented Generation) 的新方法來(lái)解決這一問(wèn)題。

圖片


  • 論文地址:https://arxiv.org/pdf/2408.14717
  • 項(xiàng)目地址:https://github.com/TAG-Research/TAG-Bench
  • 論文標(biāo)題:Text2SQL is Not Enough: Unifying AI and Databases with TAG

TAG 是一種統(tǒng)一且通用的范式,用于回答數(shù)據(jù)庫(kù)中的自然語(yǔ)言問(wèn)題。TAG 模型代表了 LM 和數(shù)據(jù)庫(kù)之間未曾探索過(guò)的廣泛交互。

TAG 是如何工作的

目前,當(dāng)用戶(hù)對(duì)自定義數(shù)據(jù)源提出自然語(yǔ)言問(wèn)題時(shí),主要采用兩種方法:文本到 SQL 或檢索增強(qiáng)生成 (RAG)

雖然這兩種方法都能很好地完成工作,但當(dāng)問(wèn)題變得復(fù)雜并超出系統(tǒng)能力時(shí),用戶(hù)就會(huì)遇到問(wèn)題。

舉例來(lái)說(shuō),文本到 SQL 的方法(這是一種將文本提示轉(zhuǎn)換為數(shù)據(jù)庫(kù)可以執(zhí)行的 SQL 查詢(xún))僅關(guān)注可以用關(guān)系代數(shù)表達(dá)的自然語(yǔ)言問(wèn)題,但只能查詢(xún)用戶(hù)可能想要詢(xún)問(wèn)的一小部分問(wèn)題。

相似的,RAG 只能通過(guò)對(duì)數(shù)據(jù)庫(kù)中的一個(gè)或幾個(gè)數(shù)據(jù)記錄的點(diǎn)查找來(lái)回答相關(guān)的查詢(xún)。這種方法專(zhuān)注于直接從數(shù)據(jù)庫(kù)中檢索特定信息點(diǎn),而不涉及更復(fù)雜的數(shù)據(jù)處理或分析。 

然而,對(duì)于商業(yè)用戶(hù)來(lái)說(shuō),他們的問(wèn)題通常需要復(fù)雜的領(lǐng)域知識(shí)、世界知識(shí)、精確計(jì)算和語(yǔ)義推理的組合。

為了解決這一問(wèn)題,該研究提出了 TAG 系統(tǒng),其實(shí)現(xiàn)主要包含三個(gè)步驟:查詢(xún)合成、查詢(xún)執(zhí)行和答案生成

圖片

TAG 模型很簡(jiǎn)單,但功能強(qiáng)大,由以下三個(gè)方程定義:

圖片

值得注意的是,TAG 模型統(tǒng)一了之前的方法,包括 Text2SQL 和 RAG,它們僅代表了 TAG 的特殊情況并且僅能解決有限的用戶(hù)問(wèn)題子集。

查詢(xún)合成

首先,LM 推斷哪些數(shù)據(jù)與回答問(wèn)題相關(guān),并將輸入轉(zhuǎn)換為該數(shù)據(jù)庫(kù)的可執(zhí)行查詢(xún)(不僅僅是 SQL) 。

其中,syn 函數(shù)接受自然語(yǔ)言請(qǐng)求 ?? 并生成要由數(shù)據(jù)庫(kù)系統(tǒng)執(zhí)行的查詢(xún) ??。對(duì)于給定的用戶(hù)請(qǐng)求,此步驟負(fù)責(zé) (a) 推斷哪些數(shù)據(jù)與回答請(qǐng)求相關(guān),以及 (b) 執(zhí)行語(yǔ)義解析以將用戶(hù)請(qǐng)求轉(zhuǎn)換為可由數(shù)據(jù)庫(kù)系統(tǒng)執(zhí)行的查詢(xún)。此查詢(xún)可以使用任何查詢(xún)語(yǔ)言。論文示例中使用了 SQL。

如圖 1 所示,該查詢(xún)的問(wèn)題是「總結(jié)票房最高的被認(rèn)為是經(jīng)典的愛(ài)情電影的評(píng)論」。在這里,數(shù)據(jù)源包含有關(guān)每部電影的名字、收入、類(lèi)型和相關(guān)評(píng)論的信息。在此步驟中,系統(tǒng)利用 LM 的語(yǔ)義推理能力來(lái)生成 SQL 查詢(xún),該查詢(xún)使用來(lái)自數(shù)據(jù)源的電影標(biāo)題、評(píng)論、收入和類(lèi)型的屬性。

查詢(xún)執(zhí)行

在查詢(xún)執(zhí)行階段,exec 函數(shù)在數(shù)據(jù)庫(kù)系統(tǒng)中執(zhí)行查詢(xún)??,獲取表??。此步驟利用數(shù)據(jù)庫(kù)查詢(xún)引擎對(duì)大量存儲(chǔ)的數(shù)據(jù)進(jìn)行有效地查詢(xún)。

如圖 1 所示,數(shù)據(jù)庫(kù)查詢(xún)是用 SQL 編寫(xiě)的 selection 和 ranking 查詢(xún),它返回包含相關(guān)行的表。查詢(xún)使用 LM 執(zhí)行選擇,根據(jù)電影名字評(píng)估哪些電影是經(jīng)典電影,并使用標(biāo)準(zhǔn)類(lèi)型過(guò)濾器查找愛(ài)情電影。查詢(xún)還根據(jù)收入對(duì)結(jié)果進(jìn)行排名,以查找票房最高的電影。如圖所示,結(jié)果表包含電影泰坦尼克號(hào)的評(píng)論。

答案生成

在這一步中,gen 函數(shù)使用 LM 生成用戶(hù)自然語(yǔ)言請(qǐng)求 R 的答案 A。

還是以圖 1 為例,在 TAG pipeline 最后階段,輸出有關(guān)泰坦尼克號(hào)的評(píng)論摘要作為對(duì)原始用戶(hù)請(qǐng)求的回答。在示例中,相關(guān)數(shù)據(jù) ?? 被編碼為字符串,供模型處理。編碼表與原始用戶(hù)請(qǐng)求 ?? 一起傳遞給 LM。為了獲得答案,此步驟利用模型對(duì)評(píng)論列的語(yǔ)義推理能力來(lái)總結(jié)評(píng)論。

實(shí)驗(yàn)及結(jié)果

表 1 顯示了每種方法的精確匹配準(zhǔn)確率和執(zhí)行時(shí)間。如表所示,在選定的 BIRD (一個(gè)數(shù)據(jù)集,用于測(cè)試 LMs 的文本到 sql 的能力)查詢(xún)類(lèi)型中,研究者發(fā)現(xiàn)手寫(xiě) TAG(hand-written TAG)基線(xiàn)始終能達(dá)到 40% 或更高的精確匹配準(zhǔn)確率,而其他基線(xiàn)的準(zhǔn)確率均未超過(guò) 20%。

圖片

具體而言,Text2SQL 在所有基線(xiàn)上的表現(xiàn)都不佳,執(zhí)行準(zhǔn)確率不超過(guò) 20%,但在 Ranking 查詢(xún)上的表現(xiàn)尤其糟糕,準(zhǔn)確率只有 10%,因?yàn)樵S多 Ranking 查詢(xún)需要對(duì)文本進(jìn)行推理。Text2SQL + LM 在各個(gè)基線(xiàn)上的表現(xiàn)都同樣糟糕,但在基于匹配和比較的查詢(xún)上表現(xiàn)更差,準(zhǔn)確率只有 10%。

對(duì)于 RAG,可以看到它在所有查詢(xún)類(lèi)型中都不能正確回答單個(gè)查詢(xún),這表明 RAG 不適合這個(gè)領(lǐng)域的查詢(xún)。

手寫(xiě) TAG 總體上正確回答了 55% 的查詢(xún),在比較查詢(xún)中表現(xiàn)最佳,精確匹配準(zhǔn)確率為 65%。由于精確排序商品的難度較高,該基線(xiàn)在所有查詢(xún)類(lèi)型(排名查詢(xún)除外)中的表現(xiàn)始終良好,準(zhǔn)確率超過(guò) 50%。總體而言,與標(biāo)準(zhǔn)基線(xiàn)相比,此方法的準(zhǔn)確率提高了 20% 至 65%。

表 2 表明,由于省略了答案生成步驟,vanilla Text2SQL 在需要 LM 推理的查詢(xún)上表現(xiàn)較差,精確匹配準(zhǔn)確率為 10%。與此同時(shí),RAG 基線(xiàn)和 Retrieval + LM Rank 基線(xiàn)在所有查詢(xún)類(lèi)型上都表現(xiàn)不好,只能正確回答一個(gè)查詢(xún)。相比之下,手寫(xiě) TAG 基線(xiàn)在需要知識(shí)的查詢(xún)和需要推理的查詢(xún)上都實(shí)現(xiàn)了超過(guò) 50% 的準(zhǔn)確率。

圖片

值得注意的是,除了提供卓越的準(zhǔn)確率外,手寫(xiě) TAG 方法還提供了高效的實(shí)現(xiàn),與其他基線(xiàn)相比,執(zhí)行時(shí)間少用了 1/3。手寫(xiě)基線(xiàn)對(duì)所有查詢(xún)的平均耗時(shí)為 2.94 秒。

最后,該研究定性分析了每個(gè)基線(xiàn)在聚合查詢(xún)上的結(jié)果。圖 2 為一個(gè)示例展示,查詢(xún)的內(nèi)容為「提供有關(guān)雪邦國(guó)際賽車(chē)場(chǎng)的比賽資料」。

結(jié)果顯示,RAG 基線(xiàn)只能提供有關(guān)部分比賽的信息,因?yàn)榇蠖鄶?shù)相關(guān)比賽都無(wú)法被檢索到。另一方面,Text2SQL + LM 基線(xiàn)無(wú)法利用 DBMS 中的任何信息,僅依賴(lài)于參數(shù)知識(shí)并且不提供進(jìn)一步的分析。

相比較來(lái)說(shuō),手寫(xiě)基線(xiàn)提供了 1999 年至 2017 年在雪邦國(guó)際賽道舉行的所有比賽的詳盡摘要。

圖片

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2024-09-03 16:15:36

2023-08-03 09:56:47

自然語(yǔ)言AI

2024-12-23 11:31:05

大模型檢索人工智能

2024-09-10 08:31:20

2023-11-08 16:18:32

人工智能矢量數(shù)據(jù)庫(kù)

2021-05-13 07:17:13

Snownlp自然語(yǔ)言處理庫(kù)

2025-01-07 07:00:00

2025-02-11 08:00:00

大語(yǔ)言模型檢索增強(qiáng)生成CAG

2025-03-07 09:00:00

2023-09-20 12:13:47

開(kāi)發(fā)模型

2024-05-20 08:31:33

檢索增強(qiáng)生成LLM大型語(yǔ)言模型

2025-01-23 16:23:30

2023-10-14 17:46:17

RAG提示工程GPT-3

2024-06-18 15:36:50

2025-05-28 01:25:00

RAG人工智能語(yǔ)言模型

2020-04-24 10:53:08

自然語(yǔ)言處理NLP是人工智能

2025-01-26 12:34:46

AI運(yùn)維配置

2021-01-19 22:38:59

人工智能語(yǔ)言人臉識(shí)別
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧美fxxxxxx另类| av天天av| 亚瑟国产精品| 欧美国产日本视频| 日韩美女视频中文字幕| 毛片网站大全| 午夜欧美精品| 日韩欧美激情在线| 黑人巨大国产9丨视频| 欧美aaa级| 中文字幕一区二| 国产在线精品一区免费香蕉 | 成码无人av片在线观看网站| 青娱乐精品视频在线| 国产亚洲美女精品久久久| 国产日韩一区二区在线观看| 日韩高清三区| 狠狠色噜噜狠狠狠狠97| 久久精品人人做人人爽电影| www.久久久久.com| 高清不卡在线观看av| 久久久久久久爱| 中文字幕不卡| 亚洲伊人观看| 国产一区二区黑人欧美xxxx| 五月婷婷丁香色| 亚洲人成免费网站| 亚洲大胆美女视频| 日本一极黄色片| 日韩精品免费一区二区在线观看| 欧美日韩国产一二三| 亚洲色图都市激情| 国产精品17p| 色悠久久久久综合欧美99| 亚洲国产欧美日韩| 欧美.com| 欧美性猛交xxxx黑人| 天堂精品一区二区三区| 9999精品视频| 亚洲成a人v欧美综合天堂下载 | 国产一区免费| 经典三级一区二区| 一区二区中文字幕在线| 国产传媒欧美日韩| 91精品韩国| 亚洲最色的网站| 欧美不卡在线一区二区三区| 九七影院97影院理论片久久| 亚洲国产美国国产综合一区二区| 欧美中文娱乐网| 精品国产一区二| 欧美性极品少妇精品网站| 亚洲一区免费看| 久久影院资源站| 欧美久久免费观看| 日本日本19xxxⅹhd乱影响| 日本一二区不卡| 日韩国产高清视频在线| 2020色愉拍亚洲偷自拍| 一本久久综合| 欧美另类在线观看| 都市激情一区| av电影一区二区| 亚洲a级在线播放观看| 欧美黑人疯狂性受xxxxx野外| 伊人色综合久久天天人手人婷| 日韩高清三级| 看全色黄大色大片免费久久久| 91精品午夜视频| 丁香婷婷激情网| 99在线|亚洲一区二区| 日韩中文理论片| 三级在线视频| 成人av影院在线| 91精品国自产在线观看| 99久久伊人| 色婷婷综合激情| 国产综合中文字幕| 欧美黄色一区二区| 久久精品国产电影| av午夜在线| 国产午夜精品久久| 久久久久久99| 国内精品偷拍| 精品粉嫩aⅴ一区二区三区四区| 色婷婷亚洲十月十月色天| 三级欧美在线一区| 热久久这里只有精品| 999福利在线视频| 亚洲一区二区免费视频| 青青视频免费在线| 亚洲国产精品日韩专区av有中文 | 人九九综合九九宗合| av最新在线| 亚洲一区二区三区影院| 日韩不卡一二区| 97在线精品| 久久精品国产亚洲7777| 国产高清在线| 国产亚洲精品免费| 日韩精品久久久免费观看| 亚洲精品进入| 精品一区二区三区四区在线| 在线影院av| 97国产精品videossex| 精品在线视频一区二区| 红杏成人性视频免费看| 精品国产乱子伦一区| 日韩欧美亚洲一区| 豆国产96在线|亚洲| 国产精品果冻传媒潘| 成人自拍在线| 亚洲国产精品va在线看黑人| 国产在线制服美女| 成人av在线网| 免费看成人午夜电影| 久久综合色占| 日韩在线免费av| a级网站在线播放| 亚洲一区二三区| 欧美不卡在线播放| 先锋亚洲精品| 国产精品久久久久久五月尺| 91欧美精品| 欧美一区二区视频在线观看2022| 日本福利视频| av在线不卡免费看| 欧美三日本三级少妇三99| 精品一区二区三区中文字幕老牛| 中文字幕日韩精品在线观看| 老司机在线永久免费观看| 一区二区三区免费看视频| 男女视频网站在线观看| 久久亚洲精品伦理| 成人国产精品一区| 高清精品视频| 伊是香蕉大人久久| 国产婷婷视频在线| 亚洲国产成人av网| 色婷婷综合久久久久中文字幕| 久久97超碰色| 国产免费一区| 成人激情免费视频| 欧美国产第一页| 美女18一级毛片一品久道久久综合| 欧美日免费三级在线| 国产精品午夜久久久久久| 播五月开心婷婷综合| 视频在线99| 极品av少妇一区二区| 国产精品1234| 日韩欧美中文字幕一区二区三区| 亚洲另类激情图| 成人黄视频在线观看| 欧美日韩亚洲国产一区| 成人eeuss影院在线观看| 成人亚洲精品久久久久软件| 日韩av一区二区三区在线| 久久伦理在线| 97成人超碰免| 粉嫩av国产一区二区三区| 精品成人在线观看| 在线免费看黄网站| 亚洲va欧美va人人爽| 成人黄色免费电影| 91色婷婷久久久久合中文| www亚洲国产| 乱码第一页成人| 国产精品久久亚洲| 天天天综合网| 国产精品成人在线| 97久久超碰| 久久天堂电影网| 色天使综合视频| 日韩av在线不卡| 色呦呦呦在线观看| 欧美日韩免费观看一区三区| 在线中文视频| 亚洲一区在线看| 4kfree性满足欧美hd18| 国产日韩欧美在线一区| 91好吊色国产欧美日韩在线| 国产精品一二一区| 欧美 日韩 国产 在线观看| 日本va欧美va瓶| 日本一区二区三不卡| 国产日韩精品视频一区二区三区| 97超级碰碰| 中文字幕午夜精品一区二区三区 | 免费看美女视频在线网站| 91极品美女在线| 三区在线观看| 精品美女国产在线| 久久白虎精品| 一区二区高清视频在线观看| 99热在线观看免费| 国产精品视频第一区| 欧美成人黑人猛交| 久久亚洲二区三区| 日韩精品视频久久|