国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

LLM遇上表格:4類表示、5大任務(wù)、3大機(jī)會(huì)

發(fā)布于 2025-8-29 06:36
瀏覽
0收藏

1. 表格讓大模型頭疼?

文本是線性的,而表格是二維、結(jié)構(gòu)多變、目的多樣的——從嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)庫到多層嵌套的 Excel,再到 Wikipedia 的 Infobox。把 LLM 處理表格的“痛苦”總結(jié)為三點(diǎn):

痛點(diǎn)

概況

任務(wù)單一

90% 的 Benchmark 都在考「檢索+簡單數(shù)學(xué)」,真正需要推理的很少

輸入復(fù)雜就崩

長表、多表、層級(jí)表、跨文檔表,人類 80+ 分,SOTA 模型 50 分不到

表示不統(tǒng)一

同一張表換個(gè) JSON / HTML / Markdown,性能就能掉 5 個(gè)點(diǎn)

LLM遇上表格:4類表示、5大任務(wù)、3大機(jī)會(huì)-AI.x社區(qū)

左側(cè)用Text-To-Sql可解決,相比之下,右側(cè)展示的是需要高級(jí)推理或涉及復(fù)雜輸入的任務(wù)。

LLM遇上表格:4類表示、5大任務(wù)、3大機(jī)會(huì)-AI.x社區(qū)

大模型表格處理任務(wù)的工作流

2. 先把“表”說清楚:四種輸入表示法

把 LLM 能“吃進(jìn)”的表格表示分成 4 大類(對(duì)應(yīng) Figure 4):

LLM遇上表格:4類表示、5大任務(wù)、3大機(jī)會(huì)-AI.x社區(qū)

表示方式

優(yōu)點(diǎn)

缺點(diǎn)

典型 Benchmark

Serialization

 序列化

直接用文本,最簡單

結(jié)構(gòu)信息易丟失

WTQ, TabFact

Schema

 只給表頭+列類型

省 token

細(xì)節(jié)全丟

Spider, SEDE

Image

 表格截圖

保留完整視覺結(jié)構(gòu)

受分辨率限制

VISTABNet

Table Encoder

 專用編碼器

結(jié)構(gòu)感知最強(qiáng)

需要額外預(yù)訓(xùn)練

TableGPT2, TAPAS

實(shí)驗(yàn)發(fā)現(xiàn):同樣一道題,把 Markdown 換成 LaTeX,EM 分?jǐn)?shù)最多差 20%給了三種序列化示例:

LLM遇上表格:4類表示、5大任務(wù)、3大機(jī)會(huì)-AI.x社區(qū)

3. 5大人任務(wù)全景:不止Text-to-SQL 

整理了 3 大經(jīng)典任務(wù) + 2 個(gè)新興方向,并給出所有 Benchmark 一覽(Table 1~4):

任務(wù)

輸入

輸出

熱門數(shù)據(jù)集

Table QA

 表問答

表(+文本)+問題

答案單元格 / 數(shù)字 / 自由文本

WTQ, HiTab, MULTIHIERTT

Table-to-Text

 表到文本

表(+高亮區(qū)域)

一段描述或摘要

ToTTo, LogicNLG, QTSUMM

Fact Verification

 表事實(shí)核查

表+聲明

Supported / Refuted / NEI

TabFact, FEVEROUS

Text-to-SQL

 自然語言轉(zhuǎn) SQL

問題+數(shù)據(jù)庫

SQL 查詢

Spider, BIRD, Spider2

Leaderboard Construction

 排行榜自動(dòng)構(gòu)建

論文表格

(任務(wù), 數(shù)據(jù)集, 指標(biāo), 分?jǐn)?shù)) 四元組

AxCell, TeLin

LLM遇上表格:4類表示、5大任務(wù)、3大機(jī)會(huì)-AI.x社區(qū)

LLM遇上表格:4類表示、5大任務(wù)、3大機(jī)會(huì)-AI.x社區(qū)

LLM遇上表格:4類表示、5大任務(wù)、3大機(jī)會(huì)-AI.x社區(qū)

4. 三大發(fā)現(xiàn):新研究機(jī)會(huì)?

4.1 任務(wù)復(fù)雜度

  • 現(xiàn)有 Benchmark 大多是“把 SQL 翻譯成自然語言”再讓模型反推;
  • 真正的診斷、預(yù)測(cè)、洞察類問題(圖 3)幾乎空白;
  • Spider2首次引入意圖級(jí)問題:用戶說“給我一份每日關(guān)鍵銷售報(bào)告”,模型得自己猜要查哪些字段。

LLM遇上表格:4類表示、5大任務(wù)、3大機(jī)會(huì)-AI.x社區(qū)

4.2 輸入復(fù)雜度:長表、多表、層級(jí)表 = 模型噩夢(mèng)

  • MULTIHIERTT:人 83% vs 模型 <50%;
  • HiTab:層級(jí)多維表,模型同樣翻車;
  • 科學(xué)論文中的消融表 + 長文本,是未來絕佳試驗(yàn)田。

4.3 表示統(tǒng)一:換個(gè)格式就掉點(diǎn)

  • 同一任務(wù)里,JSON ? Markdown ? LaTeX 之間沒有統(tǒng)一規(guī)范;
  • 未來可以搞“格式互譯”任務(wù),讓模型見多識(shí)廣。

https://arxiv.org/pdf/2508.00217
Tabular Data Understanding with LLMs: A Survey of Recent Advances and Challenges

本文轉(zhuǎn)載自??????????????????PaperAgent??

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
国产99久久久久| 成人一区二区三区| 亚洲а∨天堂久久精品9966 | 爆操欧美美女| av不卡在线播放| 成人欧美一区二区三区视频| 福利视频一区| 91精品国产黑色紧身裤美女| 久久久久久色| 色综合天天狠天天透天天伊人| 日本中文字幕伦在线观看| 中文字幕在线不卡一区| 成人美女视频在线看| 欧美性少妇18aaaa视频| 97在线免费视频| 1024国产在线| 亚洲国产毛片aaaaa无费看| 国产精品无码人妻一区二区在线 | 日韩成人在线电影| 日韩欧美你懂的| 国产乱子伦三级在线播放| 中文字幕一区二区三区四区 | 国产精品国产福利国产秒拍| 国产麻豆精品| 日韩精品视频观看| free性欧美hd另类精品| 色猫猫国产区一区二在线视频| 韩国中文字幕av| 欧美深夜视频| 成人精品视频网站| 日韩在线第一区| 女人天堂亚洲aⅴ在线观看| 欧美亚洲国产视频| 91精品入口| 欧美黄色免费网站| 男女小视频在线观看| 992tv国产精品成人影院| 高清一区二区三区视频| 日韩成人一级| 欧洲成人性视频| 成人动态视频| 午夜精品一区二区三区av| 国产在线一区不卡| 伦理中文字幕亚洲| 日韩在线视频一区二区三区| 久久91超碰青草是什么| 2021年精品国产福利在线| 欧美成在线观看| 日韩视频一二区| 91精品国产高清久久久久久| 日韩高清影视在线观看| 97成人超碰免| 日韩精品免费| 日韩大尺度黄色| 精品国免费一区二区三区| 写真福利理论片在线播放| 欧美一三区三区四区免费在线看| 午夜成在线www| 欧美日韩精品福利| 色诱视频在线观看| 欧美日韩不卡视频| 嫩草影院网站在线| 欧美日韩中文国产| 超碰97成人| 国产毛片毛片| 999在线观看视频| 亚洲天堂第一页| 91亚洲国产| 亚洲一二三区在线| 精品一区二区日韩| 国产精品高潮呻吟久久av无限| 爱看av在线| 98精品国产自产在线观看| 日本久久精品| 亚洲在线www| 国产精品网站在线| 国产精品对白久久久久粗| 欧美一级大胆视频| 亚洲一二三四区不卡| 白浆爆出在线观看| 亚洲国产欧美在线| a级网站在线播放| 国产一区二区黑人欧美xxxx| 亚洲欧美一级二级三级| 色噜噜狠狠色综合网| 国产一二在线播放| 久热国产精品视频| 色天天久久综合婷婷女18| 日本一区二区久久精品| 99re在线精品| 在线中文字幕资源| 亚洲精品久久久久中文字幕欢迎你 | 亚洲18私人小影院| 大陆精大陆国产国语精品| 国产精品国产自产拍高清av水多| 亚洲激情视频| 日韩欧美精品在线观看视频| 日本高清免费不卡视频| 粉嫩av一区二区三区四区五区| 国产一区视频在线播放| 国产综合一区二区| 在线国产中文字幕| 亚洲人成电影网| 日韩电影一区| 国产日韩欧美精品在线观看| 欧洲精品一区二区三区在线观看| 国产美女视频一区二区| 欧洲亚洲一区二区三区四区五区| 国产精品久久久久久久久免费桃花 | 国a精品视频大全| 在线观看18视频网站| 日韩美女视频19| 成人免费网站观看| 成人激情av在线| av不卡在线播放| av网址在线| 亚洲xxxxx| 国产精品人妖ts系列视频| 日本午夜激情视频| 日本久久电影网| 99ri日韩精品视频| 亚洲啊啊啊啊啊| 制服丝袜亚洲网站| 大色综合视频网站在线播放| 18禁免费观看网站| 欧美黄污视频| 欧美私人情侣网站| 日韩电影网在线| 国产精品久久久久久久久久妞妞 | 亚洲男人的天堂在线| 欧美日韩免费观看一区=区三区| 视频在线观看免费高清| 亚洲午夜国产成人av电影男同| 亚洲精品1区| 在线麻豆国产传媒1国产免费| 欧美人交a欧美精品| 国产一区二区影院| 中文字幕在线播放| 国产精品日韩电影| 亚洲精品国产偷自在线观看| 成人3d动漫一区二区三区| 亚洲免费伊人电影在线观看av| 中文亚洲欧美| www.在线视频.com| 91视频免费网站| 亚洲自拍另类综合| 加勒比中文字幕精品| 黄色片视频在线免费观看| 亚洲精品视频二区| 激情五月婷婷综合网| av蜜臀在线| 亚洲国产另类久久久精品极度| 欧美日韩电影一区| av不卡在线看| 国产美女福利在线| 欧美精品一区二区三区在线看午夜| 日本韩国一区二区三区| 欧美区一区二| 成人在线免费观看| 国产精品久久久久久久久久久久冷| 亚洲精品美国一| 自拍亚洲一区| 免费高清在线| 91色中文字幕| 欧美日韩中文字幕一区二区| 国产欧美高清| 国产传媒在线| 国内精品在线观看视频| 精品国产自在精品国产浪潮| 国产视频一区二区在线观看| 欧美天堂影院| 桃乃木香奈av在线| 国产精品久久国产精品| 精品久久人人做人人爰| 国产精品888| swag国产精品一区二区| 91青娱乐在线视频| 国产精品久久久久av福利动漫| 欧美精品少妇一区二区三区| 美洲天堂一区二卡三卡四卡视频| 日韩av中字| 久久撸在线视频| 亚洲曰本av电影| 日韩女优av电影在线观看| 国产另类ts人妖一区二区| 久久在线观看| 羞羞视频网站在线观看| 涩涩涩999| 欧美成人亚洲成人日韩成人| 亚洲欧洲性图库| 一区二区三区福利| 国产电影一区二区三区爱妃记| 国产免费黄视频在线观看| 成人h在线播放| 亚洲女同性videos| 亚洲日本在线观看| 久久久久一区| 国产精东传媒成人av电影| 成人av电影观看| 91成人在线观看喷潮教学|