国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

可能是目前最好的3B多模態模型,有望做“AI作業幫”

人工智能
AI作業助手,特別是數學作業助手,僅僅有答案還不夠,更重要的是給出推導過程。這也是VLR1-3B的重要能力,就是它的推理能力。

作者 | 徐浚哲、尹宇陽

我們團隊近期開源多模態模型VLR1-3B的預覽版(preview),歡迎大家嘗試:

https://huggingface.co/TencentBAC/TBAC-VLR1-3B-preview

我們訓練了一個3B的“小”模型,使用了強化學習訓練方式,增強了推理性能。達到了同級別模型中推理能力第一(SOTA)。

主要是數學相關的測試,在MathVista和MathVision這兩個權威AI數學榜單的官網上,VLR1-3B 這“小”模型不僅都在榜,而且比很多商業閉源大模型(如Gemini1.5和GPT-4V)表現都要強,甚至在MathVista的評測中領先GPT-4o~

同時對比了多個banchMark結果,Average第一~

Model

Average

MathVista

MathVision

MathVerse

DynaMath

WeMath

LogicVista

Qwen2-VL-2B

20.5

48.0

16.1

17.5

3.8

10.8

26.6

InternVL2.5-2B

21.2

51.1

14.0

22.3

4.4

8.0

27.3

InternVL3-2B

29.1

57.6

20.2

24.5

14.8

22.9

40.3

Qwen2.5-VL-3B

31.8

61.2

21.9

31.2

13.2

22.9

40.3

VLM-R1-3B-Math-0305

33.4

62.7

21.9

32.2

13.0

30.0

40.5

Taichu-VLR-3B

33.6

64.9

23.1

32.1

12.6

30.4

38.7

VLAA-Thinker-Qwen2.5VL-3B

35.4

61.0

24.4

36.4

18.2

33.8

38.5

TBAC-VLR1-3B-preview

35.7

64.8

25.0

33.2

17.7

32.4

40.8

正巧最近正愁幫鄰居剛上初中的孩子批數學作業,被多項式計算和幾何證明搞得焦頭爛額的。

現在試著擼個自己的“AI作業幫”,幫干活。

一、AI作業助手

要說明的是,AI作業助手,特別是數學作業助手,僅僅有答案還不夠,更重要的是給出推導過程。這也是VLR1-3B的重要能力,就是它的推理能力。

下面來看一下搭載了VLR1-3B模型后,我這個丐版的“作業幫”真實的答題效果。

1. 多項式計算

先從真題試卷中截取了兩道基礎計算題進行測試:

哪怕是拍照的試卷問題也可以準確的識別,計算過程也清晰,答案正確??,通過。再試一道:

很好,應用了正確的公式??,鄰居家小孩似乎可以愉快的抄寫作業了呢??

2. 坐標系理解

接下來要稍微上一點難度,看看 VLR1-3B 對平面直角坐標系的理解如何:

不錯,一開始就理解了這一題的考點,并告知了題點,橫縱坐標都為負的點,然后還分析了每個選項,給出正確答案。解釋的有理有據??。以后還會有家長給熊孩子講題講到心梗嗎??

3. 函數計算

下面要進行的是函數計算,依然考驗模型從圖片中正確的讀取函數公式,并依靠推理能力得出函數計算結果:

問題:f(4)等于多少?

函數識別??,計算過程??,答案?。

4. 平面幾何

接下來是重中之重的測試,平面幾何。先來兩道填空題:

問題:△ABC的兩內角平分線OB、OC相交于點O,若∠A=110°,則∠BOC=()

表現依然出色,不僅給出了詳盡的推理過程,還給出了準確的答案 ?

接下來再來一題:

問題:如圖,在△ABC中,AB=8,BC=12,點D、E分別是邊AB、AC的中點,點F是線段DE上的一點,連接AF、BF,若∠AFB=90°,則線段EF的長為()

非常棒平面幾何解題能力??,在應用了正確的公式定理下,還會用“∵”,“∴”等專業的數學推理符號

平面幾何是中學數學的重點,與填空和選擇不同,模型有可能靠蒙答對題(人也會哈),這種證明類型的題目更考驗模型的“真本事”,再來測試一道平面幾何的證明題:

沒問題,證明過程清晰,測試通過 ?。

5. 物理

既然 VLR1-3B 在數學方面表現的這么好,何不再挑戰一下,做個物理題試試?

哦吼~,物理題也能答,還能解釋對自己的選擇。

二、What's more?

從之前的測試來看,VLR1-3B 有確實有著出眾的數學能力,從圖片的公式理解到答案的推理求解,甚至格式的輸出都有著令人滿意的效果。既然如此,當然就要“強模型所難”, 考驗一下VLR1-3B 在其他通用多模態場景的表現:

先用我最喜歡的貓咪開始測試,詢問它圖中貓的花紋、品種和年齡:

Bingo,回答很準確~

再來,因為有從事的是自動駕駛算法研究的經驗,所以凡是遇到有視覺能力的模型,都會被我拿來測一下:

連自動駕駛車輛都認識,那真實道路場景表現怎么樣呢?

相當可以,車輛數量、顏色、類型都判斷正確 ?,同時天氣和駕駛環境也準確識別。再來個夜晚場景,問問前方車輛的行駛意圖:

看來可以呀,到這,發現這確實是個麻雀雖小,五臟俱全的多模態模型~

三、結語

總體測試下來,過程中雖然也遇到了該級別模型的常見問題——如思考過程中的幻覺,特別是一些測試中,結果是正確的,但思考過程卻明顯失誤。但在后續更新和實際落地場景中,使用場景數據來Fine-tune后的模型能取得更好的效果。

話又說回來,畢竟是一個只有 3B的模型,它有望成為開源本地 “家庭 AI 作業幫”的的選手,后續會發表詳細的技術報告和論文。同時公開更多尺度的模型~

責任編輯:趙寧寧 來源: 騰訊技術工程
相關推薦

2024-08-28 11:56:33

2023-10-04 11:55:24

AI模型

2018-07-16 15:05:43

Redis內存數據庫

2020-05-17 16:06:47

ICMPIP協議網絡協議

2025-10-17 09:08:05

2024-10-17 18:52:41

2024-03-27 09:09:57

模型AI開源

2018-11-05 08:10:30

Netty架構模型

2023-11-28 12:49:37

數據訓練

2023-01-08 13:07:46

2025-07-10 08:57:59

2017-12-15 10:00:46

前端框架Vue.js

2019-07-26 11:27:25

MySQLSQL數據庫

2024-06-04 14:09:00

2025-11-17 09:19:10

AI模型開源

2024-01-17 12:08:32

模型訓練

2021-06-28 08:39:04

外包職位企業

2025-02-07 11:00:00

模型開源AI

2025-01-08 08:21:16

2023-05-09 16:02:14

人工智能ChatGPT
點贊
收藏

51CTO技術棧公眾號

国产色91在线| 欧美交受高潮1| 中文字幕国产免费| 懂色av一区二区在线播放| 97视频资源在线观看| 免费观看成人www动漫视频| 日韩精品亚洲精品| a级网站在线播放| 欧美日韩激情一区二区| 97涩在线观看视频| 国产欧美日韩中文久久| 黄页免费在线观看视频| 国产一区二区三区香蕉| 日韩精品在在线一区二区中文| 亚洲天堂免费| 亚洲伊人第一页| 欧美精品播放| 精品久久久久久一区二区里番| 午夜久久tv| 国产传媒欧美日韩| 极品日韩av| 女同一区二区| 三年中国国语在线播放免费| 麻豆精品网站| 少妇精品久久久久久久久久| 麻豆成人在线| 亚洲免费视频一区| 欧美96一区二区免费视频| 亚洲一区美女| 国产91精品一区二区麻豆亚洲| 91视频成人免费| 久久综合资源网| 日韩精品免费播放| 1区2区3区欧美| 啊啊啊射了视频网站| 亚洲综合一区二区三区| 情趣网站在线观看| 欧美日韩久久久| 嗯~啊~轻一点视频日本在线观看| 欧美精品一区二区三区在线| 天堂中文最新版在线中文| 中文字幕亚洲二区| 国产色噜噜噜91在线精品 | 欧美日韩精品久久久| 在线观看三级视频| 中文字幕亚洲综合| 欧美久久一区二区三区| 日本欧美一级片| 亚洲经典在线看| 97碰在线视频| 亚洲综合图片区| 无遮挡动作视频在线观看免费入口| 欧美不卡一二三| 91精品视频一区二区| 国产精品高潮粉嫩av| 亚洲伊人观看| 日本网站免费在线观看| 亚洲国产精品一区二区久久恐怖片 | 影视一区二区三区| 国内精品小视频在线观看| 97精品国产| 五码日韩精品一区二区三区视频| 性开放的欧美大片| 在线成人午夜影院| 欧美黄视频在线观看| 91精品综合久久久久久五月天| 久久久久一区| 日韩精品你懂的| 日韩一区二区免费在线观看| 狂野欧美xxxx韩国少妇| 91一区二区三区| 成人午夜精品在线| 每日更新在线观看av| 亚洲人成自拍网站| 国产精品久久久久一区二区三区厕所 | 久久夜色精品国产噜噜av| 亚洲欧美日韩另类精品一区二区三区| 91免费观看国产| 雨宫琴音一区二区在线| 99热在线观看免费| 国外色69视频在线观看| 成人白浆超碰人人人人| 成人免费在线电影网| 国产乱子伦农村叉叉叉| 久久精品91久久香蕉加勒比| 日韩人在线观看| 成人免费观看视频| 四虎影视国产在线视频| 777午夜精品福利在线观看| 国产美女91呻吟求| 99re国产精品| jizz18欧美| 一区二区三区国产在线观看| 天天久久综合| www.色就是色| 欧美www在线| 懂色av一区二区三区免费观看| 欧美日韩在线精品一区二区三区激情综| 亚洲国产日韩欧美在线99| 亚洲成人99| 美女做暖暖视频免费在线观看全部网址91 | 超碰97在线免费| 欧美国产精品中文字幕| 国产www视频在线观看| 国产精品视频26uuu| 国产精品二区一区二区aⅴ污介绍| 一个人www视频在线免费观看| 一级黄色片播放| 亚洲成av人片www| 国产成人综合在线| sese一区| 色综合 综合色| 国产精品久久视频| 日本激情在线观看| 欧美日韩激情在线| 亚洲一区网址| www一区二区www免费| 亚洲男女性事视频| 久久99精品久久久久久| 人禽交欧美网站| 免费的很黄很污的视频网站| 久久精品中文字幕一区| 国产精品性做久久久久久| 2021天堂中文幕一二区在线观| 国产亚洲情侣一区二区无| 亚洲一区二区四区蜜桃| 久久久免费毛片| 一本色道久久加勒比88综合| 欧美亚洲成人网| 日韩欧美国产不卡| 日韩国产综合| 日韩精品卡一| 麻豆md0077饥渴少妇| 欧美成人免费在线视频| 久久人人超碰精品| 青青青国内视频在线观看软件| 日韩精品有码在线观看| 中文无码日韩欧| 草久在线视频| 欧美日韩在线中文| 中文字幕高清在线观看| 亚洲欧美99| 色综合色综合色综合| 五月精品视频| 成人午夜影视| 日韩女优中文字幕| 亚洲精品视频二区| 国产成人99久久亚洲综合精品| 超碰一区二区| 欧美国产日韩激情| 欧美xxxx综合视频| 国产黄色片在线播放| aa成人免费视频| 欧美日产在线观看| 免费一区二区视频| 国产盗摄——sm在线视频| 成人区一区二区| 色综合久久精品亚洲国产| 国产欧美一区视频| 成人一区而且| 亚洲精品传媒| 国产高清免费在线| 久久综合久中文字幕青草| 《视频一区视频二区| 日韩系列欧美系列| 欧美xxxx做受欧美88bbw| av在线免费观看国产| 97久久国产精品| 欧美午夜久久久| 麻豆精品一区二区综合av| 国产亚洲亚洲国产一二区| 2020中文字幕在线播放| 欧美日韩喷水| 久久天天躁夜夜躁狠狠躁2022| 一区二区三区精品| 视频一区在线播放| 视频在线观看免费影院欧美meiju 视频一区中文字幕精品 | 国产女人aaa级久久久级| 欧洲grand老妇人| 成人短视频在线观看| 日本a视频在线观看| 国产精品成人国产乱一区| 欧美不卡一区二区三区四区| 国产婷婷精品av在线| 黄色亚洲精品| 国产精品国产亚洲精品| youjizz在线播放| 鲁一鲁一鲁一鲁一澡| 国产麻豆日韩| 国内伊人久久久久久网站视频 | 91麻豆福利| 日韩欧美视频第二区| 欧美激情a∨在线视频播放 | 欧美一区三区二区| 精品久久美女| 成人免费网站在线观看视频| 久久久亚洲精品无码| 亚洲影院高清在线| 日韩中文字幕网| 精品久久久久久久久国产字幕|