国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

馬斯克的首款多模態大模型來了,GPT-4V又被超越了一次

人工智能
昨天,xAI 推出了 Grok-1.5V,該模型不僅能理解文本,還能處理文檔、圖表、截圖和照片中的內容。

自從 2023 年 11 月 Grok 首次亮相以來,馬斯克的 xAI 正在大模型領域不斷取得進步,向 OpenAI 等先行者發起進攻。在 Grok-1 開源后不到一個月,xAI 的首個多模態模型就問世了。

昨天,xAI 推出了 Grok-1.5V,該模型不僅能理解文本,還能處理文檔、圖表、截圖和照片中的內容。

官方博文表示:「Grok-1.5V 在許多領域都能媲美當前頂尖的多模態模型,從多學科推理到理解文檔、科學圖表、圖表、截圖和照片。」 xAI 還表示,在接下來的幾個月里,預計將在圖像、音頻和視頻等各種模態上顯著提高模型能力。

我們看到了 Grok-1.5V 與 GPT-4V、Claude 3Sonnet、Claude 3 Opus 和 Gemini Pro 1.5 的測試對比。其中特別提到的是:「Grok 在理解物理世界方面的能力尤其令我們興奮。在我們新推出的 RealWorldQA 基準測試中,Grok 的表現優于同類產品。對于下面的所有數據集,我們都是在沒有思維鏈提示的情況下對 Grok 進行評估的。」

如果 Grok-1.5 能在類似于 Grok-1 的開源許可證下發布,這將成為當下 LLM 競爭格局的一個重要節點。

Grok-1.5V 表現如何?

目前,Grok-1.5V 還沒有完全開放,但會很快提供給早期測試者和現有的 Grok 用戶。不過,博客中展示了 Grok-1.5V 的七個示例。

第一個是將流程圖的白板草圖轉換為 Python 代碼:

Prompt:Can you translate this into Python code?(你能把它翻譯成 Python 代碼嗎?)

Grok:當然!您提供的流程圖描述了一個簡單的競猜游戲:計算機生成一個隨機數,用戶必須猜出它。下面是表示流程圖中邏輯的 Python 代碼:

import random

def guess_number(): # Generate a random number between 1 and 10

    target = random.randint(1, 10)

    while True:
        guess = int(input("Guess a number between 1 and 10: "))

        if guess == target:
            print("You won!")
            break
        else:
            print("Wrong guess, try again!")

if __name__ == "__main__":
    guess_number()

第二個是計算卡路里:

Prompt:How many calories are there in 5 slices of this?(5 片有多少卡路里?)

Grok:如果一份是 3 片,含有 60 卡路里,那么 5 片就含有大約 100 卡路里。計算方法是首先確定每片的熱量:60 卡 / 3 片 = 20 卡 / 片。然后,將每片的卡路里乘以片數:每片 20 卡路里 * 5 片 = 100 卡路里。

第三個是將草圖轉化為睡前故事:

Prompt:My son drew this, can you tell a short bedtime story based on his drawing?(這是我兒子畫的,你能根據他的畫講一個簡短的睡前故事嗎?)

Grok:

很久很久以前,在一個充滿冒險和奇跡的國度里,有一個勇敢的小男孩,名叫提米。提米和家人住在舒適的小房子里,他最喜歡的事情就是探索周圍的世界。

在一個陽光明媚的日子里,提米決定去附近的森林探險。他帶上了自己最喜歡的零食、指南針和他最信任的筆記本,準備把看到的所有令人興奮的事物都畫下來。

當 Timmy 走進森林深處時,他發現了一條在陽光下閃閃發光的神奇河流。這條河是如此迷人,以至于提米決定做一艘小紙船,順流而下,作為給森林精靈的特別訊息。

提米小心翼翼地折好紙船,在上面畫了一個笑臉,希望能給森林精靈帶來歡樂。然后,他把小船放在河面上,看著小船載著他的友誼和對大自然的愛漂走了。

夕陽西下,提米知道是時候回家了。他為自己在森林里度過的神奇的一天感到慶幸,他知道自己將永遠銘記這次探險。

回到家后,提米和家人分享了他的故事,家人聽到他在森林里度過的神奇一天都非常高興。他們一致認為,提米勇敢、善良的精神是一種真正的激勵,他們知道,提米今后還會有更多精彩的冒險經歷。

就這樣,帶著滿心的愛和滿腦子的夢想,提米漸漸進入了夢鄉,他渴望發現在他的想象世界里還有什么新的冒險在等著他。

第四個是解釋梗圖:

Prompt:I don't get it, please explain(我不理解,啥意思?)

Grok:

這幅圖幽默地將初創公司和大公司作了對比。在標有 "初創企業" 的左側,有一群人在一起挖洞。他們都在積極參與,洞已經挖得很深了。

在標有 "大公司" 的右側,有一群人圍著一個洞站著。然而,與初創公司不同的是,只有一個人真正在挖洞,其他人都在觀看或從事其他活動。

這幅圖的幽默感來自于對初創企業和大公司之間差異的夸大。在初創公司,人們往往有一種緊迫感,希望每個人都能直接為手頭的任務做出貢獻。相比之下,大公司往往被描述為官僚主義更嚴重,所有團隊成員對每個項目的直接參與更少。

第五個是將表格轉換為 CSV 文件格式:

Prompt:Please convert this table to csv.(請將此表轉換為 csv。)

Grok:


medal,name,sport,event,date
1 gold,El Amin Chentouf,Athletics,Men's marathon - T13,11 September
1 gold,Mohamed Amguoun,Athletics,Men's 400m - T13,15 September
1 gold,Azeddine Nouiri,Athletics,Men's shot put - T34,15 September
2 silver,Mahdi Afri,Athletics,Men's 400m - T12,9 September
2 silver,El Amin Chentouf,Athletics,Men's 5000m - T13,15 September
3 bronze,Mahdi Afri,Athletics,Men's 200m - T12,17 September
3 bronze,Mohamed Lahna,Paratriathlon,Men's PT2,10 September

CSV 格式不支持樣式或格式設置,因此信息以純文本格式呈現。

第六個是辨別木頭的腐朽程度:

Prompt:These holes are appearing around the screws in my deck. Is it rotten? Should I get my boards replaced?(這些孔出現在我的甲板上的螺釘周圍。是不是爛了?我應該更換嗎?)

Grok:

甲板上的木材似乎已經開始腐爛。這表現在螺絲周圍出現孔洞,這是木材腐爛的常見跡象。

為了確保露臺的安全和使用壽命,建議更換受影響的木板。這將有助于防止其受到進一步損壞,并保持其結構的完整性。

如果您不確定如何更換木板,咨詢專業的露臺建造商或承包商可能會有所幫助。他們將能夠評估損壞的程度,并就最佳行動方案向您提供專家建議。

第七個是解決編程問題:

Prompt:Can you write Python code that solves this?(你能編寫 Python 代碼來解決這個問題嗎?)

Grok 回復如下:

def find_triplets(nums):
    result = []
    nums.sort()
    
    for i in range(len(nums) - 2):
        if i > 0 and nums[i] == nums[i - 1]:
            continue
        
        target = -nums[i]
        left = i + 1
        right = len(nums) - 1
        
        while left < right:
            if nums[left] + nums[right] == target:
                result.append([-target, nums[left], nums[right]])
                left += 1
                right -= 1
                while left < right and nums[left] == nums[left - 1]:
                    left += 1
                while left < right and nums[right] == nums[right + 1]:
                    right -= 1
            elif nums[left] + nums[right] < target:
                left += 1
            else:
                right -= 1
    
    return result

RealWorldQA 基準

本次發布還有一個亮點:xAI 推出了一個新的基準「RealWorldQA」。

下載地址:https://data.x.ai/realworldqa.zip

「為了開發有用的真實世界人工智能助手,提高模型對物理世界的理解至關重要。」xAI 希望借助該基準更好地評估多模態模型的基本真實世界空間理解能力。「雖然當前基準中的許多示例對人類來說相對容易,但它們往往對前沿模型構成挑戰。」

目前,RealWorldQA 包含 700 多張圖片,每張圖片都有一個問題和易于驗證的答案。

在真實世界的圖像外,該數據集還包括從車輛上拍攝的匿名圖像。這對于自動駕駛領域來說,或許是個好消息。

巧合的是,微軟研究院前段時間更新了跨語言、模態、模型和任務的基準測試 MEGAVERSE,包含 22 個數據集,涵蓋 83 種語言(包括資源匱乏的非洲語言)。微軟還在基準測試中加入了兩個多模態數據集,并比較了 LLaVA 模型 GPT-4-Vision 和 Gemini-Pro-Vision 的性能。

Meta 在前幾天也開源了衡量人工智能系統具體問答能力的基準數據集 OpenEQA,包含家庭和辦公室等 180 多種不同現實環境的 1600 多個問題,跨越七個類別,全面測試 AI 在物體和屬性識別、空間和功能推理以及常識知識等技能方面的能力,加深大模型對現實世界的理解。

即使是最先進的 AI 模型,如 GPT-4V,在 OpenEQA 上也難以與人類表現相媲美。OpenEQA 是衡量人工智能系統理解和回答現實世界問題能力的新基準。

在這些研究的推動下,我們可以期待一下 2024 年大模型在現實世界任務取得更多的進展。

參考鏈接:https://x.ai/blog/grok-1.5v

責任編輯:趙寧寧 來源: 機器之心
相關推薦

2024-04-15 12:52:00

AI數據

2025-09-16 09:02:00

AI馬斯克模型

2023-10-17 12:34:04

2024-06-04 14:11:00

2025-11-18 17:15:34

馬斯克AI模型

2023-10-12 09:28:17

2019-07-18 17:01:10

機器學習人工智能計算機

2023-02-16 13:48:56

模型論文

2023-10-12 13:05:00

谷歌AI

2024-02-02 21:53:58

AI訓練

2025-08-25 09:10:00

2024-06-27 13:10:21

2024-03-29 14:04:00

模型訓練

2025-09-19 12:31:45

2024-06-11 08:16:00

2023-12-08 12:58:26

2024-04-07 11:25:54

2023-04-20 17:51:41

馬斯克微軟

2023-08-27 14:08:17

開源代碼Meta大模型

2025-06-30 00:00:00

點贊
收藏

51CTO技術棧公眾號

欧美精品成人| 97av在线影院| 日韩精品第一| 色先锋资源久久综合5566| 欧美三级一区| 成人国产精品色哟哟| 激情久久一区| 日本人妻伦在线中文字幕| 久久久精品免费免费| 最近2018中文字幕免费在线视频| 欧美三级在线播放| 巨胸喷奶水www久久久免费动漫| 午夜精品在线观看| 亚洲在线国产日韩欧美| 国产日产欧美视频| 欧美性猛交xxxx久久久| 日韩高清中文字幕一区二区| 日本在线观看天堂男亚洲| 国产精品婷婷| 免费观看成人在线视频| 欧美日韩精品二区第二页| 久久亚洲精品人成综合网| 欧美在线中文字幕| 日韩成人dvd| 日本我和搜子同居的日子高清在线| 欧美一级视频精品观看| 国产精品超碰| 欧美久久久久久久| 国产精品久久久一区麻豆最新章节| 精品麻豆一区二区三区| 国产+人+亚洲| 免费高清不卡av| 一级片免费看| 自拍偷拍亚洲在线| 亚洲激情偷拍| 国产黄色网页| 亚洲欧美日韩一区二区在线| 99久久九九| 日韩亚洲在线视频| 欧美大片在线观看一区二区| 国产亚洲精品美女久久久久久久久久| 亚洲一卡二卡三卡| 丁香五六月婷婷久久激情| 国产日本亚洲| 五月天久久狠狠| 岛国av一区二区| 激情小说亚洲图片| 91视频 - 88av| 欧美揉bbbbb揉bbbbb| 日韩av不卡一区| 亚洲国产精品无码av| 欧美一区三区四区| 中文字幕日韩欧美精品高清在线| 黄色一级大片在线观看| 亚洲免费小视频| 国产精品五区| 蝌蚪视频在线播放| 青草青草久热精品视频在线观看| 成人手机电影网| 怡红院在线观看| αv一区二区三区| 亚洲制服欧美中文字幕中文字幕| 国产美女精品视频免费播放软件| 欧美一级黄色录像片| 欧美日韩日日摸| 我不卡影院28| 免费看美女隐私的视频| 欧美日韩成人免费| 成人h动漫精品| 亚洲伊人av| 无码免费一区二区三区免费播放| 欧美精品v国产精品v日韩精品| 97精品国产| 写真片福利在线播放| 国内精品中文字幕| 亚洲国产精品99久久久久久久久| 日韩毛片免费看| 狠狠噜天天噜日日噜| 亚洲丁香久久久| 欧美a一区二区| 激情图片在线观看高清国产| 免费影院在线观看一区| 欧美性大战久久| 欧美区国产区| 可以在线观看的黄色| 亚洲伊人成综合成人网| 午夜久久久久久久久久一区二区| 国产精品一区二区av日韩在线| 婷婷六月天在线| 久久69精品久久久久久国产越南| www.亚洲国产| 成人性生活视频| 91精品国产毛片武则天| 亚洲男人7777| 丰满少妇久久久久久久| 欧美激情福利| 国产三级三级三级看三级| 欧美极品欧美精品欧美视频| 欧美国产精品专区| 日韩精品福利一区二区三区| 米奇.777.com| 国产精品第10页| 亚洲成a人片综合在线| 99国产**精品****| 黄色在线观看网| 免费久久一级欧美特大黄| 精品91自产拍在线观看一区| 国产精品一区二区x88av| 日韩黄色在线| 人人澡人人爽| 91福利视频导航| 日韩一级二级三级| 麻豆精品视频在线观看免费| 国产黄色精品| 成人免费乱码大片a毛片软件| 国产精品久久97| 色av成人天堂桃色av| 亚洲一区日本| 性爽视频在线| koreanbj精品视频一区| 欧美中文字幕在线视频| 日韩欧美aaa| 日本不卡一区二区| 亚洲伊人伊成久久人综合网| 国精产品999国精产品官网| 亚洲综合一区二区不卡| 91麻豆精品国产91久久久久久久久 | 麻豆精品久久精品色综合| 伊人久久在线| 一区二区三区视频在线观看免费| 日韩av快播网址| 精品视频1区2区| 成人午夜免费av| 欧美午夜精品一区二区三区电影| 日本成人在线播放| 黄色网在线视频| 日本91av在线播放| 777奇米四色成人影色区| 成人一级黄色片| 激情婷婷综合| а√在线中文在线新版| 污网站免费在线| 国产一区精品在线| 亚洲视频网站在线观看| 亚洲精品高清视频在线观看| 亚洲欧美久久久| 精品国产乱码久久久久久樱花| 最近2018年手机中文在线| 伊人久久大香线蕉精品| 奇米一区二区三区四区久久| 精品国产乱码久久久久久牛牛| 国产精品你懂的在线欣赏| 美女久久一区| 牛牛精品成人免费视频| 成人av福利| 7878视频在线观看| 伊人久久av导航| 国产精品色婷婷视频| 精品亚洲一区二区三区在线播放 | 久色乳综合思思在线视频| 精品高清美女精品国产区| 另类调教123区| 成人看的视频| 黄色精品视频| 久久久pmvav| www日韩视频| 日韩精品电影网站| 国产精品黄视频| 中文字幕亚洲无线码a| 91精品1区2区| 国产精品视频观看| 久久精品国产**网站演员| 999精品一区| 欧美不卡在线观看| 欧美v亚洲v| 亚在线播放中文视频| 男人操女人免费| 日本精品视频一区| 国产精品久久电影观看| 中文字幕亚洲综合| 欧美一级一级性生活免费录像| 亚洲国产精品人人做人人爽| a亚洲天堂av| 日本在线观看不卡视频| 欧美aa国产视频| 台湾佬综合网| 日韩一级特黄| 色戒汤唯在线| avtt亚洲| 中文字幕视频在线| 超清福利视频| 欧美精品一区二区三区免费播放| 一区二区在线观| 精品一区久久| 91老司机精品视频| 青草热久免费精品视频| 欧美二区在线播放| 日日骚av一区| 一区二区三区美女xx视频| 亚洲精品一区二区在线观看|