OpenAI和Google接連兩天的大動作,都想讓AI助手成“精”
看過昨天OpenAI的春季發(fā)布后,不難猜到,在今天的谷歌I/O大會上,必然會有關(guān)于AI助手的介紹。
畢竟,搶在谷歌I/O大會前發(fā)布GPT-4o的Altman,已經(jīng)顯示出了十足的針對性,憑借Altman的手段,自然也有著十足的把握做到精準(zhǔn)打擊,將這場“紅藍(lán)對抗”進(jìn)行到底。
果不其然,大會上,谷歌CEO Pichai請來了DeepMind創(chuàng)始人Demis,谷歌全新的AI助手Project Astra正是由首次登臺谷歌I/O大會的Demis揭開的神秘面紗。

什么是Project Astra?
Project Astra是一個由谷歌Gemini作為基礎(chǔ)引擎的實(shí)時、多模態(tài)通用人工智能助手,相當(dāng)于是Google Assistant的繼任者。
與Siri、Alexa等以往我們使用的AI助手相同的是,你依然可以用語音與它進(jìn)行交互;不同的是,借助生成式AI獨(dú)有的特性,它現(xiàn)在擁有了更好的理解能力、可以干更多事情,更重要的是,這次它還有了視覺識別能力,讓AI助手得以睜眼看世界。
在大會上谷歌的視頻演示中,著重演示的正是這一AI助手的視覺智能。
在演示視頻中,一位谷歌工程師拿著打開攝像頭的手機(jī),讓Gemini識別空間中能發(fā)出聲音的物體、識別顯示器屏幕上顯示的代碼的功能,甚至通過戶外街景識別演示者現(xiàn)在所在地址。

除了將AI助手應(yīng)用到手機(jī)上,谷歌還將AI助手應(yīng)用到了AR眼鏡上,當(dāng)這位工程師將搭載這一AI助手的智能眼鏡對準(zhǔn)黑板上設(shè)計的系統(tǒng)并提出如何改善這一系統(tǒng)時,AI助手甚至能給出系統(tǒng)設(shè)計的改善建議。

這是谷歌在AI助手上展示出的視覺智能,在Gemini加持下,這樣的AI助手在交互能力上已經(jīng)得到了極大的增強(qiáng)。
不過,在實(shí)際交互的自然度上,這樣的AI助手依然與昨天OpenAI GPT-4o展示出的效果形成了不小的差距。
OpenAI“截胡”成功
就在谷歌I/O大會前一天,OpenAI召開了一場聲勢浩大的春季發(fā)布會,GPT-4o是這次春發(fā)的主角,部署在手機(jī)上的AI助手則是這次發(fā)布會重點(diǎn)演示的功能。
從OpenAI發(fā)布會上演示的AI助手能力來看,無論是在演示內(nèi)容的親民程度、交互過程的自然度,還是這一AI助手多模態(tài)能力上,演示效果都要更好。
這是因?yàn)镺penAI將GPT-4o裝載到手機(jī)上時,不僅加入了視覺智能,還讓這個AI助手能夠?qū)崟r響應(yīng)(官方給出的平均響應(yīng)延時是320毫秒),可以被隨時打斷,甚至還能理解人類的情緒。
在視覺智能方面能力演示過程中,OpenAI在紙上寫了一道數(shù)學(xué)方程讓AI助手一步一步解題,像極了一位小學(xué)老師。

而當(dāng)你和GPT-4o打“視頻電話”時,它又可以識別你的面部表情,理解你的情緒,知道你現(xiàn)在看起來是開心還是難過,活脫就是一個human being。

不難發(fā)現(xiàn),在如今大模型技術(shù)加持下,谷歌和OpenAI都在試圖將原來粗糙不堪的AI助手進(jìn)行回爐再造,想讓AI助手能夠像真人一樣與我們自然交互。
而從前后兩個發(fā)布會視頻演示結(jié)果來看,以大模型作為基礎(chǔ)引擎的AI助手,也確實(shí)讓我們明顯感受到了,現(xiàn)在的AI助手與此前的Siri、Alexa有了明顯的代際差。
實(shí)際上,在生成式AI、大模型技術(shù)發(fā)展如火如荼的當(dāng)下,蘋果也在試圖讓Siri脫胎換骨,此前彭博社就曾援引知情人士消息報道稱,蘋果正與OpenAI和谷歌分別在談合作,想要將他們的大模型用到iOS 18操作系統(tǒng)中。
至于這樣的AI助手是否能讓Siri再次翻紅,成為AI手機(jī)的殺手級應(yīng)用,接下來,就看蘋果能否再次為AI助手順利“附魔”了。





























