18歲華人開源成果,火爆具身智能賽道
具身智能的Scaling Law正蓄勢(shì)待發(fā)。
最近,有史以來最大的人類為中心(huamn-centric)數(shù)據(jù)集Egocentric-10K開源了——
10億幀畫面,來自2153個(gè)人類工人在真實(shí)工廠中共計(jì)10000小時(shí)的工作。

其規(guī)模是同類數(shù)據(jù)集EPIC-KITCHENS的100倍,并且將數(shù)據(jù)場(chǎng)景從家庭擴(kuò)展至真正的工廠車間,是首個(gè)完全在真實(shí)工廠中收集的數(shù)據(jù)集。

發(fā)布不到三天,Egocentric-10K在Hugging Face的下載量就突破了1.3w次,并登頂趨勢(shì)榜。

網(wǎng)友紛紛點(diǎn)贊,直呼太強(qiáng)了!

而這,竟出自一名18歲的連續(xù)創(chuàng)業(yè)者之手。
押注人類數(shù)據(jù)路線
Egocentric-10K是華人小哥Eddy Xu的初創(chuàng)公司Build AI最新發(fā)布的具身智能數(shù)據(jù)集,Build AI官方稱其為最大的開源的“物理作業(yè)”數(shù)據(jù)集(largest open source dataset of physical jobs)。

如開頭所說,這是第一個(gè)完全從真實(shí)工廠中收集的huamn- centric數(shù)據(jù)集,包含10億幀畫面,來自2153個(gè)工人共計(jì)一萬小時(shí)的工作,總視頻片段達(dá)到了19.2萬個(gè),數(shù)據(jù)集大小達(dá)到了16.4TB。

相比Ego4D、EPIC-KITCHENS等以往的huamn-centric數(shù)據(jù)集,Egocentric-10K不僅在數(shù)量規(guī)模上更大,而且在數(shù)據(jù)收集場(chǎng)景中,也由日常家庭、廚房場(chǎng)景擴(kuò)展至了真實(shí)工廠的操作。
這使Egocentric-10K在手部可見性和主動(dòng)操作密度方面達(dá)到了領(lǐng)先水平。

在數(shù)據(jù)收集上,Egocentric-10K的操作視頻數(shù)據(jù)來自全球各地的真實(shí)工廠,由工人佩戴頭戴式攝像設(shè)備在抓取、組裝等操作中自然錄制。

其中,頭戴式攝像頭能夠收集128°×67°、1080p、30fps的視頻數(shù)據(jù),相比許多舊數(shù)據(jù)集(720p、60~90° FOV)提升明顯。
不過,Egocentric-10K數(shù)據(jù)集中目前僅有RGB視頻信息,暫時(shí)缺乏深度、音頻、觸覺等多模態(tài)信息。
當(dāng)有網(wǎng)友表示能否加入更多模態(tài)的數(shù)據(jù)信息時(shí),創(chuàng)始人小哥賣了個(gè)關(guān)子,表示:
該讓你知道的時(shí)候會(huì)讓你知道的。

當(dāng)然,也并不是那么密不透風(fēng)。
據(jù)Build AI官網(wǎng)的最新介紹,其將在位于深圳的制造工廠計(jì)劃于2026年生產(chǎn)數(shù)百萬副記錄眼鏡,以實(shí)現(xiàn)全球覆蓋,屆時(shí)也許會(huì)覆蓋更多的模態(tài)信息。

此外,也有網(wǎng)友對(duì)大規(guī)模數(shù)據(jù)的實(shí)際可用性提出質(zhì)疑,例如工廠場(chǎng)景下的數(shù)據(jù)是否具備足夠多樣性、人類的實(shí)操經(jīng)驗(yàn)又該如何有效遷移至機(jī)器人系統(tǒng)等核心問題。

而這,就引出了human-centric與真機(jī)、遙操等技術(shù)路線的差異。
與前段時(shí)間Generalist AI發(fā)布的史上最大真機(jī)數(shù)據(jù)集不同,此次Egocentric-10K主打human-centric方向,對(duì)標(biāo)Figure的Project Go-Big項(xiàng)目,核心在于強(qiáng)調(diào)人類數(shù)據(jù)向機(jī)器人的遷移價(jià)值。
在這一賽道上,特斯拉與國內(nèi)的它石智航等玩家也均以human-centric為核心布局,試圖通過大規(guī)模第一視角的人類操作數(shù)據(jù),讓機(jī)器人學(xué)習(xí)到更靈巧、更符合直覺的manipulation技能。
相比真機(jī),human-centric的顯著優(yōu)勢(shì)在于:真機(jī)數(shù)據(jù)昂貴而稀缺,而人類數(shù)據(jù)在現(xiàn)階段可以以更低成本、更高速度擴(kuò)展規(guī)模。
但代價(jià)也同樣清晰:必須跨越human-to-robot dynamics gap——人手與機(jī)械臂之間在關(guān)節(jié)、動(dòng)力學(xué)、傳感模式上的系統(tǒng)性差異。
最終,哪條路線更能抵達(dá)通用機(jī)器人智能的“臨界點(diǎn)”,仍需要時(shí)間與數(shù)據(jù)規(guī)模去驗(yàn)證。
18歲的創(chuàng)業(yè)老兵
說到Egocentric-10K,就不得不提到它背后的男孩——Eddy Xu。

這位小哥今年剛滿18,半年前從哥大主動(dòng)輟學(xué),放棄了超過2500萬美元的股權(quán)投資,轉(zhuǎn)身all in AI創(chuàng)業(yè),創(chuàng)辦了Build AI,而Egocentric-10K正是他最新的旗艦項(xiàng)目。
Build AI主打可擴(kuò)展、具有經(jīng)濟(jì)價(jià)值的human- centric數(shù)據(jù)集構(gòu)建,強(qiáng)調(diào)從“量”上突破。
而這,并不是他的第一次嘗試創(chuàng)業(yè)。
大半年前,他設(shè)計(jì)了一副智能眼鏡,可以將現(xiàn)場(chǎng)國際象棋比賽流式傳輸?shù)絀nstagram,使用Stockfish引擎通過計(jì)算機(jī)分析比賽,并通過內(nèi)置揚(yáng)聲器低聲說出最佳棋步。

雖然這副眼鏡因有作弊嫌疑而被批評(píng)質(zhì)疑,但也確實(shí)讓小哥火了一把。
而他最出圈的作品,當(dāng)屬AI流量預(yù)測(cè)工具CrowdTest。

簡單來說,CrowdTest通過套殼大模型,模擬成千上萬名用戶對(duì)即將發(fā)布的推文可能產(chǎn)生的反應(yīng)(A/B測(cè)試),從而對(duì)流量進(jìn)行預(yù)測(cè)。
雖然沒有免費(fèi)試用,而且而且訂閱價(jià)高達(dá)1000美元/月,但仍擋不住用戶的熱情,上線5小時(shí)后收入就突破了5萬美金。
有趣的是,Eddy表示,如果使用后24 小時(shí)內(nèi)沒有效果增長,不僅可以退款,還能得到他本人直接售后支持。
這一手營銷,也讓CrowdTest在24小時(shí)內(nèi)的總收入突破了3萬美元。
除上述嘗試以外,還有消息稱,小哥在13歲就在地下車庫開了第一家公司。
- 贏過20萬名參賽者的十項(xiàng)全能商業(yè)世界錦標(biāo)賽冠軍。
- 還曾多次創(chuàng)業(yè),并曾在三個(gè)月內(nèi)出售了一家擁有17.8萬用戶的教育科技初創(chuàng)公司
- ...
只能說,剛滿18歲,就儼然一名創(chuàng)業(yè)老兵。





























