国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

吳恩達:AI是時候從大數據轉向「小數據」了

人工智能
最近,吳恩達在接受IEEE Spectrum的一段專訪中,討論了人工智能領域下一個十年的風向,表達了“是時候從大數據轉向小數據、優質數據”的觀點。

AI大牛吳恩達不久前剛被檢測出新冠陽性,許多網友都向他表達了早日康復的祝愿。

如今,他的工作重心放在了他的Landing AI公司上。

這是一家專門面向制造業廠商數字化轉型的初創公司,創立目標就是幫助制造業公司更快速、輕松地構建和部署人工智能系統。

對于傳統企業來說,預訓練好的模型都是基于公開數據,實際上派不上用場。

但畢竟是傳統企業,上哪兒收集海量的特定數據來支撐訓練?

那Landing AI是如何克服的這個困難?

最近,吳恩達在接受IEEE Spectrum的一段專訪中,討論了人工智能領域下一個十年的風向,表達了“是時候從大數據轉向小數據、優質數據”的觀點。

或許我們能從中找到這個問題的答案。

以下整理自采訪原文,略有刪減。

IEEE Spectrum:得益于越來越大的模型和數據集,深度學習在過去十年間取得了巨大的進步。一些人認為這是一個不可持續發展的軌跡。你同意嗎?

吳:這確實是一個值得思考的問題。NLP領域已經有了基礎模型(foundation model),并正在繼續擴大規模。計算機視覺領域也有構建基礎模型的潛力,就是在視頻領域由于計算帶寬(算力)和處理成本的限制還有待開發。雖然擴展深度學習算法的引擎已經運行了大約15年,但它還有足夠的動力。不過,它只適用于某些問題,還有一系列場景需要小數據解決方案。

注:基礎模型是Percy Liang和吳在斯坦福大學的一些朋友創造的一個術語,指的是在非常大的數據集上訓練的巨大模型,這種模型可以針對特定的應用進行調整,例如GPT-3。

過去十年里,面向消費者的企業由于擁有大量用戶群(有時甚至高達數十億),因此獲得了非常大的數據集得以開展深度學習。這給它們帶來了不少經濟價值,但我發現這種法則不適用于其他行業。

IEEE Spectrum:有意思,你以前就是在這種公司工作。

吳:確實,不過十多年前,當我提議啟動谷歌大腦項目、利用谷歌的計算基礎設施建設大規模網絡時就引起了爭議。一位非常資深的人把我拉到一邊,警告我說,這會對我的職業生涯不利。我想他的意思是這個項目不能只注重擴大規模,應該把重點放在架構創新上。

我還記得當我和我的學生,發表第一篇倡導使用CUDA進行深度學習的論文時,另一位AI資深人士坐下來對我說:“CUDA編程非常復雜。作為一種編程范例,如果這么做的話工作量太大了。”

IEEE Spectrum:我想他們后來肯定都被說服了。

吳:是的。

現在當我與大家討論以數據為中心的人工智能(Data-centric AI)運動時,也會想到15年前與大家討論深度學習時的場景。這一年,許多人和我說“方向錯了”、“兩者之間似乎沒有什么新東西”。

IEEE Spectrum:你是如何定義以數據為中心的人工智能,為什么你認為它是一種運動(movement)?

吳:以數據為中心的AI是為構建成功AI系統所需數據的系統準則。對于AI系統來說,你必須用代碼實現一些算法,然后在你的數據集上進行訓練。過去十年里,主要的應用范例就是我們下載數據集,同時專注于改進代碼。這種模式給深度學習網絡帶來了顯著的改進,但其架構基本上表達的就是一個已解決的問題。因此,對于許多實際應用來說,現在更有效的方法是固定神經網絡結構,找到改進數據的方法。

而當我提出這個觀點時,有從業者說:“這事兒我們已經做了20年了?!?我想說的是,現在是時候把這件少數人憑直覺做的事情變成一門系統的事。

IEEE Spectrum:你前面提到,一些公司或機構只有少量數據可供使用。以數據為中心的人工智能如何幫助他們?

吳:像很多視覺模型都是用數百萬張圖像構建的,我也曾經花3.5億張圖像搭建了一個人臉識別系統。但這種模型在只有50張圖像的數據集上卻沒法運行。不過事實證明,如果你有50個非常好的數據,你也可以做出有價值的東西,比如缺陷檢查系統。在許多根本不存在巨型數據集的行業,我認為重點必須從大數據轉向優質數據。有50個經過深思熟慮的實例就足以向神經網絡解釋你想要它學會什么。

IEEE Spectrum:用50張圖像訓練一個模型的意思是在一個用大數據集訓練好的現有模型上對其進行微調嗎?還是說這是一個全新的模式,就從這個小數據集上學習?

吳:我來講一下Landing AI是做什么的吧。在給制造商提供瑕疵檢查服務時,我們一般就用帶有我們自己風格的RetinaNet。它是一個預訓練模型。話說過來,預訓練只是難題的一小部分,更大的難題是提供一個工具讓制造商能夠選擇正確的圖像集(用于微調),并用一致的方式對圖集進行標記。面對大數據集的應用時,我們的通常反應都是如果數據有噪音也沒關系,所有數據照單全收,算法會對其進行平均(average over)。但是,如果我們能夠開發出用來標記出數據不一致的地方的工具,為制造商提供一種非常有針對性的方法來提高數據質量,那這將是獲得高性能系統的更有效方法。

就比如你現在你有10000張圖像,其中30張屬于一個類別,但這30張的標簽不一致。我們要做的一件事就是構建工具來吸引你注意到這個特殊的數據子集,使你能夠快速重新對它們進行標記,從而提高模型性能。

IEEE Spectrum:像這樣生成高質量的數據集是否有助于消除數據偏見?

吳:非常有幫助。有偏見的數據是導致最終模型產生偏見的眾多因素之一。在NeurIPS會議上,Mary Gray的演講談到了以數據為中心的AI是這個問題的解決方案之一(并非全部)。

以數據為中心的AI給我們帶來的強大能力之一是構建(engineer)數據子集。想象一下,你訓練了一個機器學習模型,它的性能對于大多數數據集都還可以,但只有一個子集有偏差。要是僅僅為了提高該子集的性能就更改整個神經網絡架構,那是相當困難的。

但如果你能針對這個子集構建(engineer)出合適的數據,解決方式也就更有針對性。

IEEE Spectrum:構建(engineer)數據的確切意思是?

吳:在AI領域,數據清洗很重要,但目前都是靠很機械的方式。面對一個非常大的數據集時,這個工具可以快速地將你的注意力吸引到有噪音的數據子集上,針對該子集進行集中收集。

就像我曾經發現語音識別系統的性能很差,主要是背景中有汽車噪音。知道了這一點,我就可以再收集更多帶這種噪音背景的數據,而不是對所有內容都采取行動,省錢又省時。

IEEE Spectrum:使用合成數據怎么樣?這也是個好的解決方式嗎?

吳:合成數據也是Data-centric AI工具集中的一個重要工具。在NeurIPS研討會上,Anima Anandkumar做了一次涉及合成數據的精彩演講。我認為它僅僅只是一個為模型增加數據的預處理步驟。我希望能看到開發人員將生成合成數據作為迭代機器學習模型閉環的一部分。

IEEE Spectrum:你的意思是合成數據可以讓你在更多不同數據集上嘗試模型嗎?

吳:不止如此。假設你要檢測智能手機外殼上的瑕疵,包括劃痕、凹痕、材料變色等。如果你的訓練模型在這個檢測任務上總體表現良好,但就是在識別凹痕上表現不佳,那么就可以用合成數據生成更有針對性的數據來解決問題。

IEEE Spectrum:能和我們詳細說一下當一家公司找到Landing AI,比如要做視覺檢驗,你們會提供何種幫助?

吳:我們會要求他們將數據上傳到我們的平臺,用以數據為中心的人工智能方法向他們提供建議,并幫助他們標記數據。

Landing AI的重點是授權制造商自己做機器學習工作,我們的很多工作是確保軟件快速且好上手。在機器學習的迭代過程中,我們會為客戶提供建議,比如如何在平臺上訓練模型,如何以及何時改進數據標記來提高模型性能。

IEEE Spectrum:如果產品或照明條件什么的發生變化,這種模型能跟上嗎?

吳:所以說授權制造業客戶自己更正數據、重新訓練和更新模型非常重要。

在消費互聯網中,我們只需訓練少數機器學習模型就能服務10億用戶。在制造業中,有10000家制造商就要搭建10000個定制模型。挑戰是,你如何做到這點還不用雇傭10000名機器學習專家?

這個問題在其他行業比如醫療健康領域也存在。

擺脫這一困境的唯一辦法是開發出能夠讓客戶自己設計數據、表達專業領域知識的工具,讓他們自己構建模型。這也是Landing AI在計算機視覺領域中正在做的事兒。

IEEE Spectrum:最后還有什么想說的?

吳:在過去十年中,人工智能的最大轉變是向深度學習的轉變。我認為在這十年中,最大的轉變很可能是轉向以數據為中心的人工智能。隨著當今神經網絡架構的成熟,我認為對于許多實際應用而言,瓶頸將是我們能否有效地獲取讓模型運行良好所需的數據。

而以數據為中心的人工智能運動在整個社區擁有巨大的能量和動力。我希望更多的研究人員和開發人員能夠加入并致力于它。

責任編輯:未麗燕 來源: 量子位
相關推薦

2022-03-28 10:50:04

AI趨勢數據

2013-06-05 13:49:41

EclipseIntelliJ

2013-06-07 10:18:00

EclipseIntelliJ ID

2024-01-17 16:25:02

生產數據數據孤島大數據分析

2022-04-24 10:23:27

人工智能機器學習神經網絡

2017-09-25 15:54:11

AI應用和價值趨勢及算法

2023-06-03 13:28:35

ChatGPTAItoken

2023-12-13 16:28:02

2013-11-29 14:39:05

2020-04-25 21:04:09

NoSQL數據庫大數據

2020-12-25 15:34:35

AI 數據人工智能

2018-12-14 10:35:54

AI數據科技

2024-01-22 12:31:18

模型訓練

2021-10-29 22:45:47

大數據算法技術

2018-02-02 12:56:58

2022-02-17 14:41:45

AI資源模型

2013-03-20 10:31:14

大數據數據云服務

2016-08-12 00:20:22

大數據小數據

2025-08-08 14:27:22

AI大模型開發

2024-01-02 13:17:00

模型訓練
點贊
收藏

51CTO技術棧公眾號

麻豆精品新av中文字幕| 国产尤物一区二区在线| 精品国产91亚洲一区二区三区婷婷| 中文字幕久久综合| 久久久久久久久国产一区| 国产小视频国产精品| 在线视频中文字幕| 国产一区二区在线免费观看| 成人激情免费在线| 日韩中文字幕视频网| 一本色道久久综合精品竹菊| 久久亚洲精品爱爱| 国产成人精品三级麻豆| 亚洲综合在线播放| 日韩三级视频| 久久国产精彩视频| 一区二区电影免费观看| 欧美日韩在线免费视频| 亚洲精品第一国产综合野草社区| 99久久精品国产导航| 欧洲视频一区二区三区| 女人天堂亚洲aⅴ在线观看| 国产91亚洲精品| 欧美大奶一区二区| 欧美精品激情在线| 视频一区在线| 欧美成人自拍视频| 成人一区视频| 国产亚洲精品va在线观看| 女人黄色免费在线观看| 性欧美大战久久久久久久久| 免费黄色特级片| 久久久123| 久久久精品网| 动漫精品一区二区| jizz18欧美| 国产精品久99| 欧美性猛交久久久乱大交小说| 国精品**一区二区三区在线蜜桃| 鲁丝一区二区三区免费| 外国成人激情视频| 成人黄色短视频在线观看| 窝窝社区一区二区| 7777精品视频| 国产一区二区三区四区二区| 2019中文字幕在线免费观看| 欧美交a欧美精品喷水| 668精品在线视频| 亚洲丝袜啪啪| 91精品视频一区| 在线成人欧美| 日韩偷拍一区二区| 国产一区在线看| 中文字幕人妻熟女人妻洋洋| 成人午夜又粗又硬又大| a√天堂在线观看| 亚洲欧美中日韩| 亚洲成人av在线影院| 欧美色综合影院| а√在线中文网新版地址在线| 亚洲欧美激情一区| 日韩精品一区二区三区中文| 欧美一区二区视频97| 999久久久亚洲| 免费在线国产精品| 国产精品资源网站| 国产精品拍拍拍| 欧美日韩激情美女| 日本理论片午伦夜理片在线观看| 中文字幕亚洲图片| 视频精品在线观看| 欧美精品一区在线发布| 成人免费视频视频在线观看免费| 一本岛在线视频| 日本精品视频一区二区| 在线观看爽视频| 欧美亚洲另类制服自拍| 99精品国产一区二区青青牛奶| 久久久久亚洲av无码专区喷水| 亚洲国产成人一区二区三区| 久久精品蜜桃| 中文字幕在线精品| 日韩成人免费| 一区二区三视频| 最新热久久免费视频| 91美女视频在线| 日韩中文字在线| 68国产成人综合久久精品| 伊人天天久久大香线蕉av色| 欧美激情一区二区三区四区| 国产精品视频二区三区| 色婷婷综合成人av| 亚洲调教视频在线观看| 浮妇高潮喷白浆视频| 色综合久久中文综合久久97| 成人精品高清在线视频| 91成人免费看| 久久嫩草精品久久久精品一| 99中文字幕一区| 久久久久女教师免费一区| 亚洲免费影院| 调教视频vk| 日韩欧美www| 国产欧美久久一区二区三区| 欧洲av一区| 亚洲一二三四在线观看| 唐人社导航福利精品| 粉嫩高清一区二区三区精品视频| 91视频91自| 久色国产在线| 亚洲在线一区二区| 亚洲国产岛国毛片在线| 不卡专区在线| 91嫩草免费看| 日韩一区在线免费观看| 成人免费影院| 蜜桃欧美视频| 色综合久久66| 女一区二区三区| 男同互操gay射视频在线看| 欧美午夜电影一区| 色999日韩| 久草香蕉在线| 欧美国产亚洲精品久久久8v| 国产一区二区三区免费看| 国产女人在线视频| 国产精品一区二区女厕厕| 国产欧美视频一区二区三区| 中文字幕资源网在线观看免费| 国产专区一区二区| 色综合久久久久综合| 久久av超碰| 电影天堂最新网址| 国内精品小视频| 91首页免费视频| 成人看片网站| 97超碰免费观看| 精品欧美黑人一区二区三区| 欧美日韩1区| 免费a在线观看| 亚洲综合在线做性| 精品女厕一区二区三区| 沈樵精品国产成av片| 独立日3在线观看完整版| 久久久久久久香蕉网| 久久免费美女视频| 色播一区二区| 波多结衣在线观看| 国内精品久久久久伊人av | 亚洲第一影院| 日韩av高清在线播放| 欧美日本乱大交xxxxx| 亚洲高清资源在线观看| 深夜福利在线观看直播| 成人免费淫片aa视频免费| 亚洲午夜精品网| 精品久久视频| 最新在线观看av网站| 国产精品久久久亚洲| 亚洲福中文字幕伊人影院| 久久国产影院| 岛国视频免费在线观看| 国产精品区一区二区三含羞草| 欧美最新大片在线看| 乱人伦精品视频在线观看| 91在线超碰| 欧美成人一区二区在线观看| 精品中文字幕在线| 最新日韩在线视频| 日本一二区不卡| 九一国产在线| 欧美黑人xxxxx| 精品视频在线导航| 久久麻豆一区二区| 性欧美lx╳lx╳| 欧美人体大胆444www| 麻豆精品视频| 亚洲无亚洲人成网站77777| 久久午夜老司机| 成人久久电影| 成人ww免费完整版在线观看| 中文字幕久久一区| 久久91精品国产| 亚洲成av人影院| 性感少妇一区| 色噜噜成人av在线| 毛片中文在线观看| 久久亚洲免费| 日韩中文字幕在线| 亚洲一区在线电影| 麻豆成人精品| 99精品国产九九国产精品| 爽爽免费视频| 少妇精品久久久久久久久久| xvideos亚洲| 疯狂欧美牲乱大交777| 男男成人高潮片免费网站| 欧美经典一区| 最新av网站在线观看| 日日碰狠狠添天天爽超碰97|