国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

大型開源數據集曝驚天丑聞,當紅AI公司牽涉其中

原創 精選
開源 人工智能
LAION-5B 數據集于 2022 年 3 月發布,包含來自互聯網的超過 50 億張圖像和相關說明文字,還可能包括數千條疑似兒童性虐待材料(CSAM)。該報告警告說,數據集中的 CSAM 材料可以使基于這些數據構建的人工智能產品輸出新的且可能真實的虐待兒童內容。

撰稿 | 清竹

出品 | 51CTO技術棧(微信號:blog51cto)

大模型的浪潮滾滾向前,總免不了鬧劇一幕幕上演。

前有字節跳動被 OpenAI封號的羅生門,接著谷歌Gemini自曝中文用百度文心一言訓練看呆網友,這次,大模型又在數據集上翻車了!

斯坦福大學近日針對開源模型訓練數據集 LAION-5B 展開研究,發現該數據集中包含數百張已知的兒童性虐待材料 (CSAM) 圖像,這些圖像用于訓練流行的 AI 文本到圖像生成模型,例如穩定擴散模型。

這里提到的利用 LAION-5B 訓練自家模型的公司,正包括當紅的 Stability AI 和 Google 。

事情一出,Stability AI 迅速撇清關系:“Stable Diffusion 模型雖然使用 LAION-5B 進行訓練,但采用的是經過篩選及微調過的訓練集版本,因此并不會影響模型輸出結果”。谷歌方面也表示,其 Imagen 模型的迭代并沒有使用 LAION 數據集。

1、大模型開源數據集“塌房”

近日斯坦福大學互聯網觀察站的一份報告顯示,大型開源人工智能數據集 LAION-5B 已用于訓練流行的人工智能文本到圖像生成器,例如 Stable Diffusion 和 Google 的 Imagen,該數據集包含至少 1,008 個兒童性虐待材料實例。

報告稱,LAION-5B 數據集于 2022 年 3 月發布,包含來自互聯網的超過 50 億張圖像和相關說明文字,還可能包括數千條疑似兒童性虐待材料(CSAM)。該報告警告說,數據集中的 CSAM 材料可以使基于這些數據構建的人工智能產品輸出新的且可能真實的虐待兒童內容。

早在3個月前,研究人員就著手梳理 LAION 數據集,通過查看哈希值或圖像的標識符,調查其中存在多少兒童性虐待材料 (CSAM)。調查表明,該數據集包括從各種來源抓取 CSAM,其中至少包含 1,679 張從社交媒體帖子和流行成人網站上抓取的非法圖像。

目前研究人員已將出現問題的圖像 URL 上報美國國家失蹤和受虐兒童中心(NCMEC) 和加拿大兒童保護中心(C3P)。這些機構主要使用 PhotoDNA 等哈希工具進行檢測,將圖像的指紋與其數據庫進行匹配。

研究人員表示,他們不會查看被濫用的內容,并且會向受虐兒童中心(NCMEC )報告匹配結果,必要時由加拿大兒童保護中心進行驗證。

2、LAION:數據集沒問題,是你的搜索方法有問題

針對此次事件,LAION方面回應媒體:出于“高度謹慎”,它暫時刪除了其數據集,“以確保在重新發布之前它們是安全的”。

據LAION 網站稱,其數據集不保存圖像存儲庫。數據集主要來自對互聯網進行索引,并包含其抓取的圖像和替代文本的鏈接。

翻看LAION官網的FAQ就能明顯感受到,LAION 對其數據集的安全性和合規性方面并不是很自信。

比如針對“LAION數據集是否包含可能令觀看者感到不安的圖像”這一疑問,LAION明確回答:不會!卻緊接著把“鍋”甩給了用戶:“但數據集中的鏈接可能會導致圖像令人不安或不適,具體取決于所使用的過濾器或搜索方法。”

圖片圖片

此次“數據集翻車”事件的受害者之一Stability AI 明確表示,雖然確實使用了 LAION-5B 訓練其模型,但它們對數據集進行了微調,確保了數據安全性。

Google 方面也迅速劃清界限:Imagen 的初始版本僅用于研究,而且是在 LAION-5B 的舊版本 ( LAION-400M)上進行訓練的,后續迭代并沒有使用 LAION 數據集。但這一回應馬上被“打臉”:斯坦福大學的報告指出,Imagen 的開發人員發現 400M 包含“各種不當內容,包括色情圖像、種族主義誹謗和有害的社會成見”。

其實對于LAION數據集是什么情況,Google心里也有數。早在Imagen發布時,也專門針對LAION-400M做出警示:因為依賴于這種未經整理的網絡數據, 集成了大模型的社會偏見和限制,因此不適合公開使用。

斯坦福大學的研究人員表示, CSAM 的存在并不一定會影響在數據集上訓練的模型的輸出,但模型總有可能從圖像中學到一些東西。 同時研究人員也承認,要完全刪除有問題的內容是很困難的,尤其是從人工智能模型中刪除。他們建議應該棄用在 LAION-5B 上訓練的模型,并在可行的情況下停止分發。

3、有“前科”,還不止一次

誰能想到,這并不是 LAION 的圖像數據集第一次受到攻擊。

早在 2021 年 10 月,認知科學家 Abeba Birhane(現任 Mozilla 人工智能高級研究員)就發表了一篇研究早期圖像數據集 LAION-400M的論文。研究發現,該數據集包含“令人不安的露骨圖像和文本對”。

此外,LAION還被卷入兩場訴訟之中。

一起是2023 年年初,三名藝術家對 Stability AI 和另外兩家公司提起訴訟,稱這些公司使用了來自 LAION-5B 的數百萬張受版權保護的圖像來訓練他們的圖像生成模型。其中一位知名人士Karla Ortiz還在一次公開講話中抨擊了 LAION-5B 數據集:“LAION-5B包含令人深感擔憂的材料,例如私人醫療記錄、未經同意的色情內容、兒童圖像,甚至社交媒體上我們真實面孔的照片。”

另一起案件的訴訟原因如出一轍。Getty Images起訴Stability AI,指責后者公然侵犯了其知識產權,且規模驚人。Getty Images聲稱,Stability AI未經許可將其1200萬張照片(通過 LAION)取走,并用來訓練Stable Diffusion,侵犯了Getty Images的版權和商標保護權。

4、AI訓練中的數據合規問題

大模型“大力出奇跡”的暴力美學,決定了擁有的數據越多、質量越高,大模型的能力也就愈加強大。除企業本身積累的數據,開源數據集等也構成大模型數據來源的一部分。如何確保來源繁雜的AI訓練數據的合規?成為擺在企業面前的一道難題。

人工智能技術的應用中存在的數據合規問題主要包括以下幾個方面:

一是數據隱私保護。個人或組織的敏感信息可能被用于訓練機器學習模型和數據分析。因此,需要采取措施保護數據隱私,例如數據加密、匿名化和訪問控制等。

二是數據的可信和準確性。模型訓練的準確性和性能取決于訓練數據的質量。因此,需要采取刪除無用數據、數據質量檢查、刪除敏感信息、數據標注等措施確保數據的可靠和準確。

三是數據的所有權問題。許多數據是由多個組織共享的,例如醫療記錄或交通流量數據。因此,需要明確數據的所有權和共享方式,以避免數據的非法使用和侵權行為。

頂尖科技的發展過程雖然可能摻雜一些“小插曲”,但AI大模型的發展之路也不應被這些插曲淹沒,而是應該從中得到一些反思。回到這次事件本身,無論是提供開源數據集的組織,還是使用公眾數據集的企業,都應該守好行業底線、遵守行業準則,讓AI應用能夠穩穩落地。

參考鏈接:

https://venturebeat.com/ai/a-free-ai-image-dataset-removed-for-child-sex-abuse-images-has-come-under-fire-before/

https://www.theverge.com/2023/12/20/24009418/generative-ai-image-laion-csam-google-stability-stanford

https://zhuanlan.zhihu.com/p/621678747

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2013-03-19 10:17:59

云計算谷歌BigQuery

2025-04-07 13:24:52

2018-12-20 10:26:44

Facebook信息泄露數據安全

2015-12-02 14:34:10

Taste?Analy大數據云計算

2023-12-01 14:50:57

AI破產

2021-04-12 17:47:25

Facebook開源AI

2018-03-20 10:46:11

2020-07-27 10:23:10

開源技術 數據

2015-10-10 17:47:25

實名認證安全漏洞支付寶

2011-12-16 16:29:57

2010-07-26 09:47:14

2023-12-01 16:23:52

大數據人工智能

2021-11-30 18:44:17

漏洞Zoom網絡攻擊

2025-06-20 09:12:00

2024-09-12 09:16:11

2023-05-26 20:08:35

2018-10-19 12:16:06

開源技術 數據

2020-06-24 07:53:03

機器學習技術人工智能

2025-03-05 11:09:20

點贊
收藏

51CTO技術棧公眾號

日韩a级作爱片一二三区免费观看| 波多野结衣在线中文| 欧美视频二区| 波多野结衣久草一区| 三级成人在线视频| 精品视频二区| 国产精品久久久久久影视| 国产精品美女久久久久久久久久久| ****av在线网毛片| 欧美一区二区三区四区夜夜大片| 欧美性高跟鞋xxxxhd| 成人精品毛片| 久章草在线视频| 久久精品电影网站| 黑人巨大精品欧美黑白配亚洲| 日韩精品毛片| 日韩精品久久一区二区三区| 一区二区日韩电影| 99久久精品费精品国产| 中文字幕不卡| 国产日韩欧美影视| 色综合久久久网| 不卡视频在线| 中文字幕中文字幕在线中文字幕三区 | 欧美自拍视频在线| 国产主播一区二区三区| 国产伦子伦对白在线播放观看| 在线一区日本视频| 国产免费拔擦拔擦8x在线播放| 国产免费一区二区三区在线能观看| 精品久久久久久| 亚洲一区二区动漫| 成人动漫一区| 国产男女在线观看| 国产精品视频在线播放| 国产精品沙发午睡系列990531| 色婷婷av一区二区三区丝袜美腿| 国产日产亚洲精品| 精品91在线| 中国色在线日|韩| 免费福利片在线观看| 麻豆亚洲一区| 91精品国产免费久久久久久 | aa国产成人| 成人在线观看www| 精品国偷自产在线| 色国产综合视频| 国产一区二区三区四| 欧美va久久久噜噜噜久久| 污视频网站在线| 国产99视频精品免视看7| 国产精品白丝在线| 亚洲日本视频| 久久国产精品美女| 欧美最顶级a∨艳星| 国产一区二区三区色淫影院| 欧美乱大交做爰xxxⅹ性3| 这里只有精品99re| av不卡在线播放| 欧美美女在线直播| 国产偷倩在线播放| 三上悠亚一区二区三区| 久久亚洲中文字幕无码| 日本一区二区三区视频免费看| 国产有码一区二区| 国产一区二区av| 亚洲天堂精品在线观看| 国产一区二区三区国产| 少妇精品导航| 日韩欧美精品电影| 手机av在线播放| 国产系列电影在线播放网址| 国产69久久| 日韩欧美一区二区三区四区五区 | 欧美性感一类影片在线播放| 中文字幕在线不卡视频| 亚洲欧美日韩一区在线观看| 亚洲电影av| 99re国产精品| 中文字幕伦av一区二区邻居| 亚洲一级大片| 粉嫩av一区二区| 在线综合色站| 亚洲精品播放| 国产精品美女久久久久人| 亚洲欧洲国产精品一区| 亚瑟国产精品| 日日夜夜亚洲| 国产精品羞羞答答在线观看| 成年人视频在线观看免费| 椎名由奈jux491在线播放| 日韩欧美亚洲日产国| 亚洲区成人777777精品| 久久久久免费看黄a片app| 久久精品xxx| 影音先锋亚洲视频| 欧美狂野激情性xxxx在线观| 波多野结衣乳巨码无在线| 国产福利第一视频在线播放| 日韩精品免费在线| 欧美午夜激情小视频| 亚洲无线码一区二区三区| 一本久道久久综合中文字幕| 能在线观看的av网站| 亚洲熟妇国产熟妇肥婆| juliaann成人作品在线看| 在线成人福利| 中文字幕在线资源| 免费a在线看| 黄色成人影院| 精品三级av| 国产精品久久久久久模特| 精品在线播放午夜| 国产偷国产偷精品高清尤物| 欧美日韩一级二级三级| 日韩在线视频一区| 国产精品一区二区三区久久久 | 一区二区中文字幕在线| 欧美三级视频在线播放| 久久久极品av| 日韩高清在线播放| 国产一级电影网| 日产精品一区| 日韩精品视频一区二区三区| 伊人情人综合网| 136国产福利精品导航| 精品国产露脸精彩对白| 国产精品综合网站| 成年人免费在线播放| 欧美高清另类hdvideosexjaⅴ| 国产传媒在线观看| 国产精品日韩久久久| 亚洲成人自拍一区| 色诱女教师一区二区三区| 99精品国产在热久久婷婷| 欧美一区在线看| 最新热久久免费视频| 亚洲人成伊人成综合网小说| 欧美视频二区36p| 亚洲精品国产精品国产自| 日韩一区二区三区观看| **欧美日韩vr在线| 国产日韩一区二区在线观看| 午夜影院在线观看国产主播| 欧美美女在线观看| 国产一区二区三区黄视频| 欧美亚洲日本一区| 国产欧美日韩中文字幕在线| 天堂中文字幕一二区| 日本少妇一区| 一区二区三区在线电影| 国产精品18久久久久久久久久久久| 美腿丝袜亚洲色图| 久久国产主播| 欧美视频在线播放| 亚洲va欧美va国产综合剧情| av免费播放| 综合欧美精品| 久久精品一级爱片| 欧美亚洲成人精品| 天堂а√在线8种子蜜桃视频| 精品国产91| 欧美唯美清纯偷拍| 久久av二区| 久草在线中文最新视频| 经典三级在线一区| 精品国内亚洲在观看18黄 | 日韩在线视频线视频免费网站| 亚洲精品在线免费看| 天堂а√在线官网| 亚洲一级电影| 亚洲精品福利在线观看| 久久蜜臀中文字幕| 久久亚洲精品小早川怜子| 日韩在线免费视频观看| 欧美性色黄大片人与善| 欧洲av不卡| 亚洲免费观看高清完整版在线| 91精品视频观看| 久久久久久久久亚洲精品| 国产精品老牛| 久久精品久久久久久国产 免费| 国产卡一卡二在线| 少妇高潮一区二区三区99| 2021中文字幕一区亚洲| 国产精品久久97| 中文在线中文资源| 亚洲视频在线一区| 国产精品一区二区免费看| 日本一区二区中文字幕| 色天天综合久久久久综合片| 免费精品视频一区| www.成人网| 日韩av在线免费看| 在线成人私人影院| 国内精品久久久久影院一蜜桃| 欧美在线欧美在线| 日韩精品99| 欧美性猛交xxxx富婆| 97久久国产亚洲精品超碰热|