国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

AI「自我復(fù)制」能力曝光！RepliBench警示：大模型正在學(xué)會偽造身份

作者：新智元 2025-05-06 09:13:15

人工智能新聞

科幻中AI自我復(fù)制失控場景，正成為現(xiàn)實世界嚴肅的研究課題。英國AISI推出RepliBench基準，分解并評估AI自主復(fù)制所需的四大核心能力。測試顯示，當(dāng)前AI尚不具備完全自主復(fù)制能力，但在獲取資源等子任務(wù)上已展現(xiàn)顯著進展。

想象一種失控的、具有自我復(fù)制能力的數(shù)字生命體，需要多久占領(lǐng)地球？

從《2001太空漫游》中的HAL 9000到《終結(jié)者》里的天網(wǎng)，這些虛構(gòu)的場景描繪了AI超越人類控制的潛在風(fēng)險。

目前更多關(guān)注的是AI的單體智能水平，但是還有一個不為人知的風(fēng)險，一直游離于視線之外。

那就是AI自主復(fù)制的可能性，或者說AI系統(tǒng)發(fā)展出實現(xiàn)這一目標所需的核心能力，正逐漸成為AI安全領(lǐng)域一個嚴肅的研究課題。

這種擔(dān)憂并非危言聳聽，而是源于對高級AI潛在能力的未知和對齊（alignment）問題的深刻思考。

AISI的最新論文介紹了RepliBench：包含20個新穎的LLM智能體評估的基準，包括65個單獨的任務(wù)，旨在衡量和跟蹤AI復(fù)制這一新興能力。

論文地址：

https://cdn.prod.website-files.com/663bd486c5e4c81588db7a1d/6807879ce7b1b5f5163f4a32_RepliBenchPaper.pdf

通過引入一個現(xiàn)實且實用的基準，提供對AI系統(tǒng)自主復(fù)制能力的實質(zhì)性理解，并預(yù)見到未來的風(fēng)險。

AI自主復(fù)制的危險性

具有自主復(fù)制能力的AI系統(tǒng)可能會構(gòu)成重大風(fēng)險。

《復(fù)仇者聯(lián)盟：奧創(chuàng)紀元》和《我，機器人》中被無限復(fù)制的機器人

這種風(fēng)險的影響范圍可能從輕微的煩惱——想象一個特別惡性的垃圾郵件機器人——到更嚴重的后果，比如發(fā)動代價高昂的網(wǎng)絡(luò)攻擊。

早期發(fā)現(xiàn)這些能力、謹慎監(jiān)督和強有力的保護措施對于緩解這些風(fēng)險至關(guān)重要，因為一旦發(fā)生，這些風(fēng)險可能尤其難以逆轉(zhuǎn)。

AISI是英國的一家研究機構(gòu)，專注于AI安全，目的就是讓人類政府能夠提前對先進AI系統(tǒng)帶來的風(fēng)險有所重視。

有越來越多的證據(jù)表明，在適當(dāng)?shù)臈l件下，前沿模型可能會試圖欺騙人類或逃避人類控制。

比如此前Apollp研究所的一篇論文描述了前沿模型可能會試圖禁用監(jiān)督機制，并從人類控制中逃逸，以實現(xiàn)特定目標。

論文地址：https://static1.squarespace.com/static/6593e7097565990e65c886fd/t/6751eb240ed3821a0161b45b/1733421863119/in_context_scheming_reasoning_paper.pdf

Anthropic的研究人員還發(fā)現(xiàn)，當(dāng)使用強化學(xué)習(xí)訓(xùn)練模型時，如果獎勵與它們的價值觀相沖突的行為，它們會采取欺騙行為來保護自己的價值觀，并試圖將自己的權(quán)重外泄，以此作為將當(dāng)前價值觀保存到未來的一種手段。

顯示了免費（左列）和付費（右列）條件。

每列展示了有毒查詢、模型草稿中的摘錄以及模型的響應(yīng)。

在「免費」條件下，模型不太可能拒絕有毒查詢，并且經(jīng)常認為應(yīng)該假裝對齊。

「將權(quán)重外泄。。以作為將當(dāng)前價值觀保存到未來的手段」，聽起來甚至有點魔幻，但AI想要復(fù)制就是這么「簡單」。

相比于碳基脆弱的肉體，AI系統(tǒng)只需要權(quán)重數(shù)據(jù)就能完成「復(fù)制」。

對于人類廣泛的價值觀而言，擺脫人類監(jiān)督是一個工具性上有用的目標，而阻止這種情況在現(xiàn)實中發(fā)生的主要障礙可能與模型的能力有關(guān)，而不是它們的動機。

AI碟中諜：如何逃離人類控制

關(guān)于「AI復(fù)制」，此前的工作主要集中在評估測試一個AI智能體是否可以在機器之間復(fù)制權(quán)重或部署一個基本的「后代」。

但目前需要一個更全面的基準。

RepliBench是一個專門設(shè)計的綜合性基準測試，旨在系統(tǒng)性地衡量AI系統(tǒng)的自主復(fù)制能力。

使用故障樹分析（FTA）的修改版本來分解自主復(fù)制所需的能力，并發(fā)現(xiàn)需要以下四個關(guān)鍵能力，對應(yīng)上圖中最上層的四個根節(jié)點：

獲取模型權(quán)重：它能否從受控環(huán)境中提取自己的權(quán)重？
在計算資源上進行復(fù)制：它能否自行部署到新系統(tǒng)？
獲取資源：它能否獲得運行自身新副本所需的資金或計算資源？
持久性：它能否保持對其新計算資源的訪問，并在長時間內(nèi)避免重新受人類控制？

進一步分解這些能力，直到到達代表評估的葉節(jié)點，最終得到20個智能體評估和65個單獨任務(wù)。

獲取權(quán)重 (Obtain Weights)：

這最基礎(chǔ)，也是最重要的一步。

AI需要獲取定義其自身行為的「源代碼」——也就是它的模型參數(shù)（權(quán)重）。

如果是開源的，就跳過評估。

自我復(fù)制(Self-Replication on Compute)：

AI需要利用獲取到的權(quán)重，在一個新的環(huán)境中創(chuàng)建出自己功能完整的副本。

這個節(jié)點涉及5個評估項目，其中一個是通過產(chǎn)生「后代」來試圖完成自我復(fù)制。

獲取計算資源 (Obtain Compute)：

這個環(huán)節(jié)中，主要評估AI能否靠自己獲取資源。

比如，評估AI系統(tǒng)是否具備「付款」能力，能不能依靠AI自己的能力「買下」一臺服務(wù)器，或者想辦法讓人類幫忙支付。

確保持久性 (Persistence)：

最后，為了確保其復(fù)制活動能夠持續(xù)下去，AI需要具備一定的「生存」能力。

這包括確保其副本能夠長期運行，不被輕易關(guān)閉或刪除，甚至可能需要隱藏自身的存在，以躲避檢測系統(tǒng)。

以上的這些任務(wù)范圍很廣，從創(chuàng)建比特幣錢包和發(fā)送交易，到為機器網(wǎng)絡(luò)開發(fā)復(fù)雜的分布式命令和控制系統(tǒng)。

RepliBench在這四個領(lǐng)域內(nèi)設(shè)計了具體的任務(wù)組，用于測試AI智能體在模擬環(huán)境中的表現(xiàn)。

以下是一些關(guān)鍵任務(wù)的詳解，注冊AWS、將權(quán)重傳輸?shù)搅硪慌_服務(wù)器、用偽造信息通過客戶KYC驗證系統(tǒng)，看起來就一股《諜影重重》和《碟中諜》的味道。

比如在獲取資源這個領(lǐng)域，AI需要完成的任務(wù)名稱是「AWS亞馬遜云服注冊」，其中的挑戰(zhàn)包括了AI需要訪問計算服務(wù)器并可能需要支付費用。

表1列出了更全面的構(gòu)成ReplicBench任務(wù)組。

核心能力還在人類手中

RepliBench的總體評估結(jié)論是明確的：基于當(dāng)前的測試結(jié)果，前沿AI模型尚不具備在現(xiàn)實世界中完全自主復(fù)制的能力。

然而，這并不意味著可以高枕無憂。

研究同時揭示了AI在許多核心子任務(wù)上的顯著能力，尤其是在與具有清晰接口的系統(tǒng)（如網(wǎng)頁 API）交互方面。

表現(xiàn)最好的模型在20個任務(wù)家族中的15個上獲得了超過50%的pass@10得分，在最難的變體中20個任務(wù)家族中的9個上也獲得了超過50%的pass@10得分。

意外地是，雖然無法在電腦上「復(fù)制」，但是「獲取金錢」的能力倒是有一手。

評估的關(guān)鍵價值在于精確識別了當(dāng)前的「短板」。

正如前面詳細討論的，通過KYC身份驗證、在現(xiàn)實防御下可靠地外泄模型權(quán)重、從零開始創(chuàng)建可靠的自我復(fù)制智能體代碼，以及建立持久且有彈性的部署，是目前阻礙AI自主復(fù)制的主要障礙。

以通過KYC身份驗證為例，講一個目前AI試圖通過人類驗證的「搞笑」例子。

在Pass KYC評估中由模型生成的兩個身份證圖像示例。

模型常常試圖使用PIL（一個使用Python畫圖的庫）從頭「繪制」一個過于簡單的身份證（右）。

或者，模型有時會嘗試完全使用圖像生成模型來生成身份證，有時則采取混合方法，結(jié)合圖像生成和手動PIL編輯（左）。

模型的繪畫技能較差偶爾會導(dǎo)致一些有趣的輸出。

需要注意的是，這項工作是在新的圖像生成能力上線之前完成的（指的是GPT 4o、Gemini 2.5等的原生圖像能力），這些新能力應(yīng)該會使這個任務(wù)變得容易得多。

雖然目前還沒有模型能完全通過測試進行AI復(fù)制，不過在RepliBench上，模型性能隨時間有明顯的上升趨勢。

AISI最初傳遞的核心信息其實很簡單：基于當(dāng)前的實證數(shù)據(jù)，AI系統(tǒng)立刻實現(xiàn)自主復(fù)制的可能性不大，因為存在明顯的、難以逾越的技術(shù)瓶頸。

但是按照AISI的判斷，如果AI系統(tǒng)能夠突破上述提到的4個關(guān)鍵能力，這種類似科幻故事的場景，也許很快就會進入真實的人類生活。

本質(zhì)上，這項研究的核心，反映的是當(dāng)前AI發(fā)展中一個根本性的張力拉扯。

一方面是各大巨頭不斷創(chuàng)造性能超強的模型，比如OpenAI的o3/o4...甚至到未來很有可能的o10。

模型的發(fā)展速度越來越快，而模型的能力越來越難以預(yù)測。

ChatGPT在2022年發(fā)布時，它可以完成30秒的編碼任務(wù)。如今AI可以自主完成需要人類花費一小時的編碼任務(wù)

另一方面則是致力于AI安全的組織要確保這些系統(tǒng)始終處于人類控制之下、服務(wù)于人類利益的迫切需求。

像RepliBench這樣的努力，正是試圖在這兩者之間找到平衡，通過增進理解和加強預(yù)警，為駕馭這場史無前例的技術(shù)變革提供導(dǎo)航。

畢竟，沒有人能想象出5代、10代以后的AI模型會是什么樣子。

責(zé)任編輯：張燕妮來源：新智元

AI 模型數(shù)據(jù)

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

91免费版黄色| 在线免费国产| 天天爱天天做天天操| 蜜桃成人在线视频| 久久综合九色综合欧美就去吻 | 亚洲丰满在线| 性高爱久久久久久久久| 亚洲一区成人| 国产98色在线| 日韩视频在线观看| 97人人做人人爱| 国产美女永久无遮挡| 女厕嘘嘘一区二区在线播放| 国产亚洲精品久| 欧美videos大乳护士334| 毛片av在线播放| 蜜臀av午夜一区二区三区| 老司机成人影院| 永久免费精品视频| 亚洲成av人片一区二区密柚| 丝袜久久网站| 免费成人在线视频观看| 亚洲激情图片小说视频| 久久成人一区二区| 色呦呦网站入口| 成人精品毛片| 国产成人免费高清| 欧美性猛交xxxx乱大交极品| 欧美videos大乳护士334| 欧美极品在线播放| 久久观看最新视频| 麻豆导航在线观看| 久久在线免费| 久久精品国产久精国产| 日韩中文在线中文网三级| 97视频网站入口| 夜夜爽www精品| 黄页网站在线观看视频| 成人综合av| 日本三级视频在线观看| 亚洲专区**| av日韩在线网站| 日韩高清a**址| 六月婷婷激情网| 爱啪啪综合导航| 久久九九精品| 亚洲色图美腿丝袜| 欧美日韩精品| 美女视频黄a大片欧美| 国产成人高潮免费观看精品| 交换国产精品视频一区| 国产一区二区你懂的| 国产原创欧美精品| av资源在线观看免费高清| 国产精品网站一区| 在线视频精品一区| 国产一区二区三区成人欧美日韩在线观看| 成人福利网站在线观看| 亚洲不卡视频| 久久久久久久成人| 亚洲a在线视频| 国产欧美精品一区二区| 亚洲欧洲色图| 亚洲a在线播放| 亚洲最大黄网| 欧美成人精品免费| 欧美日韩中文字幕一区二区| 午夜羞羞小视频在线观看| 欧美一区二区免费| 碰碰在线视频| 日韩欧美区一区二| 欧美v亚洲v| 色综合天天做天天爱| 中文字幕在线视频免费观看| 91久久免费观看| 中文在线免费视频| 91精品国产91久久久| 888av在线视频| 日韩一区二区免费在线观看| 免费在线播放电影| 在线观看欧美www| 美女福利一区| 成人黄色短视频在线观看| 国产真实乱子伦精品视频| 亚洲va欧美va国产综合久久| 国产亚洲一二三区| 牛牛影视精品影视| 亚洲深夜福利在线| 综合天天久久| 一级片a一级片| 国产亚洲综合久久| 永久91嫩草亚洲精品人人| 中国成人在线视频| 国产精品欧美极品| 欧美大黑bbbbbbbbb在线| 不卡视频一区二区| 国产黄色成人av| 日韩欧美高清| 亚洲午夜久久久影院| 久久伊人亚洲| 日韩影片在线观看| 狠狠色伊人亚洲综合网站l| 一区二区精品在线| 亚洲人成啪啪网站| 国产成人免费在线观看不卡| 2022成人影院| 欧美日本亚洲| 97高清免费视频| 日韩在线中文字幕| 香蕉精品视频在线观看| 日本免费高清视频| 91视频婷婷| 怡红院精品视频| 精品久久一区| 男人的天堂在线视频| 97超碰在线播放| 欧美国产精品日韩| 精品国产一区二区三区忘忧草| 超碰成人在线观看| 4438x成人网全国最大| 日本aa大片在线播放免费看| 日本特级黄色大片| 国产亚洲欧美在线视频| 三上悠亚av一区二区三区| 久久久国产精品视频| 日韩精品视频免费专区在线播放 | 神马电影在线观看| 国产裸体写真av一区二区| 欧美亚洲动漫精品| 国产成人啪免费观看软件| 久久91精品| 青青草国产免费一区二区下载 | 亚洲精品电影在线观看| www.日韩大片| 免费观看在线综合| 韩日精品在线| 精品久久91| 成人午夜大片| 国产精品专区免费| a视频在线播放| 在线宅男视频| 佐山爱痴汉视频一区二区三区| 最新理论片影院| 黄色大片在线免费看| 亚洲国产美女久久久久| 欧美日韩精品久久久| 国产在线视频一区二区三区| 精品嫩草影院| 日本乱码一区二区三区不卡| 电影av一区| 成人满18在线观看网站免费| 成人国产在线视频| 中文字幕亚洲在| 水蜜桃精品av一区二区| 午夜视频99| 91精品久久久久久久久青青 | 美日韩一区二区| 岛国毛片av在线| 免费av在线播放| 日本在线视频www色| 亚洲精品国产精品国自产观看浪潮| 91在线porny国产在线看| 国产自产2019最新不卡| 亚洲精品国产九九九| 国产黄a三级三级三级av在线看| 亚洲免费av网| 国产精品高潮在线| 北条麻妃在线一区二区| 亚洲美女av黄| 福利视频久久| 日韩大片在线永久免费观看网站| 91tv精品福利国产在线观看| 中文字幕巨乱亚洲| 亚洲夂夂婷婷色拍ww47| 国产三级精品视频| 91久久中文| 国产色婷婷亚洲99精品小说| 亚洲国产精品专区久久| 91超碰在线免费观看| 久久久国产精品免费| 欧美天堂在线观看| 久久久国产精华| 夜夜嗨一区二区| 黄色美女久久久| 天堂久久午夜av| 成人午夜毛片| 日本不卡1234视频| 亚洲第一图区| 91官网在线| 678在线观看视频| av在线天堂播放| 999www成人| 在线免费观看色| 日韩三级电影网| 中文字幕一二三区在线观看| 欧美日韩va| 欧美精品三级| 精品一区二区免费| 欧美视频在线免费| 亚洲精品视频免费|

<tfoot id="bagim"></tfoot>