OpenAI重磅發布AgentKit - AI代理開發進入全新時代

2025-10-14 09:15:31

AgentKit的發布標志著AI代理開發進入了一個全新的時代。通過將復雜的技術門檻降低為可視化操作，OpenAI不僅讓更多企業能夠快速構建和部署AI代理，也為整個行業樹立了新的標準。

在AgentKit問世之前，開發AI代理意味著要在碎片化的工具之間艱難周旋——復雜的編排系統沒有版本控制、定制連接器開發、手動評估流程、提示調優，以及在正式發布前數周的前端開發工作。如今，AgentKit讓開發者能夠通過可視化界面設計工作流，并使用全新的構建模塊更快速地嵌入代理用戶界面。

AgentKit核心組件全解析

Agent Builder：提供可視化畫布，用于創建和版本管理多代理工作流，支持拖拽式節點操作、工具連接和自定義防護欄配置。

Connector Registry：為管理員提供統一的數據和工具連接管理中心，覆蓋所有OpenAI產品線。

ChatKit：專為在產品中嵌入可定制的基于聊天的代理體驗而設計的工具包。

此外，OpenAI還擴展了評估能力，新增數據集、追蹤評分、自動提示優化和第三方模型支持等功能，全面提升代理性能測量和改進能力。

Agent Builder：從復雜編排到可視化設計

隨著代理工作流變得愈發復雜，開發者急需更清晰的可視化管理工具。Agent Builder正是為此而生，它提供了一個可視化畫布，支持通過拖拽節點組合邏輯、連接工具并配置自定義防護欄。該平臺支持預覽運行、內聯評估配置和完整版本控制，非常適合快速迭代開發。

圖片

"Agent Builder徹底改變了我們的開發流程。過去需要數月復雜編排、定制代碼和手動優化的工作，現在只需幾個小時就能完成。可視化畫布讓產品、法務和工程團隊保持同步，迭代周期縮短了70%，代理上線時間從兩個季度縮短到兩個沖刺周期。" —— Ramp團隊

日本領先的科技和互聯網服務公司LY Corporation同樣受益匪淺，他們使用Agent Builder在不到兩小時內就構建出了工作助手代理。

"Agent Builder讓我們以全新的方式編排代理，工程師和領域專家能夠在同一個界面中協作。我們構建了第一個多代理工作流并在不到兩小時內運行起來，極大地加速了代理創建和部署的時間。" —— LY Corporation

企業級數據管理：Connector Registry

OpenAI同時推出了面向企業的Connector Registry，用于跨多個工作空間和組織治理和維護數據。該注冊表將數據源整合到一個統一的管理面板中，覆蓋ChatGPT和API。注冊表包含所有預構建連接器，如Dropbox、Google Drive、SharePoint和Microsoft Teams，以及第三方MCP連接器。

開發者還可以在Agent Builder中啟用Guardrails——一個開源的模塊化安全層，幫助保護代理免受意外或惡意行為的影響。Guardrails能夠屏蔽或標記個人身份信息、檢測越獄攻擊并應用其他安全防護措施，讓構建和部署可靠、安全的代理變得更加容易。

ChatKit：簡化代理聊天體驗嵌入

為代理部署聊天用戶界面往往比預期更復雜——需要處理流式響應、管理對話線程、顯示模型思考過程，以及設計引人入勝的聊天體驗。ChatKit讓在產品中嵌入原生感的基于聊天的代理變得簡單。它可以嵌入到應用或網站中，并可定制以匹配您的主題或品牌。

"我們使用ChatKit為Canva開發者社區構建支持代理，節省了超過兩周的開發時間，并在不到一小時內完成集成。這個支持代理將徹底改變開發者與我們文檔的互動方式，將其轉變為對話式體驗，讓在Canva上構建應用和集成變得更加容易。" —— Canva

ChatKit已經支持從內部知識助手、入職指南到客戶支持和研究代理等多種使用場景。HubSpot的客戶支持代理就是其中一個典型例子。

全新Evals能力：精準測量代理性能

構建可靠的生產級代理需要嚴格的性能評估。去年，OpenAI推出了Evals來幫助開發者測試提示和測量模型行為。現在，他們新增了四項能力，讓構建評估變得更加容易：

? 數據集 - 從零開始快速構建代理評估，并通過自動評分器和人工注釋持續擴展

? 追蹤評分 - 對代理工作流進行端到端評估，并自動化評分以精準定位不足之處

? 自動提示優化 - 基于人工注釋和評分器輸出生成改進的提示

? 第三方模型支持 - 在OpenAI Evals平臺內評估其他提供商的模型

圖片

"評估平臺將我們多代理盡職調查框架的開發時間縮短了超過50%，并將代理準確性提升了30%。" —— Carlyle

強化微調推動代理性能新突破

強化微調(RFT)讓開發者能夠定制OpenAI的推理模型。該功能在OpenAI o4-mini上正式可用，在GPT-5上處于私人測試階段。OpenAI正與數十家客戶密切合作，在更廣泛發布前完善GPT-5的RFT功能。

今天，OpenAI在RFT測試版中引入了兩項旨在進一步推動代理性能的新功能：

? 自定義工具調用 - 訓練模型在正確的時間調用正確的工具以獲得更好的推理能力

? 自定義評分器 - 為您的使用場景中最重要的方面設置自定義評估標準

定價與可用性

從今天開始，ChatKit和新的Evals功能已向所有開發者正式開放。Agent Builder目前處于測試版階段，Connector Registry正在向部分擁有全局管理控制臺的API、ChatGPT Enterprise和Edu客戶開始測試版推出。所有這些工具都包含在標準API模型定價中。

OpenAI計劃很快向ChatGPT添加獨立的Workflows API和代理部署選項。

行業影響與未來展望

從Klarna處理三分之二客服工單的支持代理，到Clay實現10倍增長的銷售代理，再到Ramp從空白畫布到功能完整采購代理的數小時構建，這些成功案例充分證明了AgentKit在實際業務場景中的巨大價值。

隨著AI代理技術的不斷成熟和工具的持續完善，我們有理由相信，未來將有更多企業能夠通過AgentKit這樣的平臺，快速實現AI代理的落地應用，推動業務的智能化轉型。

正如OpenAI所說："我們迫不及待地想看到你們的創造。"

責任編輯：武曉燕來源：阿丸筆記

国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看