OpenAI重磅發布AgentKit - AI代理開發進入全新時代
在AgentKit問世之前,開發AI代理意味著要在碎片化的工具之間艱難周旋——復雜的編排系統沒有版本控制、定制連接器開發、手動評估流程、提示調優,以及在正式發布前數周的前端開發工作。如今,AgentKit讓開發者能夠通過可視化界面設計工作流,并使用全新的構建模塊更快速地嵌入代理用戶界面。
AgentKit核心組件全解析
Agent Builder:提供可視化畫布,用于創建和版本管理多代理工作流,支持拖拽式節點操作、工具連接和自定義防護欄配置。
Connector Registry:為管理員提供統一的數據和工具連接管理中心,覆蓋所有OpenAI產品線。
ChatKit:專為在產品中嵌入可定制的基于聊天的代理體驗而設計的工具包。
此外,OpenAI還擴展了評估能力,新增數據集、追蹤評分、自動提示優化和第三方模型支持等功能,全面提升代理性能測量和改進能力。
Agent Builder:從復雜編排到可視化設計
隨著代理工作流變得愈發復雜,開發者急需更清晰的可視化管理工具。Agent Builder正是為此而生,它提供了一個可視化畫布,支持通過拖拽節點組合邏輯、連接工具并配置自定義防護欄。該平臺支持預覽運行、內聯評估配置和完整版本控制,非常適合快速迭代開發。
圖片
"Agent Builder徹底改變了我們的開發流程。過去需要數月復雜編排、定制代碼和手動優化的工作,現在只需幾個小時就能完成。可視化畫布讓產品、法務和工程團隊保持同步,迭代周期縮短了70%,代理上線時間從兩個季度縮短到兩個沖刺周期。" —— Ramp團隊
日本領先的科技和互聯網服務公司LY Corporation同樣受益匪淺,他們使用Agent Builder在不到兩小時內就構建出了工作助手代理。
"Agent Builder讓我們以全新的方式編排代理,工程師和領域專家能夠在同一個界面中協作。我們構建了第一個多代理工作流并在不到兩小時內運行起來,極大地加速了代理創建和部署的時間。" —— LY Corporation
企業級數據管理:Connector Registry
OpenAI同時推出了面向企業的Connector Registry,用于跨多個工作空間和組織治理和維護數據。該注冊表將數據源整合到一個統一的管理面板中,覆蓋ChatGPT和API。注冊表包含所有預構建連接器,如Dropbox、Google Drive、SharePoint和Microsoft Teams,以及第三方MCP連接器。
開發者還可以在Agent Builder中啟用Guardrails——一個開源的模塊化安全層,幫助保護代理免受意外或惡意行為的影響。Guardrails能夠屏蔽或標記個人身份信息、檢測越獄攻擊并應用其他安全防護措施,讓構建和部署可靠、安全的代理變得更加容易。
ChatKit:簡化代理聊天體驗嵌入
為代理部署聊天用戶界面往往比預期更復雜——需要處理流式響應、管理對話線程、顯示模型思考過程,以及設計引人入勝的聊天體驗。ChatKit讓在產品中嵌入原生感的基于聊天的代理變得簡單。它可以嵌入到應用或網站中,并可定制以匹配您的主題或品牌。
"我們使用ChatKit為Canva開發者社區構建支持代理,節省了超過兩周的開發時間,并在不到一小時內完成集成。這個支持代理將徹底改變開發者與我們文檔的互動方式,將其轉變為對話式體驗,讓在Canva上構建應用和集成變得更加容易。" —— Canva
ChatKit已經支持從內部知識助手、入職指南到客戶支持和研究代理等多種使用場景。HubSpot的客戶支持代理就是其中一個典型例子。
全新Evals能力:精準測量代理性能
構建可靠的生產級代理需要嚴格的性能評估。去年,OpenAI推出了Evals來幫助開發者測試提示和測量模型行為。現在,他們新增了四項能力,讓構建評估變得更加容易:
? 數據集 - 從零開始快速構建代理評估,并通過自動評分器和人工注釋持續擴展
? 追蹤評分 - 對代理工作流進行端到端評估,并自動化評分以精準定位不足之處
? 自動提示優化 - 基于人工注釋和評分器輸出生成改進的提示
? 第三方模型支持 - 在OpenAI Evals平臺內評估其他提供商的模型
圖片
圖片
"評估平臺將我們多代理盡職調查框架的開發時間縮短了超過50%,并將代理準確性提升了30%。" —— Carlyle
強化微調推動代理性能新突破
強化微調(RFT)讓開發者能夠定制OpenAI的推理模型。該功能在OpenAI o4-mini上正式可用,在GPT-5上處于私人測試階段。OpenAI正與數十家客戶密切合作,在更廣泛發布前完善GPT-5的RFT功能。
今天,OpenAI在RFT測試版中引入了兩項旨在進一步推動代理性能的新功能:
? 自定義工具調用 - 訓練模型在正確的時間調用正確的工具以獲得更好的推理能力
? 自定義評分器 - 為您的使用場景中最重要的方面設置自定義評估標準
定價與可用性
從今天開始,ChatKit和新的Evals功能已向所有開發者正式開放。Agent Builder目前處于測試版階段,Connector Registry正在向部分擁有全局管理控制臺的API、ChatGPT Enterprise和Edu客戶開始測試版推出。所有這些工具都包含在標準API模型定價中。
OpenAI計劃很快向ChatGPT添加獨立的Workflows API和代理部署選項。
行業影響與未來展望
AgentKit的發布標志著AI代理開發進入了一個全新的時代。通過將復雜的技術門檻降低為可視化操作,OpenAI不僅讓更多企業能夠快速構建和部署AI代理,也為整個行業樹立了新的標準。
從Klarna處理三分之二客服工單的支持代理,到Clay實現10倍增長的銷售代理,再到Ramp從空白畫布到功能完整采購代理的數小時構建,這些成功案例充分證明了AgentKit在實際業務場景中的巨大價值。
隨著AI代理技術的不斷成熟和工具的持續完善,我們有理由相信,未來將有更多企業能夠通過AgentKit這樣的平臺,快速實現AI代理的落地應用,推動業務的智能化轉型。
正如OpenAI所說:"我們迫不及待地想看到你們的創造。"


























