Agentic AI 演進：從 LLM 到 DeepAgents 的跨越歷程

作者：崔皓 2025-11-27 09:00:00

本文圍繞 Agentic AI 展開，介紹了其演進階段，包括只能 “回答問題” 的 LLM、會 “操作工具” 的 AI Agent 以及具備協作能力的 Agentic AI。

作者 | 崔皓

審校 | 重樓

開篇

在過去短短幾年里，AI 的形態正在經歷一次層層遞進的演化。它從最初只能“回答問題”的大型語言模型（LLM），逐步走向會“操作工具”和“執行任務”的 AI Agent，并繼續邁向具備協作能力、能夠完成復雜工作流的 Agentic AI。這條演進路線不是簡單的功能疊加，而是一條從“語言能力”到“行動能力”再到“自主組織能力”的發展路徑——幾乎構成了未來智能應用的主軸。

第一階段是 LLM。它們是現代智能的基礎驅動力，具有語言理解、推理、生成內容等能力，但仍然是被動的。它們只有在看到提示時才會回應，也無法主動規劃、管理長期目標，更不具備穩定的任務記憶。
第二階段是 AI Agent。研究者給 LLM 裝上了“手腳”：讓它能調用工具、執行腳本、讀寫數據庫，并通過 ReAct 這樣的推理循環，自主解決特定任務。整個行業突然意識到，模型不僅能說話，還能“做事”。不過，這些早期代理仍然很淺，它們缺乏深度規劃，任務復雜度一高就會迷路或遺忘步驟，這便是所謂的“淺層代理陷阱”。
第三階段是 Agentic AI。行業開始意識到，真正復雜的任務無法靠單個 Agent 完成，于是出現了由多個智能體組成的系統——自主人工智能（Agentic AI）。它們通過分工、協作、協調和共享記憶，實現了遠超單體模型的能力：復雜實驗自動化、端到端研究流程、跨團隊任務執行。Agentic AI 不再是“一個模型幫你干活”，而是“一個智能團隊在替你工作”。

那么，我們如何實現Agentic AI。

深度代理與高階提示：Agentic AI 的推理基礎

在實現Agentic AI 之前，我們需要明白要構建一個真正可用、可控、可擴展的 Agentic AI 系統，僅僅讓模型能夠“行動”，甚至能夠“調用工具”，都遠遠不夠。隨著任務復雜度的增加，淺層代理暴露出明顯的局限：缺乏規劃、無法監控步驟、容易遺忘目標、缺乏一致性。

要突破這些瓶頸，兩個新概念開始在研究與實踐中迅速浮現——深度代理（Deep Agents）與高階提示（Higher-Order Prompts, HOPs）。

它們共同構建了一層新的“推理基底”，讓智能體從被動完成任務，向可組織、可管理、可協作的工作體系演進。

深度代理：從“能執行”到“能組織”

深度代理可以被視為一種具備遞歸結構、分層規劃和自我校驗能力的智能體形態。與只能沿著單一思路試探式前進的淺層代理不同，深度代理把推理過程組織成類似“項目管理”的結構。

在深度代理內部，模型不再是一股腦地輸出答案，而是會：

將任務拆解成多個子目標。
為每個子目標創建對應的子代理（sub-agent）。
在執行過程中，監控每個步驟的產出是否偏離目標。
根據結果自動調整計劃、替換策略或生成新的子任務。
在必要時進行反思（reflection）并修正錯誤鏈路。

這讓深度代理的行為更像一個具備層級結構的小型組織：上層代理負責規劃與監督，下層代理負責具體執行。

這種“組織式推理”，意味著任務不再依賴模型在一次鏈式推理中的單點成功，而是可以通過分工、反饋和糾錯來逐步逼近結果。這是復雜任務可控化的關鍵一步。

高階提示（HOPs）：告訴模型“怎么想”

如果說深度代理負責組織結構，那么高階提示就是負責“認知規范”。

傳統提示讓模型直接回答問題，例如：“總結這份材料。”高階提示則告訴模型：要如何思考、如何推理、如何組織過程。

它是一種元指令（meta-instruction），不是讓模型生成內容，而是定義模型生成內容的方式。例如：

“分析這份材料時，先推斷可能的受眾群體；再根據每個群體的需求生成對應摘要；最后提供一個適合高層閱讀的綜合版本。”

這個提示并沒有要求“給出摘要”，而是在規定思考路徑。它類似對智能體的“憲法條款”：不是告訴它要做什么，而是告訴它應該如何思考、如何分解、如何組織。

HOPs 的出現標志著思維從“設計提示”升級為“設計推理框架”。模型不再靠靈感式生成，而是按結構化的思維路線推進任務。

兩者如何交織：AI 推理的下一層基底

深度代理提供組織結構，HOPs 提供思維規范。當它們結合時，AI 的推理方式從“線性鏈式思考”變成了“分層組織式系統”。

可以用一個比喻來理解：

傳統提示 = 給工人寫任務單
HOPs = 制定工作流程
淺層代理 = 工人照著流程干
深度代理 = 工頭、組長、審計員一起上

當深度代理在執行任務時，它可以使用 HOPs 來構建子任務的推理流程；當多個代理協作時，整個系統又可以依賴 HOP 作為一致性的思維規范，確保方向統一。

這種協同讓 AI 具備了幾項以前難以實現的能力：

面對復雜任務能保持穩定性
任務失敗后能自我修正
大型任務能自動拆解為可管理模塊
多代理協作更加順暢

正是這兩種機制的出現，使 Agentic AI 不再停留于“能調用工具的 LLM”，而邁向“具備組織能力的智能系統”。它構成了下一階段 AI 應用的底層基礎。

好，到這里我們已經理解了 Agentic AI 的兩個基礎概念，深度代理（組織資源）+高階提示（安排干活）。這里感覺Agentic AI 就是一個包工頭，負責組織牛馬給資本家打工。下面將介紹 Agentic AI 的最佳實踐，看看這套方法論是如何落地的。

Agentic AI 的最佳實踐：從工具鏈到深度智能體

前面談了那么多的Agentic AI，只是一套方法論。從“能執行任務”到“能組織任務再執行任務”，這條進化路徑在業界的各類實踐中表現得非常鮮明。現在，讓我們把幾種典型的實踐并排放在一起，看看它們分別在體系結構、目標場景和能力重心上處于什么位置。

LangChain、LangGraph 與 DeepAgents：從框架到運行時，再到“駕駛艙”

要理解這三者的關系，不妨把它們看成同一家族里不同層級的工具。如下圖所示：

LangChain 位于最核心的部分，提示模板決定了它如何理解任務，工具接口決定了它如何與外部系統交互，Agent Loop 決定了它如何觀察、思考、行動。這一層就像示意圖中間的那圈虛線：它將 LLM 與工具之間的來回調用封裝成一個可復用的代理結構，但并沒有加入規劃工具、記憶系統或持久化文件系統。這讓 LangChain 具有靈活性，適合需要自己構建代理邏輯、自己管理工具體系的開發者。

LangGraph 包裹在 LangChain 的外層，成為一個“代理運行時”。它把智能體的執行過程變成一個圖結構：節點負責狀態更新，邊定義條件分支，你可以做循環、做并行、做持久化，就像把一次對話變成一段真正的可管理流程。有人把它比作“LangChain 的 Kubernetes”，理由就在這里：它處理的是執行層面的穩定性和可控性。

DeepAgents 位于最外層，是一個近似“代理駕駛艙”或“代理中臺”的體系。添加了“長期自主運行”所需的全部配套機制。示意圖最外面的藍色虛線，就是它所覆蓋的范圍。DeepAgents 內置任務規劃器、子代理機制、文件系統后端和持久化存儲工具，這些都是為了讓代理能夠處理長任務、遞歸任務和需要反思的任務。可以看到圖右側那些“Planning Tool”“Filesystem Tools”“SubAgent A”，這些工具并不是外插的，而是 DeepAgents 內部原生支持的能力。它把一個代理從“能執行”提升到“能組織、能管理、能記憶”，形成一個完整的深度智能體。

如果把這三者的關系用一句話總結，那就是：LangChain 做“動作”，LangGraph 管“流程”，DeepAgents 負責整個“組織”。

對于這個三件套組合而言，我們可以直接使用DeepAgents 完成具體的 Agentic AI 實踐。雖然，DeepAgents 是本文的主角，不過還有一些業內比較知名的 Agentic AI 實踐，這里一并給大家做介紹，在做完橫向對比之后，我們才知道在什么場景下使用DeepAgents 。這里可以先給個劇透，DeepAgents 對單個復雜任務的深入分析特別在行。

Auto-GPT：早期自主代理的雛形，邊界也同樣明顯

Auto-GPT 當年火得一塌糊涂，是因為它第一次讓大眾看到“代理可以自己想下一步做什么”。不過它的自主性很大程度上依賴鏈式思維，不具備真正意義上的規劃器、文件系統和結構化上下文管理。它能遞歸生成子目標，但無法保證任務在長時間運行后保持方向一致，用戶經常需要人工調整提示。

相比之下，DeepAgents 把規劃器內置，并用虛擬文件系統維持長期記憶。Auto-GPT 更像是自主代理時代的“概念車”，而 DeepAgents 則像是這條技術路線的“量產車版本”。

OpenAgents：專注“智能體網絡”，而非單體深度能力

OpenAgents 的視角與 DeepAgents 完全不同。它關心多個智能體如何共享資源、如何加入網絡、如何互聯互通。它更接近“協議棧”或“基礎設施層”，像是在搭建一個互聯網式的 Agent 網絡。

DeepAgents 則關注“一個智能體如何更聰明地工作”。任務分解、子代理、規劃、記憶、上下文隔離等能力都是內部機制。它不是為協同網絡設計的，而是為構建“強壯的單體智能體”設計的，因此兩者非常互補。

AutoGen：對話式協作的專家，但不是深度執行系統

微軟的 AutoGen 是一個非常有代表性的多智能體框架：它強調角色扮演、專家協作，通過結構化對話來推動推理。讓編碼代理、批評者代理、研究代理討論一輪，再把結果返給用戶，這是它的核心優勢。

與之相比，DeepAgents 雖然也能生成子代理，但它不是圍繞“對話”設計，而是圍繞“執行深度任務”。你可以把 AutoGen 看成“團隊討論室”，而把 DeepAgents 看成“自動化工廠的中央控制系統”。兩者擅長的領域不同，也常常被放在不同應用場景中。

體系橫向對比

框架 / 實踐	核心定位	協作/流程機制	記憶與持久化	典型優勢	代表場景
LangChain	代理框架	單線 ReAct / Tool 調用	短期上下文	開發簡單	簡單任務、快速原型
LangGraph	代理運行時（流程編排）	圖結構、分支、循環、持久化	可跨節點保留狀態	穩定執行、多線程能力	非線性工作流、狀態機式任務
DeepAgents	代理中臺 / 駕駛艙	分層、子代理、規劃器、文件系統	VFS + 長短期記憶	深度推理、長期自主執行	長任務、項目級自動化
Auto-GPT	自主代理雛形	遞歸自我調用	弱記憶	自動目標生成	演示概念、短任務實驗
OpenAgents	智能體網絡協議	多代理網絡通信	網絡共享	資源協同	多代理生態、互聯應用
AutoGen	多角色協作框架	結構化對話	對話上下文	專家協作	多角色推理、團隊式任務

橫向比較之后，DeepAgents 的角色就相當清晰了。它不是最早、不是最輕量、也不是最專注協作的方案，但它是最接近“真正的深度智能體”所需特質的框架。因為它同時具備：能規劃、能記住、能執行、能自我組織、能擴展子任務，而且能在長任務中保持穩定性。

這正是 Agentic AI 想跨越的那道門檻：從“能完成任務的模型”，走向“能管理自己的思考過程的系統”。

什么是 DeepAgents？

通過上面的橫向比較我們發現， DeepAgents 專注于“讓代理真正干活”的獨立框架。它基于 LangGraph 的運行模型，結合了多步推理、任務規劃和上下文管理能力，能夠支撐代理在復雜流程中自主思考、拆解任務并持續行動。

如下圖所示，框架內置規劃器（Planning Tool）、上下文文件系統（File System）以及按需生成的子代理機制（Sub Agents），使代理能在執行過程中動態擴展能力，適應不同類型的子任務。

在了解 DeepAgents 核心概念之前，我們需要明確一點，就是 DeepAgents 的應用場景。

許多應用在跨出“問一句、答一句”的簡單交互后，都會撞上類似的瓶頸：任務結構變得更復雜，信息量不斷堆疊，步驟之間彼此牽連，單一代理很難維持一條穩定、清晰的推理鏈。在這種情況下，系統若要圍繞某個課題或項目展開持續性的深入研究，就會呈現出鏈式、迭代式的特征。資料需要多次查閱整合，觀點要反復打磨驗證，研究路徑也必須隨著進展不斷調整。這類過程天然依賴精準的信息管理、長期的上下文保持能力和靈活的動態推理機制。

DeepAgents 正是在這一背景下顯得格外契合。它為深度研究和復雜任務提供了穩健的執行支架，讓代理能夠在長期的探索過程中持續積累知識、分析信息并調整策略，保持一種近乎“長期科研助理”的工作方式。面對實際工作中常見的需求——規劃任務、拆分步驟、整理資料、調用外部工具，甚至將工作委派給更合適的子代理——DeepAgents 都能提供結構化的支持。

DeepAgents 的核心能力

在了解 DeepAgents 以及其應用場景之后，我們來看看 DeepAgents具備多種核心能力。

1. 規劃與分解：通過內置的write_todos工具，它能把復雜目標轉化為可執行步驟。這種結構化規劃方式，讓代理能跟蹤任務進度、重排優先級，還能根據新信息動態調整計劃。

2. 上下文管理：DeepAgents借助ls、read_file等文件系統工具，高效應對大型或變化的上下文。它把信息存儲到持久文件系統，避免上下文窗口溢出，還能無縫處理不同長度的工具結果。

3. 子代理生成：使DeepAgents能利用內置task工具生成專門的子代理，處理特定子任務。這種方式既保證主代理上下文清晰，又利于在特定領域深入推理和探索。

4. 長期的記憶：通過LangGraph的Store實現跨會話的持久記憶擴展。代理可保存和檢索過往交互知識，保持學習連續性，構建更豐富的長期上下文。

入門 DeepAgents

在了解 DeepAgents 的核心功能之后，我們通過官網的一個簡單例子來快速拉近與 DeepAgents 的距離。

在開始之前，需要從模型提供商（如Tavily）獲取API密鑰。這些密鑰是使用模型服務的必要憑證，后續代碼運行時會依賴它們來調用相應的模型進行推理。

步驟1: 安裝依賴

pip install deepagents tavily-python

使用 pip 進行組件安裝，deepagents 是核心庫，提供了構建深度智能體所需的各種功能；tavily-python 則用于實現網絡搜索功能，為智能體獲取外部信息提供支持。

步驟2: 設置API密鑰

export TAVILY_API_KEY="your-tavily-api-key"

通過環境變量的方式設置API密鑰。ANTHROPIC_API_KEY 是Anthropic模型提供商的API密鑰，TAVILY_API_KEY 是Tavily搜索服務的API密鑰。在代碼運行時，程序會從環境變量中讀取這些密鑰，以便調用相應的服務。

步驟3: 創建搜索工具

import os
from typing import Literal
from tavily import TavilyClient
from deepagents import create_deep_agent

tavily_client = TavilyClient(api_key=os.environ["TAVILY_API_KEY"])

def internet_search(
    query: str,
    max_results: int = 5,
    topic: Literal["general", "news", "finance"] = "general",
    include_raw_content: bool = False,
):
    """Run a web search"""
    return tavily_client.search(
        query,
        max_results=max_results,
        include_raw_content=include_raw_content,
        topic=topic,
    )

此步驟首先導入必要的庫，然后創建 TavilyClient 實例，使用之前設置的 TAVILY_API_KEY 進行初始化。接著定義了 internet_search 函數，該函數接受查詢詞、最大結果數量、搜索主題和是否包含原始內容等參數，調用 TavilyClient 的 search 方法進行網絡搜索，并返回搜索結果。這個函數將作為智能體的一個工具，用于獲取外部信息。

步驟4: 創建深度智能體

# System prompt to steer the agent to be an expert researcher
research_instructions = """You are an expert researcher. Your job is to conduct thorough research and then write a polished report.

You have access to an internet search tool as your primary means of gathering information.

## `internet_search`

Use this to run an internet search for a given query. You can specify the max number of results to return, the topic, and whether raw content should be included.
"""

agent = create_deep_agent(
    tools=[internet_search],
    system_prompt=research_instructions
)

定義了一個系統提示 research_instructions，它的作用是引導智能體扮演一個專業的研究人員角色。在提示中告知智能體其任務是進行全面研究并撰寫報告，同時說明了可以使用 internet_search 工具來收集信息，并介紹了該工具的使用方法。然后使用 create_deep_agent 函數創建深度智能體，將 internet_search 工具和系統提示傳入，這樣智能體就知道自己的任務和可用的工具了。

步驟5: 運行智能體

result = agent.invoke({"messages": [{"role": "user", "content": "What is langgraph?"}]})
# Print the agent's response
print(result["messages"][-1].content)

使用 agent.invoke 方法向智能體發送用戶查詢 “What is langgraph?”，并將結果存儲在 result 變量中。最后打印出智能體的回復。

當運行智能體時，它會自動執行以下操作：

1. 規劃方法：利用內置的 write_todos 工具將研究任務分解為可執行的步驟，使任務處理更有條理。

2. 進行研究：調用 internet_search 工具從網絡上收集與查詢相關的信息。

3. 管理上下文：使用文件系統工具（如 write_file、read_file）處理大量的搜索結果，避免上下文窗口溢出，確保能正常處理不同長度的信息。

4. 生成子智能體：對于復雜的子任務，委派專門的子智能體進行處理，提高處理效率和準確性。

5. 合成報告：將收集到的信息進行整理和分析，生成連貫的回復。

DeepAgents 客制化

在介紹了 DeepAgents 的簡單實踐之后，我們再來看看它的另一面：客制化。通過對 DeepAgents 進行定制，能夠使其更好地滿足不同場景的需求。以下將從模型、系統提示和工具三個方面詳細介紹如何定制 DeepAgents。

模型定制

默認情況下，DeepAgents 使用 “claude-sonnet-4-5-20250929” 模型。不過，你可以通過傳入任意 LangChain 模型對象來進行定制。示例代碼如下：

from langchain.chat_models import init_chat_model
from deepagents import create_deep_agent

model = init_chat_model(
    model="gpt-5",
)
agent = create_deep_agent(
    model=model,
)

在這段代碼中，首先使用 init_chat_model 函數初始化了一個 “gpt - 5” 模型對象 model。然后，在創建深度智能體時，將這個自定義的模型對象 model 傳入 create_deep_agent 函數，這樣就完成了模型的定制。

系統提示定制

DeepAgents 自帶一個受 Claude Code 系統提示啟發的內置系統提示，默認的系統提示包含了使用內置規劃工具、文件系統工具和子智能體的詳細說明。但針對每個特定用例的深度智能體，應該包含一個針對該用例的自定義系統提示。示例如下：

from deepagents import create_deep_agent

research_instructions = """\
You are an expert researcher. Your job is to conduct \
thorough research, and then write a polished report. \
"""

agent = create_deep_agent(
    system_prompt=research_instructions,
)

這里定義了一個自定義的系統提示 research_instructions，它引導智能體扮演一個專業的研究人員，任務是進行全面研究并撰寫報告。在創建深度智能體時，將這個自定義的系統提示傳入 create_deep_agent 函數，從而實現系統提示的定制。

工具定制

和工具調用智能體一樣，深度智能體可以使用一組頂級工具。示例代碼展示了如何創建一個自定義的搜索工具并應用到深度智能體中：

import os
from typing import Literal
from tavily import TavilyClient
from deepagents import create_deep_agent

tavily_client = TavilyClient(api_key=os.environ["TAVILY_API_KEY"])

def internet_search(
    query: str,
    max_results: int = 5,
    topic: Literal["general", "news", "finance"] = "general",
    include_raw_content: bool = False,
):
    """Run a web search"""
    return tavily_client.search(
        query,
        max_results=max_results,
        include_raw_content=include_raw_content,
        topic=topic,
    )

agent = create_deep_agent(
    tools=[internet_search]
)

代碼中，首先創建了一個 TavilyClient 實例，用于調用 Tavily 的搜索服務。然后,定義了 internet_search 函數，該函數接受查詢詞、最大結果數量、搜索主題和是否包含原始內容等參數，調用 TavilyClient 的 search 方法進行網絡搜索并返回結果。最后在創建深度智能體時，將 internet_search 工具傳入 create_deep_agent 函數。

除了你提供的工具外，深度智能體還可以使用一些默認工具，如下：

write_todos（更新智能體的待辦事項列表）
ls（列出智能體文件系統中的所有文件）
read_file（從智能體文件系統中讀取文件）
write_file（在智能體文件系統中寫入新文件）
edit_file（編輯智能體文件系統中的現有文件）
task（生成子智能體來處理特定任務）

總結

本文圍繞 Agentic AI 展開，介紹了其演進階段，包括只能 “回答問題” 的 LLM、會 “操作工具” 的 AI Agent 以及具備協作能力的 Agentic AI。實現 Agentic AI 需深度代理和高階提示這兩個基礎概念，前者提供組織結構，后者提供思維規范，二者結合讓 AI 具備應對復雜任務的能力。還對比了 LangChain、LangGraph、DeepAgents 等不同實踐的特點，突出 DeepAgents 適合長任務和項目級自動化。接著介紹了 DeepAgents 的核心能力、入門示例，最后講解了其客制化方法，涵蓋模型、系統提示和工具定制，使其能更好滿足不同場景需求。

作者介紹

崔皓，51CTO社區編輯，資深架構師，擁有18年的軟件開發和架構經驗，10年分布式架構經驗。

責任編輯：龐桂玉來源： 51CTO

国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看