节点赞助商

xvrzhao

请教大佬们一个问题: Agent 后端架构如何设计?

  •  
  •   xvrzhao · 5h 35m ago · 320 views

    目前的场景是这样:

    1. 前端负责用户会话交互,后端接收请求,调用 llm 和工具调用(涉及多轮循环)
    2. 不同用户会话复用同一个 llm client ,根据用户 sessionId 持久化 message history (postgres)
    3. 后端发送 sse 消息通知前端实时更新后端活动(推理过程、工具调用、执行结果等)

    思考了一轮下来,现在还剩一个问题就是:用户一次请求,后端可能会执行多轮 ReAct 循环,可能会比较耗时,可能会堆积 http 服务的并发,这种情况大家是怎么处理的?如果用异步队列的话,可能就用不了 SSE 向前端发送动态了。

    或者说,业界有没有比较比较标准化的架构设计方式?

    6 replies    2026-06-30 23:33:14 +08:00
    Rickkkkkkk
        1
    Rickkkkkkk  
       5h 15m ago
    机器上部署 codex 的 cil ,用 cc-connect 和外部交互。
    whoosy
        2
    whoosy  
       4h 58m ago
    基本都是异步队列整的,异步队列推到 redis stream ,前端订阅 http sse
    jacketma
        3
    jacketma  
       4h 43m ago   ❤️ 1
    参考 2 楼的方案用的多,官方 App 也是把多轮 react 的循环状态,在前端提示给用户嘛。要不用户干瞪眼看着,多无聊了
    GeruzoniAnsasu
        4
    GeruzoniAnsasu  
       4h 33m ago via iPhone
    我最近就在尝试研究 agent ,其实你让 claude“调研自己的环境”它就会告诉你。 有几个关键词你可以让 AI 教你:

    1. 认知循环
    2. prompt/消息 authority
    3. 分层缓存
    4. subagent 与上下文隔离
    5. tools 的 approve 门控
    6. 进程沙箱
    7. memory 系统
    isbase
        5
    isbase  
    PRO
       2h 37m ago via iPhone
    研究一下 vercel ai sdk
    laikicka
        6
    laikicka  
       2h 34m ago
    直接用 ws 不是更好吗? codex 都抛弃 sse 了.
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1166 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 48ms · UTC 18:07 · PVG 02:07 · LAX 11:07 · JFK 14:07
    ♥ Do have faith in what you're doing.