架构概览

架构概览

从“消息从哪里来、在哪里跑模型、怎么做副作用控制”来理解系统结构。

  • 渠道(Channels):消息入口
  • 网关(Gateway):路由、会话与安全边界
  • Agent:工具调用、记忆与工作区
  • Providers:模型与认证

一条消息怎么跑完一圈

  1. 渠道收到消息(例如 WhatsApp / Telegram / Discord)。
  2. Gateway 网关根据路由规则把消息归到一个会话(sessionKey),并决定用哪个模型/认证配置。
  3. Agent 在沙箱约束下运行:读取上下文、决定是否调用工具、执行自动化。
  4. 需要“真实世界副作用”(例如 host exec、文件写入、浏览器控制)时,受工具策略/提权/审批控制。
  5. Providers(OpenAI/Anthropic/…)负责模型推理;Gateway 网关负责把结果投递回渠道。

安全边界(为什么要有 Gateway 网关)

  • 把模型推理执行副作用隔离开:默认情况下,Agent 在沙箱里思考,越权需要显式策略/审批。
  • 把会话状态收敛到单一 Gateway 网关进程:本地 UI/远程 UI 都通过它读取状态和控制。
  • 把入口统一:渠道、Webhooks、Cron job、节点(Node)都走一致的会话/鉴权路径。

下一步