架构概览
从“消息从哪里来、在哪里跑模型、怎么做副作用控制”来理解系统结构。
- 渠道(Channels):消息入口
- 网关(Gateway):路由、会话与安全边界
- Agent:工具调用、记忆与工作区
- Providers:模型与认证
一条消息怎么跑完一圈
- 渠道收到消息(例如 WhatsApp / Telegram / Discord)。
- Gateway 网关根据路由规则把消息归到一个会话(
sessionKey),并决定用哪个模型/认证配置。 - Agent 在沙箱约束下运行:读取上下文、决定是否调用工具、执行自动化。
- 需要“真实世界副作用”(例如 host exec、文件写入、浏览器控制)时,受工具策略/提权/审批控制。
- Providers(OpenAI/Anthropic/…)负责模型推理;Gateway 网关负责把结果投递回渠道。
安全边界(为什么要有 Gateway 网关)
- 把模型推理与执行副作用隔离开:默认情况下,Agent 在沙箱里思考,越权需要显式策略/审批。
- 把会话状态收敛到单一 Gateway 网关进程:本地 UI/远程 UI 都通过它读取状态和控制。
- 把入口统一:渠道、Webhooks、Cron job、节点(Node)都走一致的会话/鉴权路径。