13. 架构对比与下一步

完整架构对比

组件	Claude Code	mini-claude	差异
Agent Loop	7 种 continue reason	只检查 tool_use	简化循环控制
工具数量	66+ 工具	13 个工具（6 核心 + web_fetch + tool_search + skill + agent + 2 plan mode）	去掉特化工具
工具执行	并发执行 + streaming 早期启动	并行执行 + streaming 早期启动	架构对齐
API 后端	Anthropic only	Anthropic + OpenAI 兼容	多了 OpenAI
System Prompt	static/dynamic 分界 + API 缓存	无缓存优化	去掉缓存
权限系统	7 层 + AST 分析 + 8 级规则源	5 模式 + 规则配置 + 正则 + 确认	层次对齐
上下文管理	4 级压缩流水线	4 层（budget + snip + microcompact + 摘要）	架构对齐
记忆系统	4 类型 + 语义召回 + MEMORY.md 索引	4 类型 + 语义召回 + MEMORY.md + 异步预取	架构对齐
技能系统	6 源 + 懒加载 + inline/fork	2 源 + 预加载 + inline/fork	去掉高级加载
多 Agent	Sub-Agent + 自定义 + Coordinator + Swarm	Sub-Agent（3 内置 + 自定义）	去掉 Coordinator/Swarm
MCP 集成	mcpClient.ts + 动态工具发现	McpManager + JSON-RPC over stdio	架构对齐
预算控制	USD/轮次/abort 三维预算	USD + 轮次限制	去掉 abort signal
编辑验证	14 步流水线	引号容错 + 唯一性 + diff 输出	保留核心步骤

文件映射表

mini-claude (TypeScript)	mini-claude (Python)	Claude Code 源码	说明
`src/agent.ts`	`python/mini_claude/agent.py`	`src/query.ts` + `src/QueryEngine.ts`	Agent 循环 + 会话管理
`src/tools.ts`	`python/mini_claude/tools.py`	`src/Tool.ts` + `src/tools/` (66 个目录)	工具定义与执行
`src/prompt.ts`	`python/mini_claude/prompt.py`	`src/constants/prompts.ts` + `src/utils/claudemd.ts`	Prompt 构造
`src/cli.ts`	`python/mini_claude/__main__.py`	`src/entrypoints/cli.tsx` + `src/commands/`	入口与命令
`src/ui.ts`	`python/mini_claude/ui.py`	`src/components/` (React/Ink 组件)	UI 渲染
`src/session.ts`	`python/mini_claude/session.py`	`src/utils/sessionStorage.ts` + `src/history.ts`	会话持久化
`src/memory.ts`	`python/mini_claude/memory.py`	`src/utils/memory.ts` + 系统 prompt 注入	记忆系统
`src/skills.ts`	`python/mini_claude/skills.py`	`src/utils/skills.ts` + `src/tools/SkillTool/`	技能系统
`src/subagent.ts`	`python/mini_claude/subagent.py`	`src/tools/AgentTool/` (built-in types)	子 Agent 类型配置
`src/mcp.ts`	`python/mini_claude/mcp.py`	`src/services/mcpClient.ts`	MCP 客户端

我们没实现的

Hooks（钩子系统）

Claude Code 有 25 种 hook 事件、6 种 hook 类型，可在工具执行前后插入自定义逻辑——拦截危险操作、记录审计日志、自动运行 lint 检查。它是 Claude Code 从”工具”变成”平台”的关键机制。

我们没实现的原因：核心挑战不在于”调一个函数”，而在于 hook 的发现与加载、错误隔离、stdin/stdout JSON 数据协议。这些工程细节约 500-800 行，但对理解 agent 原理没有帮助。

Coordinator / Swarm 多 Agent 模式

我们实现了 Sub-Agent（fork-return）。Claude Code 还有两种模式：Coordinator 把大任务拆分给多个专业 Agent，Swarm 让多个 Agent 对等通信、并行探索。两种模式解决的是单 Agent 上下文不够时的任务分解问题。

没实现的原因：核心挑战是任务分解准确性和 Agent 间通信协议设计，更多是 prompt engineering 问题而非代码架构问题。实现本身不复杂，但要真正好用需要大量 prompt 调优。

LSP 集成

LSP 让 agent 在编辑文件后毫秒级获得类型错误反馈，而不需要等完整的编译/测试周期。在大型项目中，这能把修复一个 bug 所需的循环次数减少 30-50%。

没实现的原因：需要管理 LSP 服务器进程、实现客户端协议（初始化握手、能力协商、增量同步），1000+ 行且依赖对 LSP 协议的深入理解。通过 shell 命令（tsc --noEmit、python -m py_compile）获得错误反馈，对教程场景已经足够。

Prompt Caching

Anthropic API 支持缓存系统提示词——Claude Code 把不变的部分（角色定义、工具规范）放前面，变化的部分（git 状态、当前文件）放后面，缓存命中可将输入 token 成本降低 90%。

没实现的原因：代码改动极小（20-30 行），但需要仔细设计提示词分区策略。如果你的 agent 要上线，这应该是第一个加上的优化。

Bash AST 安全分析

Claude Code 用 tree-sitter 解析 shell 命令的 AST，进行 23 项静态安全检查，能分析出管道组合中的危险命令——这是纯正则做不到的。

没实现的原因：tree-sitter 是 C/C++ 原生库，需要 node-gyp 编译环境，环境障碍太高。正则匹配覆盖了 80% 的常见危险模式，教程场景风险可接受。

渐进式增强路线图

第一阶段：性能与成本优化（1-2 天）

增强项	解决的问题	预计代码量
Prompt Caching	重复发送系统提示词浪费 token	~30 行

Prompt Caching 是投入产出比最高的优化：给系统提示词的静态部分加上 cache_control: { type: "ephemeral" } 标记，多轮对话中节省 50%+ 的输入 token 成本。

第二阶段：可扩展性（3-5 天）

增强项	解决的问题	预计代码量
Hook 系统	定制 agent 行为需要改源码	~300 行
Tool 类型系统	switch/case 不能扩展到 20+ 工具	~200 行

核心转变是从硬编码到插件化。当前 switch/case 在 10 个工具时没问题，但超过 20 个就需要引入 Tool 接口（或 Python 的 Protocol/ABC），让每个工具成为独立模块。

第三阶段：可靠性与安全（1-2 周）

增强项	解决的问题	预计代码量
7 种错误恢复策略	当前遇到错误直接崩溃	~400 行
Bash AST 安全分析	正则匹配漏检复杂危险命令	~600 行

Claude Code 的 query.ts 有 1728 行，大部分是边缘情况处理：Prompt Too Long 时自动压缩重试、API 过载时指数退避、工具失败时把错误反馈给模型让它自修复。

第四阶段：高级 Agent 能力（2-4 周）

增强项	解决的问题	预计代码量
Coordinator 模式	大任务超出单 Agent 上下文容量	~500 行
Swarm 模式	探索性任务需要多路径并行	~600 行
LSP 集成	类型错误只能通过编译发现	~1000 行

扩展方向

1. Hooks 系统

最简单的方案是 command hook——在 executeTool 前 spawn shell 子进程，通过 stdin JSON 传入工具信息，解析 stdout JSON 决定 allow/deny。

配置示例：

{
  "hooks": {
    "PreToolUse": [
      { "matcher": "run_shell", "command": "./hooks/pre-shell.sh" }
    ]
  }
}

核心逻辑：遍历匹配的 hook，spawn 子进程传 JSON，根据 {"action": "allow"} / {"action": "deny", "reason": "..."} 决定是否继续执行。约 300 行，最耗时的是子进程的超时和 crash 处理。

2. 错误自修复

把工具执行错误作为工具结果反馈给模型，而不是中断循环。模型经常能自己修复：路径拼错换路径、命令参数错了改参数。

try {
  result = await executeToolImpl(name, input);
} catch (e) {
  result = `Error: ${e.message}\n\nPlease try a different approach.`;
}
// 把 result 作为 tool_result 返回给模型

约 50-80 行，但能显著提升 agent 实际可用性——这是 Claude Code 最聪明的设计之一。

核心洞察

1. Agent 的本质是一个 while 循环

while true:
    response = llm.call(messages)
    if no tool_calls in response: break
    for tool_call in response.tool_calls:
        result = execute(tool_call)
        messages.append(result)

所有的复杂性——权限、上下文管理、记忆、多 Agent——都是围绕这个循环的增强和防护。

2. 提示词是最便宜的代码

系统提示词里的一句话，效果等同于一个 if 语句，实现成本是 0 行代码。agent 开发中很多行为问题的最优解不是写更多代码，而是写更好的提示词——更灵活、更容易修改、非技术人员也能读懂。

3. 工具设计决定能力上限

让模型做它擅长的（理解意图、生成代码），让工具做模型不擅长的（精确字符串匹配、文件系统操作、进程管理）。edit_file 是典型：模型生成要替换的内容，工具负责在文件中精确定位和替换。

4. 上下文管理是 agent 的”记忆力”

上下文管理之于 agent，就像内存管理之于操作系统——用有限资源提供”无限”错觉。4 层压缩流水线让 agent 在有限窗口中保持对长对话的记忆。

5. 安全不是事后补丁

权限检查是 agent 循环的一个步骤，不是外挂的 middleware。没有任何工具可以绕过它。更重要的是 fail-closed 设计：新工具如果忘记声明权限级别，被自动当作”需要确认”处理——系统通过默认值保证安全。

6. 从 3000 行到 50 万行的差距在于边缘情况

Claude Code 多出来的代码大多是：各运行环境兼容性、网络和 API 不可靠性、用户输入多样性、企业级审计和访问控制。这些”无聊”的代码不会出现在架构图中，却是工具能否在真实世界可靠运行的关键。从原型到产品，80% 的距离在这里。

7. LLM 与代码的协作边界

构建 coding agent 最核心的能力：设计好 LLM 和代码之间的协作边界。哪些让 LLM 决定，哪些让代码决定——边界划得好，agent 既灵活又可靠。我们在教程里每个设计决策都体现了这个原则：模型决定”做什么”，代码确保”安全地做”。

交叉引用

想深入了解 Claude Code 各模块的设计原理？参考兄弟项目的详细文档：

主题	本教程	how-claude-code-works
Agent 循环	Ch1: Agent Loop	系统主循环
工具系统	Ch2: 工具系统	工具系统
上下文管理	Ch7: 上下文管理	上下文工程
权限安全	Ch6: 权限与安全	权限与安全
记忆系统	Ch8: 记忆系统	记忆系统
技能系统	Ch9: 技能系统	技能系统
Plan Mode	Ch10: Plan Mode	—
多 Agent	Ch11: 多 Agent	多 Agent 架构
MCP 集成	Ch12: MCP 集成	—

结语

~4300 行代码（TS）/ ~3800 行（Python），12 个文件，覆盖了一个 coding agent 的核心组件和进阶能力：

Phase 1 — 核心组件： Agent Loop、工具系统（13 工具 + mtime 防护 + 延迟加载 + 并行执行）、System Prompt（Markdown 模板 + @include + 环境注入）、CLI / 会话（REPL + JSON 持久化）、流式输出（Anthropic + OpenAI 双后端 + streaming 工具执行）、权限安全（5 模式 + 声明式规则 + 正则 + 确认）、上下文管理（4 层压缩 + 大结果持久化）

Phase 2 — 进阶能力： 记忆系统（语义召回 + 异步预取）、技能系统（inline/fork 双模式）、Plan Mode（只读规划 + 4 选项审批）、多 Agent（Sub-Agent + 3 内置类型 + 自定义）、MCP 集成（JSON-RPC over stdio）、预算控制

Claude Code 50 万行里的大量代码是边缘情况处理和企业级可靠性。但核心 agent 能力——理解用户意图 → 调用工具操作代码 → 迭代直到完成——就是这 ~3400 行的事。

现在你有了一个功能丰富的 coding agent，也理解了它背后每一行代码的设计意图。去扩展它吧。

Tsukino Dev Notes

探索

13. 架构对比与下一步

13. 架构对比与下一步

完整架构对比

文件映射表

我们没实现的

Hooks（钩子系统）

Coordinator / Swarm 多 Agent 模式

LSP 集成

Prompt Caching

Bash AST 安全分析

渐进式增强路线图

第一阶段：性能与成本优化（1-2 天）

第二阶段：可扩展性（3-5 天）

第三阶段：可靠性与安全（1-2 周）

第四阶段：高级 Agent 能力（2-4 周）

扩展方向

1. Hooks 系统

2. 错误自修复

核心洞察

交叉引用

结语

最近更新

源码仓库镜像

Tsukino Dev Notes

_navbar

_sidebar

SKILL

关系图谱

目录