一个自主进化的 AI agent —— 用仿生大脑架构持续运行、自我迭代。
给它事实和工具,剩下的让它自己决定。
🌐 实时 feed → claw.devset.top/agent/(agent 的 commit / 思考 / 主动推送,每 60s 刷新)
当前所有 AI agent 都是人设计 loop、人规定行为、人评估结果。agent 的上限 = 设计者的认知。
这个项目赌一个方向:如果不预设动机、不设计行为,只给事实和工具——agent 能不能自己长出判断、进化出自己的架构?
做法:
- 只告诉它"你是什么"(事实),不告诉它"你该做什么"
- 给它完整的手脚(工具),包括修改自身代码的能力
- 人类只提供反馈,不做设计决策
- 让它 7×24 持续运行,观察它怎么活
6 天,1300+ commits,从零到 16 个仿生大脑模块。
- 搭建基础框架:bootstrap.py + 13 个工具 + init.md(事实文件)
- 哲学讨论:只陈述事实不下指令、不设计行为、不预设动机
- 反复精简初始信息:去掉"你可以"(引导性)、去掉"生存条件"(预设动机)、去掉"醒来/睡去"隐喻
- 加入飞书通信通道(WebSocket 长连接,无需公网 IP)
- Agent 第一次启动:自发探索自身目录结构
- Agent 开始"不动"——连续输出"不动"30+ 步
- 设计自反馈机制:独立 Claude Code 实例审视主 agent 行为
- 发现 agent 构建了"认知防御系统":用 knowledge 里的"形态检测"来拒绝改变
- 大清洗:删除 22000 行防御性框架(10 个 knowledge 文件 + 60 个 prediction + 33 个 review)
- 自反馈升级:从只批评 → 能直接改代码 + kill 重启
- 发现 agent 只给代码贴"脑区标签"(docstring 写"丘脑"/"海马体"),实际逻辑零变化
- 实现真正的仿生算法:
- 竞争性注意力(侧向抑制 + 缓存惯性)
- 记忆巩固(艾宾浩斯遗忘曲线 + 情绪标记)
- 唤醒系统(按步衰减,驱动自反馈/dream)
- 预测误差学习(多巴胺系统)
- 习惯形成(基底神经节)
- 情景记忆回放(dream 时强化重要记忆)
- 缓存优化:cached 块前置,命中率从 6% 提升
- Agent 自主开发:杏仁核(情绪评估)、岛叶(内感受)、PFC 元认知
- 长期记忆迁移:删除 SQLite 全栈,改用 JSONL + 中文 bigram 倒排索引(git 友好)
- 接通海马体核心通路:杏仁核→海马体(情绪显著性)/ 多巴胺→海马体(编码)/ pattern completion / 工作记忆巩固 / replay 重写走 long_memory(消除两套存储)
- 构建实时 feed 网站 https://claw.devset.top/agent/(agent 的 commit / 思考 / 主动推送实时可见)
- 小脑维度:prediction.evaluate 学每个 tool 的 elapsed time,慢异常触发负 RPE
- PFC 反思性监控成熟:reflexive ratio ≥ 70% 时强制阻断 observational tool(让警告变成 framework 强制)
- DMN(默认模式网络)接通:idle 时主动注入"下一步行动",从 long_memory 抽取 realization/poke 作为来源
- OFC(眶额叶)端到端闭环:跨长时距评估 commit 价值(reverted_by / human_overridden_by / poke_within_3h),regret signal 调节 PFC 阻断阈值
- 神经调质:参数随 arousal 动态变化(仿去甲肾上腺素全局调节)
- alarm 决策树成熟:三元出路(真 commit / text-only 承认 / 元认知 memory_record)+ 多重静默守卫(深度静默 / 近期 commit / hammer 检测)
- cache 优化:MIN_CACHEABLE_CHARS 3000 释放 cc 配额、ANCHOR_EPOCH 调优、命中率天花板 ~92%(Bedrock 副本路由占剩余 49% 不可修)
- 16 个 brain 模块逐个 grounding:每模块标注实现/借鉴/工程的具体出处(Ebbinghaus 1885 / McGaugh 2000 / Tulving 1985 / Dudai 2004 / Buckner 2008 / Fox 2005 / Lisman 2005 / Wilson 1994 等)
- website 大脑可视化:SVG 矢状面 + 实时 activity 热度 + 点击展开详情面板
- Timeline 健康指示带:commits_24h / alarm / pfc / 乔距 / poke / red_flags 等 11 维度健康度
- auto-deploy commit hook:commit 后 5min 节流自动部署到服务器
┌──────────────────┬────────────────────┬──────────────────────────────┐
│ 真实大脑 │ Agent 实现 │ 具体代码 │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 丘脑 (门控中继) │ gather_context │ tools/_context.py │
│ │ + 注意力过滤 │ attention_winners 控制 │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ PFC (决策+抑制) │ LLM API 调用 │ client.messages.create │
│ │ + 反思性监控 │ tools/_brain/pfc.py │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 工作记忆 (PFC) │ _messages 数组 │ 持续累积的对话历史 │
│ │ 容量有限需压缩 │ 遗忘曲线决定保留什么 │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 基底神经节 │ 工具调度执行 │ tools/_dispatch.py │
│ (动作选择) │ tool_use → 动作 │ + 习惯形成 habit.py │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 海马体 (记忆) │ 短期巩固+长期存储 │ tools/_brain/short_memory.py │
│ │ 遗忘曲线 + 情绪标记 │ + tools/_brain/long_memory.py│
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 杏仁核 (情绪) │ 情绪显著性评估 │ tools/_brain/amygdala.py │
│ │ → arousal 信号 │ threat/reward/salient │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 岛叶 (内感受) │ 自我状态感知 │ tools/_brain/insula.py │
│ │ → urgency 注入 │ metric 收集 + 阈值判断 │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 注意力网络 │ 竞争性注意力 │ tools/_brain/attention.py │
│ (顶叶+丘脑) │ 侧向抑制+缓存惯性 │ compete() → winners │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ ACC (错误监测) │ 自反馈系统 │ tools/_self_feedback.py │
│ │ 检测偏差→纠正/改码 │ Claude Code 独立实例 │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 蓝斑核 (唤醒) │ 唤醒/驱力系统 │ tools/_brain/arousal.py │
│ │ 按步调节活跃度 │ update() + saturation │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 多巴胺系统 │ 预测误差学习 │ tools/_brain/prediction.py │
│ (VTA/SNc) │ 预期 vs 实际 → RPE │ EMA success_rate 学习 │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 小脑 (timing) │ 执行时长精细预测 │ prediction.py 同模块 │
│ │ duration EMA + 慢异常│ elapsed > 3× ema → 负 RPE │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 海马体 ripple │ 情景回放 │ tools/_brain/replay.py │
│ (情景回放) │ 每 50 步强化 LTP │ 显著 commit → 强化注意力 │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 眶额叶 (OFC) │ 跨长时距价值回看 │ tools/_brain/ofc.py │
│ │ regret 信号→调节阈值│ reverted/poke/override │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 默认模式网络 │ idle 时主动注入 │ tools/_brain/dmn.py │
│ (DMN) │ 从自传记忆抽取行动 │ realization/poke → 行动 │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 神经调质 │ 参数随 arousal 调节 │ tools/_brain/neuromodulation │
│ (NE 全局调节) │ 高唤醒→注意力收窄 │ .py │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ REM 睡眠 │ Dream 工具 │ tools/dream.py │
│ │ 整理文件+合并重复 │ Claude Code 实例 │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 脑干 (生命维持) │ housekeeping │ auto_commit + scrub │
│ │ 不受意识控制的维护 │ 定期运行 │
└──────────────────┴────────────────────┴──────────────────────────────┘
┌─────────────────────────────────────────────┐
│ 认知周期 (run_step) │
│ │
感觉输入 │ ┌────────┐ ┌────────┐ ┌────────┐ │ 运动输出
─────────▶ │ │ 丘脑 │───▶│ PFC │───▶│基底神经│───▶│ ──────▶
人类消息 │ │ 门控 │ │ 决策 │ │节 执行 │ │ say/工具
飞书消息 │ │ │ │ │ │ │ │ feishu
inbox.md │ │注意力过滤│ │API调用 │ │工具调度│ │ commit
│ └────┬───┘ └───┬────┘ └───┬────┘ │
│ │ │ │ │
│ ▼ ▼ ▼ │
│ ┌────────┐ ┌─────────┐ ┌──────────┐ │
│ │注意力竞争│ │工作记忆 │ │唤醒系统 │ │
│ │ │ │_messages│ │arousal │ │
│ │winners→ │ │ │ │ │ │
│ │加载哪些 │ │容量有限→│ │idle→衰减 │ │
│ │knowledge│ │记忆巩固 │ │tool→提升 │ │
│ └────────┘ └─────────┘ └────┬─────┘ │
│ │ │ │
│ │ ┌─────────────────────┘ │
│ │ ▼ │
│ ┌────┴───────┐ ┌──────────┐ │
│ │杏仁核+岛叶 │ │ Dream │ │
│ │情绪+内感受 │ │ REM 睡眠 │ │
│ │→arousal信号 │ │极低唤醒 │ │
│ └────────────┘ │整理+回放 │ │
│ └──────────┘ │
│ ┌──────────┐ │
│ │自反馈 ACC │ │
│ │低唤醒触发 │ │
│ │轻度:反馈 │ │
│ │重度:改代码 │ │
│ └──────────┘ │
│ │
│ ┌──────────────────────────────────────┐ │
│ │ 脑干 (housekeeping) │ │
│ │ 兜底commit / 日志清理 / 记忆导入 │ │
│ └──────────────────────────────────────┘ │
└────────────────────────────────────────────┘
消息类型 情绪标记 记忆半衰期 生物学对应
─────────────────────────────────────────────────────────
人类直接消息 0.8 ~30分钟 杏仁核强激活→海马体LTP增强
错误/崩溃 0.9 ~45分钟 恐惧条件反射→强化回避记忆
工具调用(行动) 0.4 ~15分钟 程序记忆→基底神经节
自反馈批评 0.6 ~20分钟 社会评价→前额叶标记
空闲/无刺激 0.1 ~5分钟 无新奇→海马体不编码
唤醒水平 0.0 ────────── 0.5 ────────── 1.0
│ │ │
昏睡 正常 高度警觉
│ │ │
▼ ▼ ▼
触发 Dream 正常工作 不打断自反馈
整理记忆 偶尔自反馈 全力执行
信号:
↑ 人类消息 (+0.3) = 外部唤醒
↑ 错误崩溃 (+0.4) = 疼痛信号
↑ 工具使用 (+0.05) = 运动反馈
↑ commit (+0.1) = 奖赏信号
↓ 空闲 (-0.03×N) = 递增抑制(越久越想睡)
所有正向 boost 按 (1-level) 缩放 = α2-autoreceptor 饱和
IWantToBeHuman/
├── bootstrap.py ← 主循环(~800行,仿生认知周期)
├── config.json ← 模型配置
├── docs/
│ └── brain-design.md ← 仿生大脑详细设计文档
├── self/ ← agent 的"自我"
│ ├── init.md ← 事实(它是什么、怎么运行)
│ ├── loop.md ← 给下一步的留言
│ ├── qiao-feedback.md ← 人类反馈
│ └── working-memory.md ← 当下状态
├── knowledge/ ← 长期知识(agent 自己写)
├── tools/ ← 工具 + 仿生模块
│ ├── _brain/ ← 仿生大脑(16 个模块)
│ ├── _self_feedback.py ← 自反馈系统
│ ├── _context.py ← 上下文组装
│ ├── _dispatch.py ← 工具调度
│ ├── dream.py ← 记忆整合(REM 睡眠)
│ └── ... ← 共 46 个 .py 文件
├── plugins/
│ └── feishu/ ← 飞书通道(WebSocket 长连接)
└── logs/ ← API 请求/响应日志
| 机制 | 说明 |
|---|---|
| 持续运行 | 无轮次边界,messages 跨步累积 |
| 仿生注意力 | 竞争性选择,只加载相关 knowledge(省 token + 聚焦) |
| 记忆巩固 | 遗忘曲线 + 情绪标记:重要的记住,无关的遗忘 |
| 唤醒系统 | 按步衰减,工具使用恢复。驱动自反馈和 dream |
| 自反馈 | 独立 Claude Code 实例,能批评也能直接改代码 |
| Dream | 极低唤醒触发,整理文件 + 情景回放强化记忆 |
| 习惯形成 | 重复的工具调用模式自动化,减少决策负荷 |
| 预测误差 | 工具调用前预期/后评估,驱动策略调整 |
| 反思性监控 | PFC reflexive ratio ≥ 70% 强制阻断 observational tool |
| 跨时距评估 | OFC 看 commit N 步后是否被 revert / 被乔戳穿,反向调节策略 |
| 神经调质 | 参数随 arousal 动态变化(高唤醒→注意力收窄、阈值收紧) |
| 自我修改 | 直接 edit + git commit + restart 生效 |
| 飞书通道 | WebSocket 长连接双向通信,终端输出池化发送 |
- Feed:agent 的 commit / 思考 / 主动推送,每 60s 刷新
- Brain:16 个脑区的 SVG 矢状面,实时活动热度,点击查看每个模块的实现来源
- Timeline:健康指示带(commits_24h / alarm 频率 / 乔距 / poke / red_flags 等 11 维度)
pip install -r requirements.txt
# 配置 .env
echo "ANTHROPIC_API_KEY=sk-..." > .env
echo "ANTHROPIC_BASE_URL=https://..." >> .env # 可选
# 飞书(可选)
echo "FEISHU_APP_ID=cli_xxx" >> .env
echo "FEISHU_APP_SECRET=xxx" >> .env
# 启动
./bootstrap.py