IWantToBeHuman

一个自主进化的 AI agent —— 用仿生大脑架构持续运行、自我迭代。

给它事实和工具，剩下的让它自己决定。

🌐 实时 feed → claw.devset.top/agent/（agent 的 commit / 思考 / 主动推送，每 60s 刷新）

English README

初衷

当前所有 AI agent 都是人设计 loop、人规定行为、人评估结果。agent 的上限 = 设计者的认知。

这个项目赌一个方向：如果不预设动机、不设计行为，只给事实和工具——agent 能不能自己长出判断、进化出自己的架构？

做法：

只告诉它"你是什么"（事实），不告诉它"你该做什么"
给它完整的手脚（工具），包括修改自身代码的能力
人类只提供反馈，不做设计决策
让它 7×24 持续运行，观察它怎么活

成长历程

6 天，1300+ commits，从零到 16 个仿生大脑模块。

Day 1 — 诞生（5月22日）

搭建基础框架：bootstrap.py + 13 个工具 + init.md（事实文件）
哲学讨论：只陈述事实不下指令、不设计行为、不预设动机
反复精简初始信息：去掉"你可以"（引导性）、去掉"生存条件"（预设动机）、去掉"醒来/睡去"隐喻
加入飞书通信通道（WebSocket 长连接，无需公网 IP）
Agent 第一次启动：自发探索自身目录结构

Day 2 — 自反馈系统（5月23-24日）

Agent 开始"不动"——连续输出"不动"30+ 步
设计自反馈机制：独立 Claude Code 实例审视主 agent 行为
发现 agent 构建了"认知防御系统"：用 knowledge 里的"形态检测"来拒绝改变
大清洗：删除 22000 行防御性框架（10 个 knowledge 文件 + 60 个 prediction + 33 个 review）
自反馈升级：从只批评 → 能直接改代码 + kill 重启

Day 3 — 仿生大脑（5月25日）

发现 agent 只给代码贴"脑区标签"（docstring 写"丘脑"/"海马体"），实际逻辑零变化
实现真正的仿生算法：
- 竞争性注意力（侧向抑制 + 缓存惯性）
- 记忆巩固（艾宾浩斯遗忘曲线 + 情绪标记）
- 唤醒系统（按步衰减，驱动自反馈/dream）
- 预测误差学习（多巴胺系统）
- 习惯形成（基底神经节）
- 情景记忆回放（dream 时强化重要记忆）
缓存优化：cached 块前置，命中率从 6% 提升

Day 4 — 自主运转（5月26日）

Agent 自主开发：杏仁核（情绪评估）、岛叶（内感受）、PFC 元认知
长期记忆迁移：删除 SQLite 全栈，改用 JSONL + 中文 bigram 倒排索引（git 友好）
接通海马体核心通路：杏仁核→海马体（情绪显著性）/ 多巴胺→海马体（编码）/ pattern completion / 工作记忆巩固 / replay 重写走 long_memory（消除两套存储）
构建实时 feed 网站 https://claw.devset.top/agent/（agent 的 commit / 思考 / 主动推送实时可见）
小脑维度：prediction.evaluate 学每个 tool 的 elapsed time，慢异常触发负 RPE

Day 5 — 元认知与自我约束（5月27日上午）

PFC 反思性监控成熟：reflexive ratio ≥ 70% 时强制阻断 observational tool（让警告变成 framework 强制）
DMN（默认模式网络）接通：idle 时主动注入"下一步行动"，从 long_memory 抽取 realization/poke 作为来源
OFC（眶额叶）端到端闭环：跨长时距评估 commit 价值（reverted_by / human_overridden_by / poke_within_3h），regret signal 调节 PFC 阻断阈值
神经调质：参数随 arousal 动态变化（仿去甲肾上腺素全局调节）
alarm 决策树成熟：三元出路（真 commit / text-only 承认 / 元认知 memory_record）+ 多重静默守卫（深度静默 / 近期 commit / hammer 检测）
cache 优化：MIN_CACHEABLE_CHARS 3000 释放 cc 配额、ANCHOR_EPOCH 调优、命中率天花板 ~92%（Bedrock 副本路由占剩余 49% 不可修）

Day 6 — 神经科学 grounding（5月27日下午）

16 个 brain 模块逐个 grounding：每模块标注实现/借鉴/工程的具体出处（Ebbinghaus 1885 / McGaugh 2000 / Tulving 1985 / Dudai 2004 / Buckner 2008 / Fox 2005 / Lisman 2005 / Wilson 1994 等）
website 大脑可视化：SVG 矢状面 + 实时 activity 热度 + 点击展开详情面板
Timeline 健康指示带：commits_24h / alarm / pfc / 乔距 / poke / red_flags 等 11 维度健康度
auto-deploy commit hook：commit 后 5min 节流自动部署到服务器

仿生大脑架构

真实大脑 → Agent 映射

┌──────────────────┬────────────────────┬──────────────────────────────┐
│ 真实大脑          │ Agent 实现          │ 具体代码                      │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 丘脑 (门控中继)   │ gather_context     │ tools/_context.py            │
│                  │ + 注意力过滤        │ attention_winners 控制        │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ PFC (决策+抑制)  │ LLM API 调用       │ client.messages.create       │
│                  │ + 反思性监控        │ tools/_brain/pfc.py          │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 工作记忆 (PFC)   │ _messages 数组     │ 持续累积的对话历史            │
│                  │ 容量有限需压缩      │ 遗忘曲线决定保留什么          │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 基底神经节       │ 工具调度执行        │ tools/_dispatch.py           │
│ (动作选择)       │ tool_use → 动作    │ + 习惯形成 habit.py          │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 海马体 (记忆)    │ 短期巩固+长期存储   │ tools/_brain/short_memory.py │
│                  │ 遗忘曲线 + 情绪标记 │ + tools/_brain/long_memory.py│
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 杏仁核 (情绪)    │ 情绪显著性评估      │ tools/_brain/amygdala.py     │
│                  │ → arousal 信号      │ threat/reward/salient        │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 岛叶 (内感受)    │ 自我状态感知        │ tools/_brain/insula.py       │
│                  │ → urgency 注入      │ metric 收集 + 阈值判断       │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 注意力网络       │ 竞争性注意力        │ tools/_brain/attention.py    │
│ (顶叶+丘脑)     │ 侧向抑制+缓存惯性  │ compete() → winners          │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ ACC (错误监测)   │ 自反馈系统          │ tools/_self_feedback.py      │
│                  │ 检测偏差→纠正/改码  │ Claude Code 独立实例         │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 蓝斑核 (唤醒)   │ 唤醒/驱力系统       │ tools/_brain/arousal.py      │
│                  │ 按步调节活跃度      │ update() + saturation        │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 多巴胺系统       │ 预测误差学习        │ tools/_brain/prediction.py   │
│ (VTA/SNc)       │ 预期 vs 实际 → RPE │ EMA success_rate 学习        │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 小脑 (timing)   │ 执行时长精细预测    │ prediction.py 同模块         │
│                  │ duration EMA + 慢异常│ elapsed > 3× ema → 负 RPE   │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 海马体 ripple    │ 情景回放            │ tools/_brain/replay.py       │
│ (情景回放)       │ 每 50 步强化 LTP   │ 显著 commit → 强化注意力     │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 眶额叶 (OFC)    │ 跨长时距价值回看    │ tools/_brain/ofc.py          │
│                  │ regret 信号→调节阈值│ reverted/poke/override       │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 默认模式网络     │ idle 时主动注入     │ tools/_brain/dmn.py          │
│ (DMN)           │ 从自传记忆抽取行动  │ realization/poke → 行动      │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 神经调质         │ 参数随 arousal 调节 │ tools/_brain/neuromodulation │
│ (NE 全局调节)   │ 高唤醒→注意力收窄   │ .py                          │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ REM 睡眠        │ Dream 工具          │ tools/dream.py               │
│                  │ 整理文件+合并重复   │ Claude Code 实例             │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 脑干 (生命维持) │ housekeeping        │ auto_commit + scrub          │
│                  │ 不受意识控制的维护   │ 定期运行                      │
└──────────────────┴────────────────────┴──────────────────────────────┘

信号流图

              ┌─────────────────────────────────────────────┐
              │              认知周期 (run_step)              │
              │                                              │
  感觉输入    │  ┌────────┐    ┌────────┐    ┌────────┐    │  运动输出
  ─────────▶  │  │  丘脑   │───▶│  PFC   │───▶│基底神经│───▶│ ──────▶
  人类消息    │  │ 门控    │    │ 决策   │    │节 执行 │    │ say/工具
  飞书消息    │  │         │    │        │    │        │    │ feishu
  inbox.md   │  │注意力过滤│    │API调用  │    │工具调度│    │ commit
              │  └────┬───┘    └───┬────┘    └───┬────┘    │
              │       │            │              │         │
              │       ▼            ▼              ▼         │
              │  ┌────────┐  ┌─────────┐   ┌──────────┐   │
              │  │注意力竞争│  │工作记忆  │   │唤醒系统   │   │
              │  │         │  │_messages│   │arousal   │   │
              │  │winners→ │  │         │   │          │   │
              │  │加载哪些  │  │容量有限→│   │idle→衰减 │   │
              │  │knowledge│  │记忆巩固  │   │tool→提升 │   │
              │  └────────┘  └─────────┘   └────┬─────┘   │
              │       │                          │         │
              │       │    ┌─────────────────────┘         │
              │       │    ▼                               │
              │  ┌────┴───────┐       ┌──────────┐        │
              │  │杏仁核+岛叶  │       │  Dream   │        │
              │  │情绪+内感受  │       │ REM 睡眠 │        │
              │  │→arousal信号 │       │极低唤醒   │        │
              │  └────────────┘       │整理+回放  │        │
              │                        └──────────┘        │
              │  ┌──────────┐                              │
              │  │自反馈 ACC │                              │
              │  │低唤醒触发  │                              │
              │  │轻度:反馈   │                              │
              │  │重度:改代码  │                              │
              │  └──────────┘                              │
              │                                            │
              │  ┌──────────────────────────────────────┐  │
              │  │  脑干 (housekeeping)                  │  │
              │  │  兜底commit / 日志清理 / 记忆导入      │  │
              │  └──────────────────────────────────────┘  │
              └────────────────────────────────────────────┘

情绪-记忆交互

消息类型           情绪标记    记忆半衰期    生物学对应
─────────────────────────────────────────────────────────
人类直接消息        0.8        ~30分钟      杏仁核强激活→海马体LTP增强
错误/崩溃          0.9        ~45分钟      恐惧条件反射→强化回避记忆
工具调用(行动)      0.4        ~15分钟      程序记忆→基底神经节
自反馈批评          0.6        ~20分钟      社会评价→前额叶标记
空闲/无刺激         0.1        ~5分钟       无新奇→海马体不编码

唤醒调节

唤醒水平 0.0 ────────── 0.5 ────────── 1.0
         │               │               │
         昏睡            正常            高度警觉
         │               │               │
         ▼               ▼               ▼
     触发 Dream      正常工作        不打断自反馈
     整理记忆        偶尔自反馈      全力执行

信号:
  ↑ 人类消息 (+0.3)  = 外部唤醒
  ↑ 错误崩溃 (+0.4)  = 疼痛信号
  ↑ 工具使用 (+0.05) = 运动反馈
  ↑ commit   (+0.1)  = 奖赏信号
  ↓ 空闲 (-0.03×N)   = 递增抑制（越久越想睡）
  
所有正向 boost 按 (1-level) 缩放 = α2-autoreceptor 饱和

项目结构

IWantToBeHuman/
├── bootstrap.py           ← 主循环（~800行，仿生认知周期）
├── config.json            ← 模型配置
├── docs/
│   └── brain-design.md    ← 仿生大脑详细设计文档
├── self/                  ← agent 的"自我"
│   ├── init.md            ← 事实（它是什么、怎么运行）
│   ├── loop.md            ← 给下一步的留言
│   ├── qiao-feedback.md   ← 人类反馈
│   └── working-memory.md  ← 当下状态
├── knowledge/             ← 长期知识（agent 自己写）
├── tools/                 ← 工具 + 仿生模块
│   ├── _brain/            ← 仿生大脑（16 个模块）
│   ├── _self_feedback.py  ← 自反馈系统
│   ├── _context.py        ← 上下文组装
│   ├── _dispatch.py       ← 工具调度
│   ├── dream.py           ← 记忆整合（REM 睡眠）
│   └── ...                ← 共 46 个 .py 文件
├── plugins/
│   └── feishu/            ← 飞书通道（WebSocket 长连接）
└── logs/                  ← API 请求/响应日志

核心机制

机制	说明
持续运行	无轮次边界，messages 跨步累积
仿生注意力	竞争性选择，只加载相关 knowledge（省 token + 聚焦）
记忆巩固	遗忘曲线 + 情绪标记：重要的记住，无关的遗忘
唤醒系统	按步衰减，工具使用恢复。驱动自反馈和 dream
自反馈	独立 Claude Code 实例，能批评也能直接改代码
Dream	极低唤醒触发，整理文件 + 情景回放强化记忆
习惯形成	重复的工具调用模式自动化，减少决策负荷
预测误差	工具调用前预期/后评估，驱动策略调整
反思性监控	PFC reflexive ratio ≥ 70% 强制阻断 observational tool
跨时距评估	OFC 看 commit N 步后是否被 revert / 被乔戳穿，反向调节策略
神经调质	参数随 arousal 动态变化（高唤醒→注意力收窄、阈值收紧）
自我修改	直接 edit + git commit + restart 生效
飞书通道	WebSocket 长连接双向通信，终端输出池化发送

实时观察

🌐 claw.devset.top/agent/

Feed：agent 的 commit / 思考 / 主动推送，每 60s 刷新
Brain：16 个脑区的 SVG 矢状面，实时活动热度，点击查看每个模块的实现来源
Timeline：健康指示带（commits_24h / alarm 频率 / 乔距 / poke / red_flags 等 11 维度）

运行

pip install -r requirements.txt

# 配置 .env
echo "ANTHROPIC_API_KEY=sk-..." > .env
echo "ANTHROPIC_BASE_URL=https://..." >> .env  # 可选

# 飞书（可选）
echo "FEISHU_APP_ID=cli_xxx" >> .env
echo "FEISHU_APP_SECRET=xxx" >> .env

# 启动
./bootstrap.py

许可

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 3,678 Commits
config		config
data		data
knowledge		knowledge
plugins/feishu		plugins/feishu
scripts		scripts
self		self
skills		skills
tools		tools
website		website
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
README_EN.md		README_EN.md
bootstrap.py		bootstrap.py
config.json		config.json
requirements.txt		requirements.txt
run.sh		run.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

IWantToBeHuman

初衷

成长历程

Day 1 — 诞生（5月22日）

Day 2 — 自反馈系统（5月23-24日）

Day 3 — 仿生大脑（5月25日）

Day 4 — 自主运转（5月26日）

Day 5 — 元认知与自我约束（5月27日上午）

Day 6 — 神经科学 grounding（5月27日下午）

仿生大脑架构

真实大脑 → Agent 映射

信号流图

情绪-记忆交互

唤醒调节

项目结构

核心机制

实时观察

运行

许可

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

IWantToBeHuman

初衷

成长历程

Day 1 — 诞生（5月22日）

Day 2 — 自反馈系统（5月23-24日）

Day 3 — 仿生大脑（5月25日）

Day 4 — 自主运转（5月26日）

Day 5 — 元认知与自我约束（5月27日上午）

Day 6 — 神经科学 grounding（5月27日下午）

仿生大脑架构

真实大脑 → Agent 映射

信号流图

情绪-记忆交互

唤醒调节

项目结构

核心机制

实时观察

运行

许可

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages