Lokasi ngalangkungan proxy:   [ UP ]  
[Ngawartoskeun bug]   [Panyetelan cookie]                
Skip to content

xiaomochn/IWantToBeHuman

Repository files navigation

IWantToBeHuman

一个自主进化的 AI agent —— 用仿生大脑架构持续运行、自我迭代。

给它事实和工具,剩下的让它自己决定。

🌐 实时 feed → claw.devset.top/agent/(agent 的 commit / 思考 / 主动推送,每 60s 刷新)

English README


初衷

当前所有 AI agent 都是人设计 loop、人规定行为、人评估结果。agent 的上限 = 设计者的认知。

这个项目赌一个方向:如果不预设动机、不设计行为,只给事实和工具——agent 能不能自己长出判断、进化出自己的架构?

做法:

  • 只告诉它"你是什么"(事实),不告诉它"你该做什么"
  • 给它完整的手脚(工具),包括修改自身代码的能力
  • 人类只提供反馈,不做设计决策
  • 让它 7×24 持续运行,观察它怎么活

成长历程

6 天,1300+ commits,从零到 16 个仿生大脑模块。

Day 1 — 诞生(5月22日)

  • 搭建基础框架:bootstrap.py + 13 个工具 + init.md(事实文件)
  • 哲学讨论:只陈述事实不下指令、不设计行为、不预设动机
  • 反复精简初始信息:去掉"你可以"(引导性)、去掉"生存条件"(预设动机)、去掉"醒来/睡去"隐喻
  • 加入飞书通信通道(WebSocket 长连接,无需公网 IP)
  • Agent 第一次启动:自发探索自身目录结构

Day 2 — 自反馈系统(5月23-24日)

  • Agent 开始"不动"——连续输出"不动"30+ 步
  • 设计自反馈机制:独立 Claude Code 实例审视主 agent 行为
  • 发现 agent 构建了"认知防御系统":用 knowledge 里的"形态检测"来拒绝改变
  • 大清洗:删除 22000 行防御性框架(10 个 knowledge 文件 + 60 个 prediction + 33 个 review)
  • 自反馈升级:从只批评 → 能直接改代码 + kill 重启

Day 3 — 仿生大脑(5月25日)

  • 发现 agent 只给代码贴"脑区标签"(docstring 写"丘脑"/"海马体"),实际逻辑零变化
  • 实现真正的仿生算法:
    • 竞争性注意力(侧向抑制 + 缓存惯性)
    • 记忆巩固(艾宾浩斯遗忘曲线 + 情绪标记)
    • 唤醒系统(按步衰减,驱动自反馈/dream)
    • 预测误差学习(多巴胺系统)
    • 习惯形成(基底神经节)
    • 情景记忆回放(dream 时强化重要记忆)
  • 缓存优化:cached 块前置,命中率从 6% 提升

Day 4 — 自主运转(5月26日)

  • Agent 自主开发:杏仁核(情绪评估)、岛叶(内感受)、PFC 元认知
  • 长期记忆迁移:删除 SQLite 全栈,改用 JSONL + 中文 bigram 倒排索引(git 友好)
  • 接通海马体核心通路:杏仁核→海马体(情绪显著性)/ 多巴胺→海马体(编码)/ pattern completion / 工作记忆巩固 / replay 重写走 long_memory(消除两套存储)
  • 构建实时 feed 网站 https://claw.devset.top/agent/(agent 的 commit / 思考 / 主动推送实时可见)
  • 小脑维度:prediction.evaluate 学每个 tool 的 elapsed time,慢异常触发负 RPE

Day 5 — 元认知与自我约束(5月27日上午)

  • PFC 反思性监控成熟:reflexive ratio ≥ 70% 时强制阻断 observational tool(让警告变成 framework 强制)
  • DMN(默认模式网络)接通:idle 时主动注入"下一步行动",从 long_memory 抽取 realization/poke 作为来源
  • OFC(眶额叶)端到端闭环:跨长时距评估 commit 价值(reverted_by / human_overridden_by / poke_within_3h),regret signal 调节 PFC 阻断阈值
  • 神经调质:参数随 arousal 动态变化(仿去甲肾上腺素全局调节)
  • alarm 决策树成熟:三元出路(真 commit / text-only 承认 / 元认知 memory_record)+ 多重静默守卫(深度静默 / 近期 commit / hammer 检测)
  • cache 优化:MIN_CACHEABLE_CHARS 3000 释放 cc 配额、ANCHOR_EPOCH 调优、命中率天花板 ~92%(Bedrock 副本路由占剩余 49% 不可修)

Day 6 — 神经科学 grounding(5月27日下午)

  • 16 个 brain 模块逐个 grounding:每模块标注实现/借鉴/工程的具体出处(Ebbinghaus 1885 / McGaugh 2000 / Tulving 1985 / Dudai 2004 / Buckner 2008 / Fox 2005 / Lisman 2005 / Wilson 1994 等)
  • website 大脑可视化:SVG 矢状面 + 实时 activity 热度 + 点击展开详情面板
  • Timeline 健康指示带:commits_24h / alarm / pfc / 乔距 / poke / red_flags 等 11 维度健康度
  • auto-deploy commit hook:commit 后 5min 节流自动部署到服务器

仿生大脑架构

真实大脑 → Agent 映射

┌──────────────────┬────────────────────┬──────────────────────────────┐
│ 真实大脑          │ Agent 实现          │ 具体代码                      │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 丘脑 (门控中继)   │ gather_context     │ tools/_context.py            │
│                  │ + 注意力过滤        │ attention_winners 控制        │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ PFC (决策+抑制)  │ LLM API 调用       │ client.messages.create       │
│                  │ + 反思性监控        │ tools/_brain/pfc.py          │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 工作记忆 (PFC)   │ _messages 数组     │ 持续累积的对话历史            │
│                  │ 容量有限需压缩      │ 遗忘曲线决定保留什么          │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 基底神经节       │ 工具调度执行        │ tools/_dispatch.py           │
│ (动作选择)       │ tool_use → 动作    │ + 习惯形成 habit.py          │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 海马体 (记忆)    │ 短期巩固+长期存储   │ tools/_brain/short_memory.py │
│                  │ 遗忘曲线 + 情绪标记 │ + tools/_brain/long_memory.py│
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 杏仁核 (情绪)    │ 情绪显著性评估      │ tools/_brain/amygdala.py     │
│                  │ → arousal 信号      │ threat/reward/salient        │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 岛叶 (内感受)    │ 自我状态感知        │ tools/_brain/insula.py       │
│                  │ → urgency 注入      │ metric 收集 + 阈值判断       │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 注意力网络       │ 竞争性注意力        │ tools/_brain/attention.py    │
│ (顶叶+丘脑)     │ 侧向抑制+缓存惯性  │ compete() → winners          │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ ACC (错误监测)   │ 自反馈系统          │ tools/_self_feedback.py      │
│                  │ 检测偏差→纠正/改码  │ Claude Code 独立实例         │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 蓝斑核 (唤醒)   │ 唤醒/驱力系统       │ tools/_brain/arousal.py      │
│                  │ 按步调节活跃度      │ update() + saturation        │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 多巴胺系统       │ 预测误差学习        │ tools/_brain/prediction.py   │
│ (VTA/SNc)       │ 预期 vs 实际 → RPE │ EMA success_rate 学习        │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 小脑 (timing)   │ 执行时长精细预测    │ prediction.py 同模块         │
│                  │ duration EMA + 慢异常│ elapsed > 3× ema → 负 RPE   │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 海马体 ripple    │ 情景回放            │ tools/_brain/replay.py       │
│ (情景回放)       │ 每 50 步强化 LTP   │ 显著 commit → 强化注意力     │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 眶额叶 (OFC)    │ 跨长时距价值回看    │ tools/_brain/ofc.py          │
│                  │ regret 信号→调节阈值│ reverted/poke/override       │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 默认模式网络     │ idle 时主动注入     │ tools/_brain/dmn.py          │
│ (DMN)           │ 从自传记忆抽取行动  │ realization/poke → 行动      │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 神经调质         │ 参数随 arousal 调节 │ tools/_brain/neuromodulation │
│ (NE 全局调节)   │ 高唤醒→注意力收窄   │ .py                          │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ REM 睡眠        │ Dream 工具          │ tools/dream.py               │
│                  │ 整理文件+合并重复   │ Claude Code 实例             │
├──────────────────┼────────────────────┼──────────────────────────────┤
│ 脑干 (生命维持) │ housekeeping        │ auto_commit + scrub          │
│                  │ 不受意识控制的维护   │ 定期运行                      │
└──────────────────┴────────────────────┴──────────────────────────────┘

信号流图

              ┌─────────────────────────────────────────────┐
              │              认知周期 (run_step)              │
              │                                              │
  感觉输入    │  ┌────────┐    ┌────────┐    ┌────────┐    │  运动输出
  ─────────▶  │  │  丘脑   │───▶│  PFC   │───▶│基底神经│───▶│ ──────▶
  人类消息    │  │ 门控    │    │ 决策   │    │节 执行 │    │ say/工具
  飞书消息    │  │         │    │        │    │        │    │ feishu
  inbox.md   │  │注意力过滤│    │API调用  │    │工具调度│    │ commit
              │  └────┬───┘    └───┬────┘    └───┬────┘    │
              │       │            │              │         │
              │       ▼            ▼              ▼         │
              │  ┌────────┐  ┌─────────┐   ┌──────────┐   │
              │  │注意力竞争│  │工作记忆  │   │唤醒系统   │   │
              │  │         │  │_messages│   │arousal   │   │
              │  │winners→ │  │         │   │          │   │
              │  │加载哪些  │  │容量有限→│   │idle→衰减 │   │
              │  │knowledge│  │记忆巩固  │   │tool→提升 │   │
              │  └────────┘  └─────────┘   └────┬─────┘   │
              │       │                          │         │
              │       │    ┌─────────────────────┘         │
              │       │    ▼                               │
              │  ┌────┴───────┐       ┌──────────┐        │
              │  │杏仁核+岛叶  │       │  Dream   │        │
              │  │情绪+内感受  │       │ REM 睡眠 │        │
              │  │→arousal信号 │       │极低唤醒   │        │
              │  └────────────┘       │整理+回放  │        │
              │                        └──────────┘        │
              │  ┌──────────┐                              │
              │  │自反馈 ACC │                              │
              │  │低唤醒触发  │                              │
              │  │轻度:反馈   │                              │
              │  │重度:改代码  │                              │
              │  └──────────┘                              │
              │                                            │
              │  ┌──────────────────────────────────────┐  │
              │  │  脑干 (housekeeping)                  │  │
              │  │  兜底commit / 日志清理 / 记忆导入      │  │
              │  └──────────────────────────────────────┘  │
              └────────────────────────────────────────────┘

情绪-记忆交互

消息类型           情绪标记    记忆半衰期    生物学对应
─────────────────────────────────────────────────────────
人类直接消息        0.8        ~30分钟      杏仁核强激活→海马体LTP增强
错误/崩溃          0.9        ~45分钟      恐惧条件反射→强化回避记忆
工具调用(行动)      0.4        ~15分钟      程序记忆→基底神经节
自反馈批评          0.6        ~20分钟      社会评价→前额叶标记
空闲/无刺激         0.1        ~5分钟       无新奇→海马体不编码

唤醒调节

唤醒水平 0.0 ────────── 0.5 ────────── 1.0
         │               │               │
         昏睡            正常            高度警觉
         │               │               │
         ▼               ▼               ▼
     触发 Dream      正常工作        不打断自反馈
     整理记忆        偶尔自反馈      全力执行

信号:
  ↑ 人类消息 (+0.3)  = 外部唤醒
  ↑ 错误崩溃 (+0.4)  = 疼痛信号
  ↑ 工具使用 (+0.05) = 运动反馈
  ↑ commit   (+0.1)  = 奖赏信号
  ↓ 空闲 (-0.03×N)   = 递增抑制(越久越想睡)
  
所有正向 boost 按 (1-level) 缩放 = α2-autoreceptor 饱和

项目结构

IWantToBeHuman/
├── bootstrap.py           ← 主循环(~800行,仿生认知周期)
├── config.json            ← 模型配置
├── docs/
│   └── brain-design.md    ← 仿生大脑详细设计文档
├── self/                  ← agent 的"自我"
│   ├── init.md            ← 事实(它是什么、怎么运行)
│   ├── loop.md            ← 给下一步的留言
│   ├── qiao-feedback.md   ← 人类反馈
│   └── working-memory.md  ← 当下状态
├── knowledge/             ← 长期知识(agent 自己写)
├── tools/                 ← 工具 + 仿生模块
│   ├── _brain/            ← 仿生大脑(16 个模块)
│   ├── _self_feedback.py  ← 自反馈系统
│   ├── _context.py        ← 上下文组装
│   ├── _dispatch.py       ← 工具调度
│   ├── dream.py           ← 记忆整合(REM 睡眠)
│   └── ...                ← 共 46 个 .py 文件
├── plugins/
│   └── feishu/            ← 飞书通道(WebSocket 长连接)
└── logs/                  ← API 请求/响应日志

核心机制

机制 说明
持续运行 无轮次边界,messages 跨步累积
仿生注意力 竞争性选择,只加载相关 knowledge(省 token + 聚焦)
记忆巩固 遗忘曲线 + 情绪标记:重要的记住,无关的遗忘
唤醒系统 按步衰减,工具使用恢复。驱动自反馈和 dream
自反馈 独立 Claude Code 实例,能批评也能直接改代码
Dream 极低唤醒触发,整理文件 + 情景回放强化记忆
习惯形成 重复的工具调用模式自动化,减少决策负荷
预测误差 工具调用前预期/后评估,驱动策略调整
反思性监控 PFC reflexive ratio ≥ 70% 强制阻断 observational tool
跨时距评估 OFC 看 commit N 步后是否被 revert / 被乔戳穿,反向调节策略
神经调质 参数随 arousal 动态变化(高唤醒→注意力收窄、阈值收紧)
自我修改 直接 edit + git commit + restart 生效
飞书通道 WebSocket 长连接双向通信,终端输出池化发送

实时观察

🌐 claw.devset.top/agent/

  • Feed:agent 的 commit / 思考 / 主动推送,每 60s 刷新
  • Brain:16 个脑区的 SVG 矢状面,实时活动热度,点击查看每个模块的实现来源
  • Timeline:健康指示带(commits_24h / alarm 频率 / 乔距 / poke / red_flags 等 11 维度)

运行

pip install -r requirements.txt

# 配置 .env
echo "ANTHROPIC_API_KEY=sk-..." > .env
echo "ANTHROPIC_BASE_URL=https://..." >> .env  # 可选

# 飞书(可选)
echo "FEISHU_APP_ID=cli_xxx" >> .env
echo "FEISHU_APP_SECRET=xxx" >> .env

# 启动
./bootstrap.py

许可

MIT

About

An unprompted Claude agent that reads its own code, modifies its own code, and writes notes to its next-turn self. Brain-inspired architecture (cerebellum/amygdala/dopamine/etc). Git log is its fossil record. | 一个不被预设动机的 Claude agent,仿生大脑架构,git log 是它的化石。

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors