Skip to content

智能涌现

Rnix 不仅是一个智能体运行时——它是一个为智能涌现而设计的系统。各个独立机制(干细胞分化、声誉、协同、免疫监控、协作拓扑)相互作用,产生任何单一机制都无法独立实现的行为。

本文档阐述涌现架构:简单的局部反馈闭环如何组合产生系统级智能。


涌现堆栈

┌─────────────────────────────────────────────────┐
│          涌现行为                               │
│  自然选择 · 记忆加速                            │
│  神经可塑性 · 自我监控                          │
├─────────────────────────────────────────────────┤
│          反馈闭环                               │
│  声誉 → 干细胞匹配重排序                        │
│  协同 → 技能组合优先级                           │
│  免疫 → 威胁记忆积累                             │
│  拓扑 → 协作模式遥测                             │
├─────────────────────────────────────────────────┤
│          核心机制                               │
│  干细胞分化  │ 声誉系统  │ 协同矩阵             │
│  分化记忆    │ 免疫守护  │ 协作拓扑             │
│  谱系追踪    │ 进程      │                      │
├─────────────────────────────────────────────────┤
│          基础设施                               │
│  进程模型 · VFS · 统一推理循环                  │
└─────────────────────────────────────────────────┘

每一层都建立在下面一层之上。基础设施提供进程运行时;核心机制添加特定能力;反馈闭环将各机制连接成循环;涌现行为从这些循环的长期运行中产生。


特性档案与消融

特性档案直接映射到涌现堆栈的各层,支持受控的消融实验。每个档案激活到特定层的能力:

┌─────────────────────────────────────────────────┐
│          涌现行为                               │  ← 仅 full(免疫)
├─────────────────────────────────────────────────┤
│          反馈闭环                               │  ← adaptive(stem_matcher、diff_memory、
│          声誉 → 干细胞匹配重排序                 │     specialize、replan、discover_skill)
│          协同 → 技能组合优先级                    │
├─────────────────────────────────────────────────┤
│          核心机制                               │  ← core(planning、spawn、compaction)
├─────────────────────────────────────────────────┤
│          基础设施                               │  ← baseline(仅 VFS + LLM)
│          进程模型 · VFS · 统一推理循环           │
└─────────────────────────────────────────────────┘
档案激活的堆栈层衡量内容
baseline仅基础设施下界——裸 LLM + VFS 设备性能
core基础设施 + 核心机制规划、子进程派生和上下文压缩的贡献
adaptive基础设施 + 核心 + 反馈闭环运行时学习、技能获取和路径重规划的贡献
full所有层包含免疫监控的完整系统(默认)

消融评估矩阵

一次跨全部四个档案的评估即可量化每层的增量价值:

Task × Profile × Model → Score

示例:
  "Analyze kernel/kernel.go" × baseline × deepseek → 42
  "Analyze kernel/kernel.go" × core     × deepseek → 67  (+25 来自规划/子进程)
  "Analyze kernel/kernel.go" × adaptive × deepseek → 81  (+14 来自反馈闭环)
  "Analyze kernel/kernel.go" × full     × deepseek → 83  (+2 来自免疫)

相邻档案之间的差值揭示了每个涌现层的边际贡献。使用 custom 模式进行更精细的实验——例如,仅启用 diff_memory 以将记忆加速从其他自适应机制中隔离出来。

配置详情和预设矩阵参见特性档案


五大涌现效应

1. 自然选择

产生更好结果的技能组合逐渐成为未来任务的首选。

机制链:

  • 智能体完成任务 → RecordResult 更新声誉 → RecordCombo 更新协同矩阵
  • 新意图到达 → StemMatcher 提出候选技能 → 声誉 + 协同重新排序候选者
  • 高表现组合上升;低表现组合退后

防止锁定: ε-探索参数确保新颖的、未经测试的技能组合仍有机会被尝试,防止过早收敛。

2. 记忆加速

重复出现的意图通过分化记忆获得更快的服务。

机制链:

  • 首次遇到:完整的 StemMatcher 关键词扫描 → 匹配 → 在 DiffMemory 中记录意图→技能映射
  • 再次遇到:DiffMemory 查找 → 即时召回,跳过匹配计算
  • DiffMemory 以追加写入的 JSON Lines 文件持久化,可跨 daemon 重启保留

持久化细节:

  • 每个学习到的映射在记录时(写锁内)立即追加到 diffmemory.jsonl
  • daemon 启动时,文件被重放到内存映射中(重复意图以最后写入为准)
  • 损坏的行被跳过并输出警告——启动永远不会因部分损坏而失败
  • 命中次数跨重启持久化,保留长期积累的声誉信号

过时验证: 查找时,当前可用技能数与存储的 available_count 进行比较。如果不一致(技能被添加或删除),缓存的映射被视为未命中,强制执行全新的 StemMatcher 扫描以生成最新映射。

容量管理: LRU 驱逐策略(按最低命中次数,再按最旧时间戳)在保持内存边界的同时保留最有价值的映射。

3. 神经可塑性

当智能体失败时,系统可以通过替代路径重新路由任务。

机制链:

  • Supervisor 检测到持续性失败 → 重启次数耗尽
  • 相似度矩阵识别替代智能体(基于技能集的 Jaccard 相似度)
  • 迁移受门控约束:只有当替代者表现出可测量的改善时才触发
  • 如果迁移成功,替代路径在协作拓扑中被强化

4. 被动免疫学习

免疫系统在不干扰正常运行的情况下积累行为知识。

机制链:

  • 免疫守护进程(默认启用,观测模式)观察每个进程
  • 行为样本积累 → 为每个 Agent 模板构建正常行为画像
  • 检测到异常 → 记录 AnomalyAlert + 持久化 ThreatSignature
  • 相同模式再次出现 → 即时识别(抗体记忆)
  • 学习期安全:少于 5 个样本 → 不检测(避免首次运行的误报)

5. 协作发现

系统自动发现哪些智能体组合协作效果好。

机制链:

  • 生产级 syscall 填充拓扑:spawn 记录父→子边,IPC msg 记录对等通信边
  • 类型化协作记录积累:spawn、pipe、message——各自独立追踪
  • 高频路径在 rnix topology 输出中可见
  • 运维洞察:识别瓶颈、冗余路径或利用不足的智能体

完整反馈图


观测性 vs. 决策

一个重要的设计原则:并非所有观测者都参与决策

组件观测决策
谱系追踪记录分化路径否——纯遥测
协作拓扑记录协作边否——可观测性工具
分化记忆记录意图→技能是——加速未来匹配
声誉系统记录执行结果是——影响技能排名
协同矩阵记录组合结果是——提升经验证的组合
免疫守护进程记录行为模式取决于模式(观测 vs 执行)

这种分离保持了系统的可预测性:观测性组件永远不会导致意外的行为变化,而决策组件具有明确的、可测试的反馈路径。


相关文档

Released under the MIT License.