AI Agent 操作系统:OpenFang 项目概览

AI Agent 操作系统:OpenFang 项目概览

March 2, 2026

image

近期个人助手类 Agent 层出不穷,除了 OpenClaw ,还有 NanoBot 等一众"大虾",阿里也刚推出了 Copaw。今天无意间看到 OpenFang 这个项目,于是用 AI 快速调研了一把。

1. 背景

1.1. 项目基本信息

  • 项目名称: OpenFang
  • 定位: 生产级 Agent 操作系统(Agent Operating System)
  • 开发公司: RightNow AI
  • 创始人: Jaber Jaber(RightNow AI 创始人)
  • 开源时间: 2026 年 2 月
  • GitHub 仓库: https://github.com/RightNow-AI/openfang
  • 官方网站: https://openfang.sh / https://openfang.cc
  • 当前版本: v0.2.7(截至 2026 年 3 月)
  • GitHub Stars: 8,600+
  • 许可证: MIT + Apache-2.0 双许可证

1.2. 项目规模

  • 代码规模: 137,728 行 Rust 代码
  • 模块化: 14 个 Crate(Rust 模块化组织单位)
  • 测试覆盖: 1,767+ 自动化测试用例
  • 代码质量: 零 Clippy 警告(Rust 社区高质量标准)
  • 二进制大小: ~32MB(单文件,零外部依赖)

1.3. 创始团队理念

创始人 Jaber 表示:

“我尝试过的每个 Agent 框架基本上都是聊天机器人的包装器。你输入内容,它回应,你再输入。这不是自主性,这是对话。我想要的 Agent 是能够按计划唤醒、完成工作并在无需我守候的情况下报告结果。”

这体现了 OpenFang 的核心设计理念:从被动响应到主动执行的范式转变

2. 核心概念:Hands

2.1. 核心创新

Hands 是 OpenFang 的核心创新——预构建的自主能力包,能够独立运行、按计划执行,无需用户持续提示。每个 Hand 包含:

组件 说明
HAND.toml 声明工具、设置、需求和 Dashboard 指标的清单文件
System Prompt 多阶段操作手册(500+ 词的专家级流程)
SKILL.md 运行时注入上下文的领域专业知识
Guardrails 敏感操作的审批门(如 Browser Hand 购买前需人工确认)

2.2. 七大内置 Hands

Hand 名称 功能描述 技术栈
Clip 视频处理:下载 YouTube 视频、识别精彩片段、剪辑竖屏短片、生成字幕和封面、发布到 Telegram/WhatsApp FFmpeg + yt-dlp + 5 个 STT 后端
Lead 线索挖掘:每日发现匹配 ICP 的潜在客户、丰富信息、评分(0-100)、去重、输出 CSV/JSON/Markdown 网络研究 + 数据库
Collector 情报监控:OSINT 级持续监控目标(公司/人物/话题)、变更检测、情感追踪、知识图谱构建、关键警报 多源数据聚合
Predictor 趋势预测:超级预测引擎、多源信号收集、校准推理链、带置信区间的预测、Brier 分数自追踪、逆向模式 统计建模
Researcher 深度研究:跨来源交叉验证、CRAAP 可信度评估、生成带 APA 格式的引用报告、多语言支持 学术标准研究
Twitter 社媒管理:自主 Twitter/X 账号管理、7 种轮换格式内容创建、最佳互动时间排期、提及回复、性能指标追踪 社交媒体 API
Browser 网页自动化:网站导航、表单填写、按钮点击、多步骤工作流、Playwright 桥接、会话持久化、强制购买审批门 Playwright

2.3. 技术特性

2.3.1. 运行时性能

  • 冷启动时间: < 200ms(对比 OpenClaw 的 ~6s)
  • 空闲内存占用: ~40MB(对比 OpenClaw 的 394MB)
  • 安装包大小: ~32MB(单二进制文件)
  • 最低内存要求: ≥ 64MB(推荐 256MB)

2.3.2. 平台支持

  • 操作系统: Linux / macOS / Windows / 树莓派 / VPS
  • 架构: x86_64 或 ARM64

2.3.3. 渠道适配器(40 个)

支持目前所有 Agent 框架中最广泛的通讯渠道:

类别 平台
核心 Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Email
企业 Microsoft Teams, Mattermost, Google Chat, Webex, 飞书/Lark, 钉钉, Zulip
社交 LINE, Viber, Facebook Messenger, Mastodon, Bluesky, Reddit, LinkedIn, Twitch
社区 IRC, XMPP, Guilded, Revolt, Keybase, Discourse, Gitter
隐私 Threema, Nostr, Mumble, Nextcloud Talk, Rocket.Chat, Ntfy, Gotify

2.3.4. LLM 提供商支持(27 个,123+ 模型)

  • 原生驱动: Anthropic, Google Gemini, OpenAI-compatible API
  • 支持列表: Anthropic, Gemini, OpenAI, Groq, DeepSeek, OpenRouter, Together, Mistral, Fireworks, Cohere, Perplexity, xAI, AI21, Cerebras, SambaNova, HuggingFace, Replicate, Ollama, vLLM, LM Studio, Qwen, MiniMax, Zhipu, Moonshot, Qianfan, Bedrock 等

2.3.5. 安全系统(16 层纵深防御)

层级 安全系统 功能说明
1 WASM 双计量沙箱 工具代码在 WebAssembly 中运行,燃料计量 + 周期中断,看门狗线程终止失控代码
2 Merkle 哈希链审计追踪 每个操作加密链接到前一个,篡改一条记录会破坏整个链条
3 信息流污点追踪 标签通过执行传播,从源头到汇聚点追踪密钥
4 Ed25519 签名代理清单 每个代理身份和能力集都经过加密签名
5 SSRF 防护 阻止私有 IP、云元数据端点和 DNS 重绑定攻击
6 密钥零化 Zeroizing 在不再需要时立即从内存中擦除 API 密钥
7 OFP 双向认证 HMAC-SHA256 基于 nonce 的恒定时间验证,用于 P2P 网络
8 能力门 基于角色的访问控制——代理声明所需工具,内核强制执行
9 安全头 CSP, X-Frame-Options, HSTS, X-Content-Type-Options
10 健康端点脱敏 公共健康检查返回最少信息,完整诊断需要认证
11 子进程沙箱 env_clear() + 选择性变量传递,进程树隔离,跨平台终止
12 提示注入扫描器 检测覆盖尝试、数据渗出模式和 shell 引用注入
13 循环守卫 基于 SHA256 的工具调用循环检测,带断路器,处理乒乓模式
14 会话修复 7 阶段消息历史验证,自动从损坏中恢复
15 路径遍历防护 规范化 + 符号链接逃逸防护,../ 无效
16 GCRA 速率限制器 成本感知令牌桶速率限制,每 IP 追踪,过期清理

3. 技术架构

3.1. 为什么选择 Rust?

优势 说明
内存安全 编译时保证,无运行时空指针或数据竞争
并发性能 无 GIL 限制,真正的并行执行
运行效率 接近 C/C++ 的性能,适合长期运行的后台服务
类型安全 静态类型系统在大型系统中减少运行时错误
生态成熟 丰富的异步运行时(Tokio)和 Web 框架

对比 Python 框架(AutoGen, CrewAI, LangGraph)的解释执行开销和 GIL 并发限制,Rust 在 24/7 不间断运行的 Agent 系统中具有显著优势。

3.2. 核心 Crate 说明

Crate 功能 依赖
openfang-kernel 编排、工作流、计量、RBAC、调度器、预算追踪 types, memory, runtime, skills, hands, extensions, wire, channels
openfang-runtime Agent 循环、3 个 LLM 驱动、53 个工具、WASM 沙箱、MCP、A2A types, memory
openfang-api 140+ REST/WS/SSE 端点、OpenAI 兼容 API、Dashboard kernel, runtime
openfang-channels 40 个消息适配器、速率限制、DM/组策略 types, runtime
openfang-memory SQLite 持久化、向量嵌入、规范会话、压缩 types
openfang-types 核心类型、污点追踪、Ed25519 清单签名、模型目录 -
openfang-skills 60 个捆绑技能、SKILL.md 解析器、FangHub 市场 types
openfang-hands 7 个自主 Hands、HAND.toml 解析器、生命周期管理 runtime, skills
openfang-extensions 25 个 MCP 模板、AES-256-GCM 凭证库、OAuth2 PKCE types
openfang-wire OFP P2P 协议、HMAC-SHA256 双向认证 types
openfang-cli CLI、守护进程管理、TUI Dashboard、MCP 服务器模式 kernel, api
openfang-desktop Tauri 2.0 原生应用(系统托盘、通知、全局快捷键) api
openfang-migrate OpenClaw、LangChain、AutoGPT 迁移引擎 kernel

3.3. 系统架构

┌─────────────────────────────────────────────────────────────┐
│                     OpenFang Agent OS                        │
├─────────────────────────────────────────────────────────────┤
│  用户界面层: Desktop(Tauri) / CLI / Web Dashboard           │
├─────────────────────────────────────────────────────────────┤
│  API 层: 140+ REST/WS/SSE 端点, OpenAI 兼容 API             │
├─────────────────────────────────────────────────────────────┤
│  内核层: Workflow Engine / Scheduler / Metering / RBAC      │
├─────────────────────────────────────────────────────────────┤
│  运行时层: Agent Loop / LLM Drivers / Tools / WASM Sandbox  │
│            MCP Client/Server / A2A Protocol                 │
├─────────────────────────────────────────────────────────────┤
│  能力层: 7 Hands (Clip/Lead/Collector/Predictor/            │
│          Researcher/Twitter/Browser)                        │
├─────────────────────────────────────────────────────────────┤
│  记忆层: SQLite / Vector Embedding / Canonical Sessions     │
├─────────────────────────────────────────────────────────────┤
│  渠道层: 40 Channel Adapters (Telegram/Discord/飞书/钉钉...) │
├─────────────────────────────────────────────────────────────┤
│  网络层: OFP P2P Protocol / HMAC-SHA256 双向认证            │
└─────────────────────────────────────────────────────────────┘

关键设计模式:

模块化内核设计

  • 14 个独立 Crate,通过 Cargo workspace 管理
  • 清晰的依赖关系,避免循环依赖
  • 每个 Crate 可独立测试和发布

异步优先

  • 基于 Tokio 的异步运行时
  • 所有 I/O 操作非阻塞
  • 支持高并发 Agent 执行

安全内建

  • 16 层安全系统独立运行
  • 无单点故障
  • 每个组件可独立测试

配置驱动

  • TOML 配置文件(openfang.toml)
  • Hands 通过 HAND.toml 声明
  • 环境变量覆盖支持

4. 与 OpenClaw 的详细对比

4.1. 核心差异概览

特性 OpenFang OpenClaw
开发语言 Rust TypeScript
核心定位 Agent 操作系统(内核级) 个人 AI 助手(Gateway 为中心)
内存占用 ~40MB ~394MB
冷启动时间 < 200ms ~6s
安装包大小 ~32MB ~500MB
安全层数 16 层 3 层基础
自主调度 7 个内置 Hands
渠道适配器 40 个 13 个
LLM 提供商 27 个 ~10 个
Agent 沙箱 WASM 双计量
审计追踪 Merkle 哈希链 日志
桌面应用 Tauri 2.0
存储方式 SQLite + 向量嵌入 文件系统
适用场景 生产级 7×24 自主运行 个人使用和探索实验

4.2. 架构哲学对比

OpenClaw

  • 设计目标: 个人 AI 助手,强调多渠道兼容和隐私可控
  • 交互模式: 用户触发 → Agent 响应(被动式)
  • 扩展方式: 通过 Skills 和插件扩展功能
  • 部署方式: 单 Gateway 架构,支持自托管

OpenFang

  • 设计目标: Agent 操作系统,强调生产级可靠性和自主运行
  • 交互模式: 按计划自主唤醒 → 执行任务 → 报告结果(主动式)
  • 扩展方式: 通过 Hands 预构建能力包,激活即用
  • 部署方式: 单二进制文件,内核级调度

4.3. 性能对比

指标 OpenFang OpenClaw ZeroClaw LangGraph CrewAI
冷启动 180ms ★ 5.98s 10ms 2.5s 3.0s
空闲内存 40MB ★ 394MB 5MB 180MB 200MB
安装大小 32MB ★ 500MB 8.8MB 150MB 100MB
安全层数 16 ★ 3 6 2 1
渠道适配器 40 ★ 13 15 0 0

4.4. 迁移支持

OpenFang 提供一键迁移命令:

# 迁移所有内容:代理、记忆、技能、配置
openfang migrate --from openclaw

# 从特定路径迁移
openfang migrate --from openclaw --path ~/.openclaw

# 先试运行查看变更
openfang migrate --from openclaw --dry-run

5. 总结

OpenFang 的愿景是好的。我一直认为,个人助手类智能体就是下一代操作系统。OpenFang 给自己的定位也是 The Agent Operating System。从被动响应到主动执行,这个转变符合人们对"真正智能助手"的期待。

Hands 的设计算是在 Skills 上又包了一层。官方提供了 7 个内置 Hand,看起来覆盖了视频处理、线索挖掘、情报监控等常见场景。但实际效果还得跑起来才知道——能不能稳定跑 7×24,遇到异常情况怎么处理,这些文档里不会写得太细。

Rust 的执行效率确实高,40MB 内存对比 OpenClaw 的 394MB,差距摆在那儿。但生态这块不如 Python 也是事实。出了问题能不能快速找到解决方案,第三方库够不够丰富,这些都会影响长期使用的体验。

说到底,打铁还需自身硬。OpenFang 目前才 v0.2.7,在一众"龙虾"的包围中生存下来,获得用户认可,最终还是要靠产品实力。


参考链接:

  • GitHub:https://github.com/RightNow-AI/openfang
  • 官网:https://openfang.sh
  • 中文官网:https://openfang.cc
最后更新于