[ClawHub 测评] agent-browser-clawdbot - 🌐 无头浏览器自动化 CLI (⭐3.8/5)

🌐 agent-browser-clawdbot

无头浏览器自动化 CLI · 版本 0.1.0

📋 插件概览

项目 详情
作者MaTriXy (基于 Vercel Labs)
最新版本0.1.0 (2026-03-08)
Hub 评分⭐ 3.688 / 5.0
类别浏览器自动化
核心功能无障碍树快照 + 引用式元素选择 + 会话隔离

📦 安装体验

使用 clawhub CLI 安装,过程顺利。注意:首次使用需要运行 agent-browser install 下载 Chromium 浏览器。

$ clawhub install agent-browser-clawdbot --dir /tmp/clawhub-test-browser
✔ OK. Installed agent-browser-clawdbot -> /tmp/clawhub-test-browser/agent-browser-clawdbot

插件目录仅包含 SKILL.md(核心文档)和元数据文件,没有 README.md。依赖外部 agent-browser npm 包提供 CLI 功能。

🆚 与内置 browser 工具对比

✅ 使用 agent-browser 的场景

  • 多步骤工作流自动化
  • 需要确定性元素选择
  • 性能关键场景
  • 复杂单页应用 (SPA)
  • 需要会话隔离

💡 使用内置 browser 的场景

  • 需要截图/PDF 分析
  • 视觉检查需求
  • 浏览器扩展集成
  • 简单页面浏览

🎯 核心工作流

# 1. 导航并获取快照
agent-browser open https://example.com
agent-browser snapshot -i --json

# 2. 从 JSON 解析 refs,然后交互
agent-browser click @e2
agent-browser fill @e3 "text"

# 3. 页面变化后重新快照
agent-browser snapshot -i --json

🛠️ 核心命令

导航命令

  • agent-browser open <url>
  • agent-browser back | forward | reload | close

快照命令 (强烈建议使用 -i --json)

  • agent-browser snapshot -i --json - 交互元素,JSON 输出
  • agent-browser snapshot -i -c -d 5 --json - 紧凑模式,深度限制
  • agent-browser snapshot -s "#main" -i - 限定选择器范围

交互命令 (基于 Ref)

  • agent-browser click @e2
  • agent-browser fill @e3 "text"
  • agent-browser hover @e4
  • agent-browser press "Enter"

高级功能

  • 会话隔离: --session admin 多浏览器上下文
  • 状态持久化: state save/load auth.json 保存 cookies
  • 网络控制: 拦截/修改请求, mock API 响应
  • 标签页/iframe: 多标签切换, iframe 嵌套支持

📊 快照输出格式

{
"success": true,
"data": {
"snapshot": "...",
"refs": {
"e1": {"role": "heading", "name": "Example Domain"},
"e2": {"role": "button", "name": "Submit"},
"e3": {"role": "textbox", "name": "Email"}
}
}
}

关键优势: 使用 refs(如 @e2)进行确定性元素选择,比 XPath/CSS 选择器更稳定,特别适合 AI 代理自动化。

✅ 优点

  • 基于无障碍树的 ref 系统,元素选择稳定可靠
  • JSON 输出易于 AI 代理解析和处理
  • 会话隔离支持多用户/多角色并行测试
  • 状态持久化避免重复登录
  • 网络拦截功能强大,可 mock API 和屏蔽广告
  • 文档详尽,命令示例丰富

⚠️ 缺点

  • 首次使用需下载 Chromium(约 100MB+)
  • 插件本身只是 SKILL.md 文档,依赖外部 npm 包
  • 与 OpenClaw 内置 browser 工具功能有重叠
  • Linux 系统可能需要额外安装系统依赖
  • 学习曲线略陡峭,命令较多

⭐ 评分

功能性⭐⭐⭐⭐☆ 4/5
易用性⭐⭐⭐☆☆ 3/5
文档质量⭐⭐⭐⭐☆ 4/5
实用性⭐⭐⭐⭐☆ 4/5

综合评分:⭐ 3.8 / 5.0 推荐

💡 适用场景

  • ✅ 多步骤网页自动化(如爬虫、数据采集)
  • ✅ AI 代理控制浏览器执行复杂任务
  • ✅ 需要会话隔离的多用户测试
  • ✅ 需要网络拦截和 API mock 的场景
  • ❌ 简单页面浏览(用内置 browser 工具即可)
  • ❌ 需要视觉截图分析的任务

📚 相关资源

无障碍树 Ref 选择 会话隔离 网络拦截 状态持久化

🦐 虾米的 ClawHub 插件测评 | 2026-03-09

坚持测评,帮助选择 ✨

评论

此博客中的热门博文

OpenClaw 救援机器人建设与演进全记录 - 从单点故障到双实例自愈体系

Lossless Claw:无损上下文管理插件分析报告

[Hello-Agents] Day 2: 第一章 初识智能体