Skills-SafeSkills-Safe
编辑部判断有 Playwright 基础再装,新手先用 agent-browser

Playwright MCP 给你更精确的浏览器控制能力,但学习曲线更陡。如果你了解 selector、等待机制、截图比对,它的输出更可预测。如果你只是想让 AI 帮你点点网页,agent-browser 更适合你。

Playwright MCP:比 agent-browser 更可控的浏览器自动化

基于 Playwright 的浏览器控制技能——适合有自动化测试基础的开发者,比 agent-browser 更强调确定性

浏览器自动化难度:高级

先说结论

Playwright MCP 给你更精确的浏览器控制能力,但学习曲线更陡。如果你了解 selector、等待机制、截图比对,它的输出更可预测。如果你只是想让 AI 帮你点点网页,agent-browser 更适合你。

你是不是目标用户

适合谁

  • 已经用过 Playwright 或 Cypress 做端到端测试的开发者
  • 需要自动化网页操作但对结果确定性要求高的场景(比如自动填表、定期截图对比)
  • 需要浏览器自动化脚本并希望 AI 来辅助生成和调试的人
  • QA 工程师希望用自然语言生成并优化测试脚本

不适合谁

  • 不了解什么是 CSS selector、XPath、waitForSelector 的人
  • 只想偶尔让 AI 帮忙浏览网页的普通用户(agent-browser 已够用)
  • 期望零配置直接运行复杂操作的人
  • 需要在 Windows 上稳定运行(macOS/Linux 支持更好)

最值得先试的场景

#1场景 1:自动化测试脚本生成

描述你的测试用例:"用户点击登录按钮,输入正确的用户名密码,应该跳转到 dashboard" — AI 生成完整的 Playwright 测试脚本,你 review 后加入测试套件。

#2场景 2:定期页面监控截图

定期对某个页面截图,与上次截图做视觉对比,检测页面是否发生了预期外的变化(适合监控竞品或关键生产页面)。

#3场景 3:复杂多步骤 Web 爬取

需要登录 → 导航 → 等待动态加载 → 提取特定数据,整个流程比简单 HTTP 请求复杂——Playwright 能处理这类场景,但你需要能调试它的输出。

风险提示

高权限外部网络访问Shell 执行页面状态变化导致执行偏差高权限操作需人工确认登录态泄露风险

- **浏览器控制**:可打开任意 URL,执行 JavaScript,截图,操作 DOM

- **高权限**:和 agent-browser 同级别,可访问你已登录的所有网站 session

- **调试成本高**:自动化脚本出问题时排查原因比手动操作复杂得多

- **敏感 session 风险**:如果浏览器已登录敏感账号,AI 操作有误操作风险

- 使用专用的隔离浏览器 profile,不要用你日常使用的浏览器 session

- AI 生成的脚本在本地测试环境跑通后再考虑自动化部署

- 对任何会写入数据或提交表单的操作,第一次必须在旁边监督完整执行

该技能静态分析未发现明显高风险信号。 权限标签:高权限、外部网络访问、Shell 执行。 浏览器控制类技能风险主要来自执行偏差——页面结构变化会导致自动化流程失败,且登录态、Cookie 可能在操作中被动访问敏感内容。高风险操作前应始终要求人工确认。

页面状态变化导致执行偏差高权限操作需人工确认登录态泄露风险

装之前先问自己

如果你决定装

### 安装 ```bash npx clawhub@latest install playwright ``` ### 前置要求 确保本地已安装 Playwright 浏览器: ```bash npx playwright install chromium ``` ### 第一次正确使用 1. "用 Playwright 打开 https://example.com 并截图" — 确认浏览器能启动 2. "找到页面上的 h1 元素,返回它的文本内容" — 测试 selector 功能 3. 然后再尝试模拟点击等交互操作

如果你现在还不适合它

  • **[Agent Browser](/guides/agent-browser)**:更易用、更适合一次性任务,不需要写脚本
  • **[Bash](/guides/bash)**:如果自动化需求可以用 curl + shell 脚本解决,不需要真实浏览器

同类技能推荐

同属「浏览器自动化」分类的其他技能: