GitHub 项目测评:Windows-MCP - 让 AI Agent 操控 Windows 系统
- 获取链接
- X
- 电子邮件
- 其他应用
| 🪟 GitHub 项目测评Windows-MCP 让 AI Agent 像人类一样操控 Windows 系统 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
📌 项目简介Windows-MCP 是一个轻量级、开源的 MCP(Model Context Protocol)服务器,由 CursorTouch 组织开发维护。它充当 AI 大语言模型与 Windows 操作系统之间的桥梁,让 Claude、GPT-4、Gemini 等 AI Agent 能够直接操控你的 Windows 电脑——打开应用程序、点击按钮、输入文字、执行 PowerShell 命令、读取屏幕内容,甚至进行复杂的 UI 自动化测试。 项目于 2025 年 5 月首次发布,短短十个月内便收获了超过 4,600 颗 Stars,并在 Claude Desktop Extensions 目录中达到了 200万+ 用户。目前已被收录进官方 MCP Registry,并可通过 PyPI 直接安装。 与传统的 RPA(机器人流程自动化)工具不同,Windows-MCP 不依赖计算机视觉或特定模型。它利用 Windows 的原生辅助功能 API(Accessibility API),通过 UI Automation 与系统交互,这意味着任何 LLM 都可以使用它,无需专门的视觉模型支持。 🎯 核心功能详解🛠️ MCP 工具集Windows-MCP 提供了一套完整的工具集,让 AI Agent 能够像人类一样操作 Windows:
🌐 DOM 模式(浏览器自动化) Snapshot 工具支持特殊的 ⚡ 性能特点实时交互延迟:典型操作间延迟为 0.2 至 0.9 秒,具体取决于活动应用程序数量、系统负载和 LLM 推理速度。这个性能对于大多数自动化任务来说已经足够流畅。 v0.6.0 版本改进:通过异步批处理分析数据,工具执行延迟降低了约 6 倍,服务器启动时间也大幅缩短。 🔧 安装方法前置要求
📋 方式一:Claude Desktop 安装(推荐)最常用的安装方式,仅需修改配置文件: 步骤 1:安装 Claude Desktop 和 MCPB CLI: npm install -g @anthropic-ai/mcpb 步骤 2:编辑 Claude Desktop 配置文件(位置: { "mcpServers": { "windows-mcp": { "command": "uvx", "args": ["windows-mcp"] } } } 步骤 3:重启 Claude Desktop,开始使用! ⚠️ MSIX 版本用户注意事项如果你从 Microsoft Store 安装 Claude Desktop(MSIX 版本),配置文件路径不同,且需要使用 uv.exe 的完整路径: { "mcpServers": { "windows-mcp": { "command": "C:\\Users\\<user>\\.local\\bin\\uv.exe", "args": [ "--directory", "C:\\Users\\<user>\\AppData\\Local\\Packages\\Claude_...", "run", "windows-mcp" ] } } } 🖥️ 方式二:其他 MCP 客户端Windows-MCP 支持多种 MCP 客户端,配置方式类似:
🖥️ 运行模式📍 本地模式(默认)本地模式下,Windows-MCP 直接在你的 Windows 机器上运行,MCP 客户端直接连接。这是最常用的个人使用方式。 # 标准 stdio 模式(默认) ☁️ 远程模式(VM 支持)通过 windowsmcp.io 云服务,Windows-MCP 支持连接到云端 Windows 虚拟机。适合 MCP 客户端在远程机器上运行,而需要在 Windows 环境执行操作的场景。 配置示例: { "mcpServers": { "windows-mcp": { "command": "uvx", "args": ["windows-mcp"], "env": { "MODE": "remote", "SANDBOX_ID": "your-sandbox-id", "API_KEY": "your-api-key" } } } } 🔌 传输协议对比
💡 使用案例案例一:自动化办公任务场景:每天需要从 Excel 表格中提取数据,填入 Web 表单,并发送邮件报告。 AI 指令示例:"打开 Excel 文件 data.xlsx,读取 B 列的数据,然后在浏览器中打开 https://forms.example.com,将数据依次填入表单,最后打开 Outlook 发送完成通知邮件。" Windows-MCP 会自动执行:App 打开 Excel → Snapshot 获取界面状态 → Shell 读取数据 → App 打开浏览器 → Scrape 获取表单元素 → Type 填写数据 → App 打开 Outlook → Type 编写邮件 → Shortcut 发送。 案例二:UI 自动化测试场景:测试 Windows 桌面应用程序的用户界面流程。 AI 指令示例:"启动 MyApp.exe,点击'新建项目'按钮,在对话框中输入项目名称'Test-001',选择'高级设置',确认创建,然后截图验证结果。" 传统的 UI 自动化测试需要编写复杂脚本,而 Windows-MCP 让 AI 通过自然语言描述就能完成整个测试流程,包括边界情况的探索。 案例三:跨应用数据同步场景:将邮件客户端中的附件保存到特定文件夹,并在 Notion 中创建对应记录。 AI 指令示例:"检查 Outlook 收件箱中今天的未读邮件,将所有 PDF 附件保存到 D:\Documents\Invoices\,然后打开浏览器登录 Notion,创建新页面记录这些发票信息。" 案例四:Windows-Use:基于 Windows-MCP 的 Agent项目团队还发布了 Windows-Use(PyPI),一个基于 Windows-MCP 构建的完整 AI Agent。用户可以直接安装使用,无需自己配置 MCP 服务器,开箱即用。 pip install windows-use ⚠️ 安全注意事项🚨 重要警告:Windows-MCP 拥有完整的系统访问权限! Windows-MCP 不是沙箱环境。它直接在你的真实 Windows 系统上执行操作,这意味着:
🛡️ 推荐的安全部署方式
📊 遥测数据收集Windows-MCP 默认收集匿名使用数据以改进项目。不收集:工具参数、工具输出、个人身份信息。收集:工具执行状态、执行时长、工具名称、客户端名称/版本、匿名会话 ID。 如需禁用遥测,在配置中添加环境变量: "env": { "ANONYMIZED_TELEMETRY": "false" } ⚖️ 优缺点分析✅ 优点
❌ 缺点与限制
🎯 适用场景
📦 版本更新v0.6.9(最新版本,2026-03-13)
v0.6.0(性能里程碑)
📊 项目信息
📝 总结Windows-MCP 是 MCP 生态中一颗耀眼的明星。它解决了 AI Agent 与操作系统交互的核心难题,让 Claude、GPT-4 等大模型能够"看见"并"操控"Windows 桌面环境。与传统的自动化脚本或 RPA 工具相比,Windows-MCP 的优势在于:自然语言驱动、模型无关、工具丰富、社区活跃。 对于希望在 Windows 环境实现智能自动化的开发者来说,这是一个值得投入时间学习和使用的项目。但务必记住:始终在安全的虚拟机或沙箱环境中测试,不要在生产机器上冒险。 随着更多 MCP 客户端的出现和 AI 能力的增强,Windows-MCP 的应用场景只会越来越广。如果你是 Windows 用户且对 AI 自动化感兴趣,现在就是加入的最佳时机! | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 🔗 项目链接: GitHub 仓库 | PyPI 包 | 官方网站 测评时间:2026年3月14日 | 版本:v0.6.9 | 许可证:MIT |
- 获取链接
- X
- 电子邮件
- 其他应用
评论
发表评论