Maamcp
基于MaaFramework的MCP服务器,为AI助手提供Android设备和Windows桌面自动化能力,支持OCR识别、点击、滑动、文本输入等操作,并能将操作流程转换为可复用的Pipeline。
评分 : 3.5分
下载量 : 4.7K
什么是MaaMCP?
MaaMCP是一个连接AI助手与自动化框架的桥梁。它让AI助手(如Claude、Cursor等)能够通过标准化的接口控制Android手机/模拟器和Windows电脑,执行点击、滑动、输入文字、识别屏幕内容等操作,实现真正的自动化任务执行。如何使用MaaMCP?
您只需要在支持MCP协议的AI客户端(如Cursor、Cherry Studio等)中配置MaaMCP服务器,然后就可以用自然语言告诉AI助手您想要执行的操作,比如“帮我打开美团点一份外卖”或“调整电脑屏幕亮度到50%”。AI会自动调用MaaMCP工具完成这些任务。适用场景
MaaMCP特别适合需要重复操作的场景,如:手机App测试、数据录入、批量文件处理、跨设备工作流自动化、为视力障碍者提供操作辅助、教学演示等。主要功能
多设备控制
同时连接并控制多个Android设备(通过ADB)和Windows应用程序窗口,实现跨设备协同工作。
智能屏幕识别 (OCR)
自动识别屏幕上的文字内容,让AI能够“看懂”界面,从而做出正确的操作决策。这是最核心、最高效的交互方式。
精准操作
支持点击、双击、滑动、文本输入、按键(包括组合键)、鼠标滚轮等丰富的操作类型,满足各种交互需求。
后台自动化 (Windows)
在Windows上进行截图和控制时,默认在后台运行,不占用您的鼠标和键盘,您可以同时使用电脑做其他事情。
流程录制与复用 (Pipeline)
AI可以将成功执行的一系列操作智能地转化为可重复运行的自动化脚本(Pipeline JSON),实现“一次操作,无限复用”。
优势
🤖 自然语言驱动:用说话的方式告诉AI要做什么,无需学习复杂的编程或脚本。
🔗 标准化集成:基于Model Context Protocol (MCP),可以轻松集成到各种支持MCP的AI客户端中。
👁️ 智能决策:AI结合OCR识别结果,能像人一样理解界面并做出操作判断。
💾 可复用流程:通过Pipeline功能,可以将成功的操作序列保存下来,以后一键运行。
⚡ 后台运行:Windows自动化不干扰前台工作,提升效率。
局限性
⚠️ 部分应用限制:某些游戏或应用的反作弊机制可能会阻止后台自动化操作。
🔧 权限要求:如果目标Windows应用以管理员权限运行,MaaMCP也需要以管理员权限启动。
🪟 窗口状态:无法对最小化的Windows窗口进行操作,目标窗口需处于非最小化状态。
📱 设备连接:Android设备需要通过ADB连接,需要确保设备已开启USB调试。
如何使用
安装MaaMCP
选择以下任意一种方式安装MaaMCP服务器程序。推荐使用uv方式。
配置AI客户端
在您使用的AI客户端(如Cursor、Cherry Studio等)的设置中,添加MaaMCP作为MCP服务器。
开始使用
重启AI客户端,然后在聊天框中用自然语言描述您想让AI执行的任务即可。首次使用会自动下载OCR识别所需的资源文件。
使用案例
案例一:手机点外卖
让AI助手操作您的手机,打开外卖App,完成选餐、下单的整个流程。
案例二:电脑PPT美化
让AI助手查看您当前的PPT页面,并根据您的要求添加动画效果。
案例三:生成自动化脚本 (Pipeline)
让AI在执行完一系列操作后,将流程保存为可重复运行的自动化脚本。
常见问题
提示“Failed to load det or rec”或OCR资源不存在怎么办?
AI操作Windows时,我的鼠标键盘被占用了怎么办?
如何查看运行日志来排查问题?
支持iOS设备吗?
Pipeline功能有什么用?
相关资源
MaaMCP GitHub 仓库
项目源代码、最新版本和问题反馈。
MaaFramework 官网
MaaMCP所基于的底层自动化框架,了解更多技术细节。
Model Context Protocol (MCP)
了解MCP协议标准,这是AI工具集成的未来趋势。
Bilibili 视频演示
观看MaaMCP的实际操作演示视频,更直观地了解其能力。
PyPI 项目页
Python包索引上的项目页面,查看发布版本。

Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
122.4K
5分

Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
64.6K
4.5分

Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
71.0K
4.3分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
28.2K
4.8分

Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
44.5K
4.5分

Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
54.3K
4.8分

Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
46.5K
5分

Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
89.1K
4.7分

