Maamcp
M

Maamcp

基于MaaFramework的MCP服务器,为AI助手提供Android设备和Windows桌面自动化能力,支持OCR识别、点击、滑动、文本输入等操作,并能将操作流程转换为可复用的Pipeline。
3.5分
4.7K

什么是MaaMCP?

MaaMCP是一个连接AI助手与自动化框架的桥梁。它让AI助手(如Claude、Cursor等)能够通过标准化的接口控制Android手机/模拟器和Windows电脑,执行点击、滑动、输入文字、识别屏幕内容等操作,实现真正的自动化任务执行。

如何使用MaaMCP?

您只需要在支持MCP协议的AI客户端(如Cursor、Cherry Studio等)中配置MaaMCP服务器,然后就可以用自然语言告诉AI助手您想要执行的操作,比如“帮我打开美团点一份外卖”或“调整电脑屏幕亮度到50%”。AI会自动调用MaaMCP工具完成这些任务。

适用场景

MaaMCP特别适合需要重复操作的场景,如:手机App测试、数据录入、批量文件处理、跨设备工作流自动化、为视力障碍者提供操作辅助、教学演示等。

主要功能

多设备控制
同时连接并控制多个Android设备(通过ADB)和Windows应用程序窗口,实现跨设备协同工作。
智能屏幕识别 (OCR)
自动识别屏幕上的文字内容,让AI能够“看懂”界面,从而做出正确的操作决策。这是最核心、最高效的交互方式。
精准操作
支持点击、双击、滑动、文本输入、按键(包括组合键)、鼠标滚轮等丰富的操作类型,满足各种交互需求。
后台自动化 (Windows)
在Windows上进行截图和控制时,默认在后台运行,不占用您的鼠标和键盘,您可以同时使用电脑做其他事情。
流程录制与复用 (Pipeline)
AI可以将成功执行的一系列操作智能地转化为可重复运行的自动化脚本(Pipeline JSON),实现“一次操作,无限复用”。
优势
🤖 自然语言驱动:用说话的方式告诉AI要做什么,无需学习复杂的编程或脚本。
🔗 标准化集成:基于Model Context Protocol (MCP),可以轻松集成到各种支持MCP的AI客户端中。
👁️ 智能决策:AI结合OCR识别结果,能像人一样理解界面并做出操作判断。
💾 可复用流程:通过Pipeline功能,可以将成功的操作序列保存下来,以后一键运行。
⚡ 后台运行:Windows自动化不干扰前台工作,提升效率。
局限性
⚠️ 部分应用限制:某些游戏或应用的反作弊机制可能会阻止后台自动化操作。
🔧 权限要求:如果目标Windows应用以管理员权限运行,MaaMCP也需要以管理员权限启动。
🪟 窗口状态:无法对最小化的Windows窗口进行操作,目标窗口需处于非最小化状态。
📱 设备连接:Android设备需要通过ADB连接,需要确保设备已开启USB调试。

如何使用

安装MaaMCP
选择以下任意一种方式安装MaaMCP服务器程序。推荐使用uv方式。
配置AI客户端
在您使用的AI客户端(如Cursor、Cherry Studio等)的设置中,添加MaaMCP作为MCP服务器。
开始使用
重启AI客户端,然后在聊天框中用自然语言描述您想让AI执行的任务即可。首次使用会自动下载OCR识别所需的资源文件。

使用案例

案例一:手机点外卖
让AI助手操作您的手机,打开外卖App,完成选餐、下单的整个流程。
案例二:电脑PPT美化
让AI助手查看您当前的PPT页面,并根据您的要求添加动画效果。
案例三:生成自动化脚本 (Pipeline)
让AI在执行完一系列操作后,将流程保存为可重复运行的自动化脚本。

常见问题

提示“Failed to load det or rec”或OCR资源不存在怎么办?
AI操作Windows时,我的鼠标键盘被占用了怎么办?
如何查看运行日志来排查问题?
支持iOS设备吗?
Pipeline功能有什么用?

相关资源

MaaMCP GitHub 仓库
项目源代码、最新版本和问题反馈。
MaaFramework 官网
MaaMCP所基于的底层自动化框架,了解更多技术细节。
Model Context Protocol (MCP)
了解MCP协议标准,这是AI工具集成的未来趋势。
Bilibili 视频演示
观看MaaMCP的实际操作演示视频,更直观地了解其能力。
PyPI 项目页
Python包索引上的项目页面,查看发布版本。

安装

复制以下命令到你的Client进行配置
{
  "mcpServers": {
    "MaaMCP": {
      "command": "maa-mcp"
    }
  }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

R
Runno
Runno是一个JavaScript工具包集合,用于在浏览器和Node.js等环境中安全地运行多种编程语言的代码,通过WebAssembly和WASI实现沙盒化执行,支持Python、Ruby、JavaScript、SQLite、C/C++等语言,并提供Web组件、MCP服务器等集成方式。
TypeScript
4.6K
5分
N
Netdata
Netdata是一个开源实时基础设施监控平台,提供每秒级指标收集、可视化、机器学习驱动的异常检测和自动化告警,无需复杂配置即可实现全栈监控。
Go
6.2K
5分
M
MCP Server
Mapbox MCP服务器是一个Node.js实现的模型上下文协议服务器,为AI应用提供Mapbox地理空间API的访问能力,包括地理编码、兴趣点搜索、路线规划、等时线分析和静态地图生成等功能。
TypeScript
6.2K
4分
U
Uniprof
uniprof是一个简化CPU性能分析的工具,支持多种编程语言和运行时,无需修改代码或添加依赖,可通过Docker容器或主机模式进行一键式性能剖析和热点分析。
TypeScript
7.7K
4.5分
G
Gk Cli
GitKraken CLI是一个命令行工具,提供多仓库工作流管理、AI生成提交信息和拉取请求,并包含一个本地MCP服务器,用于集成Git、GitHub和Jira等工具。
5.6K
4.5分
M
MCP
微软官方MCP服务器集合,提供Azure、GitHub、Microsoft 365、Fabric等多种服务的AI助手集成工具,支持本地和远程部署,帮助开发者通过标准化协议连接AI模型与各类数据源和工具。
C#
7.4K
5分
C
Claude Context
Claude Context是一个MCP插件,通过语义代码搜索为AI编程助手提供整个代码库的深度上下文,支持多种嵌入模型和向量数据库,实现高效代码检索。
TypeScript
11.4K
5分
A
Acemcp
Acemcp是一个代码库索引和语义搜索的MCP服务器,支持自动增量索引、多编码文件处理、.gitignore集成和Web管理界面,帮助开发者快速搜索和理解代码上下文。
Python
12.2K
5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
122.4K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
64.6K
4.5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
71.0K
4.3分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
28.2K
4.8分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
44.5K
4.5分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
54.3K
4.8分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
46.5K
5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
89.1K
4.7分
AIBase
智启未来,您的人工智能解决方案智库
© 2025AIBase