Android Puppeteer MCP
什么是Android Puppeteer?
Android Puppeteer是一个连接AI助手(如Claude)和Android设备的桥梁。它能让AI助手'看到'你的手机屏幕,识别出按钮、输入框等可交互元素,并代替你执行点击、滑动、输入等操作。简单来说,就是让AI帮你自动化操作手机。如何使用Android Puppeteer?
使用前需要将你的Android设备连接到电脑(通过USB或Wi-Fi),并开启开发者选项中的USB调试功能。然后在Claude Desktop等支持MCP协议的AI工具中配置并启用本服务器,AI助手就能通过自然语言指令来操作你的手机了。适用场景
适用于自动化测试、重复性任务自动化(如批量安装应用、数据录入)、应用演示录制、为视力或行动不便的用户提供辅助操作,或者单纯想用语音/文字指令来控制手机的场景。主要功能
视觉元素检测
自动分析手机屏幕,识别并标注所有可点击的UI元素(如按钮、文本框),生成带编号的截图,方便AI精确定位。
全面的触摸交互
支持点击、长按、滑动、滚动、拖拽等多种手势操作,可以指定坐标或通过元素编号来操作。
多设备支持
可同时连接并管理多台Android设备或模拟器,分别对它们发送指令,适合批量自动化任务。
屏幕录制
内置录屏功能,可以录制AI操作手机的整个过程,生成视频文件,用于创建教程或记录测试结果。
实时UI分析
不仅能“看到”屏幕,还能“读懂”界面结构,获取元素的详细属性(如文字、类型、坐标),帮助AI制定更智能的操作策略。
文本输入
模拟键盘输入,可以在任何输入框或搜索栏中输入指定的文字。
优势
直观易用:基于视觉识别,无需编写复杂脚本,用自然语言描述即可操作。
功能全面:覆盖了日常操作手机所需的大部分手势和交互。
与AI无缝集成:专为MCP协议设计,让Claude等AI助手能直接调用其能力。
开源免费:基于MIT协议,可自由使用和修改。
局限性
需要初始设置:要求Android设备开启USB调试并连接电脑,对非技术用户有一定门槛。
依赖设备性能:操作速度和成功率受手机性能和当前界面复杂度影响。
无法绕过系统安全限制:如锁屏密码、特殊权限弹窗等仍需人工处理。
对非标准UI控件识别可能不准:某些游戏或自定义界面的元素可能无法正确识别。
如何使用
环境准备
在电脑上安装Python 3.10+和ADB工具。在Android手机上进入“设置”->“关于手机”,连续点击“版本号”开启开发者模式,然后在开发者选项中开启“USB调试”。
获取项目并安装依赖
从GitHub克隆项目代码,并使用uv工具安装所需的Python库。
配置Claude Desktop
找到你电脑上Claude Desktop的配置文件,添加Android Puppeteer服务器的配置信息。需要将命令路径替换为你电脑上的实际路径。
重启并使用
保存配置文件并重启Claude Desktop。重启后,Claude就应该具备了操作Android设备的能力,你可以开始用自然语言给它下指令了。
使用案例
案例一:自动化应用设置
你想让AI帮你完成一个新安装应用的初始设置流程,跳过那些繁琐的引导页和权限询问。
案例二:信息收集与录入
你需要将一份纸质表格上的信息录入到手机某个办公App中。
案例三:创建操作教程视频
你想录制一个在手机上完成某个复杂操作(如配置邮箱)的步骤视频,用于分享或存档。
常见问题
我的手机连接电脑后没反应,adb devices列表是空的?
AI点击的位置总是不对,或者识别不到元素怎么办?
支持iOS设备吗?
录制的视频文件保存在哪里?
可以操作锁屏界面吗?比如解锁手机?
相关资源
GitHub 项目主页
获取最新源代码、报告问题或参与贡献。
功能演示视频
观看Android Puppeteer的实际操作演示。
Model Context Protocol (MCP) 官网
了解MCP协议的详细规范和设计理念。
uiautomator2 项目
本项目核心依赖的Android自动化库。

Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
71.8K
4.3分

Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
64.0K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
122.5K
5分

Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
45.0K
4.5分

Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
48.0K
5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
28.7K
4.8分

Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
53.9K
4.8分

Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
89.3K
4.7分
