Android Puppeteer MCP
什麼是Android Puppeteer?
Android Puppeteer是一個連接AI助手(如Claude)和Android設備的橋樑。它能讓AI助手'看到'你的手機屏幕,識別出按鈕、輸入框等可交互元素,並代替你執行點擊、滑動、輸入等操作。簡單來說,就是讓AI幫你自動化操作手機。如何使用Android Puppeteer?
使用前需要將你的Android設備連接到電腦(通過USB或Wi-Fi),並開啟開發者選項中的USB調試功能。然後在Claude Desktop等支持MCP協議的AI工具中配置並啟用本服務器,AI助手就能通過自然語言指令來操作你的手機了。適用場景
適用於自動化測試、重複性任務自動化(如批量安裝應用、數據錄入)、應用演示錄製、為視力或行動不便的用戶提供輔助操作,或者單純想用語音/文字指令來控制手機的場景。主要功能
視覺元素檢測
自動分析手機屏幕,識別並標註所有可點擊的UI元素(如按鈕、文本框),生成帶編號的截圖,方便AI精確定位。
全面的觸摸交互
支持點擊、長按、滑動、滾動、拖拽等多種手勢操作,可以指定座標或通過元素編號來操作。
多設備支持
可同時連接並管理多臺Android設備或模擬器,分別對它們發送指令,適合批量自動化任務。
屏幕錄製
內置錄屏功能,可以錄製AI操作手機的整個過程,生成視頻文件,用於創建教程或記錄測試結果。
即時UI分析
不僅能“看到”屏幕,還能“讀懂”界面結構,獲取元素的詳細屬性(如文字、類型、座標),幫助AI制定更智能的操作策略。
文本輸入
模擬鍵盤輸入,可以在任何輸入框或搜索欄中輸入指定的文字。
優勢
直觀易用:基於視覺識別,無需編寫複雜腳本,用自然語言描述即可操作。
功能全面:覆蓋了日常操作手機所需的大部分手勢和交互。
與AI無縫集成:專為MCP協議設計,讓Claude等AI助手能直接調用其能力。
開源免費:基於MIT協議,可自由使用和修改。
侷限性
需要初始設置:要求Android設備開啟USB調試並連接電腦,對非技術用戶有一定門檻。
依賴設備性能:操作速度和成功率受手機性能和當前界面複雜度影響。
無法繞過系統安全限制:如鎖屏密碼、特殊權限彈窗等仍需人工處理。
對非標準UI控件識別可能不準:某些遊戲或自定義界面的元素可能無法正確識別。
如何使用
環境準備
在電腦上安裝Python 3.10+和ADB工具。在Android手機上進入“設置”->“關於手機”,連續點擊“版本號”開啟開發者模式,然後在開發者選項中開啟“USB調試”。
獲取項目並安裝依賴
從GitHub克隆項目代碼,並使用uv工具安裝所需的Python庫。
配置Claude Desktop
找到你電腦上Claude Desktop的配置文件,添加Android Puppeteer服務器的配置信息。需要將命令路徑替換為你電腦上的實際路徑。
重啟並使用
保存配置文件並重啟Claude Desktop。重啟後,Claude就應該具備了操作Android設備的能力,你可以開始用自然語言給它下指令了。
使用案例
案例一:自動化應用設置
你想讓AI幫你完成一個新安裝應用的初始設置流程,跳過那些繁瑣的引導頁和權限詢問。
案例二:信息收集與錄入
你需要將一份紙質表格上的信息錄入到手機某個辦公App中。
案例三:創建操作教程視頻
你想錄制一個在手機上完成某個複雜操作(如配置郵箱)的步驟視頻,用於分享或存檔。
常見問題
我的手機連接電腦後沒反應,adb devices列表是空的?
AI點擊的位置總是不對,或者識別不到元素怎麼辦?
支持iOS設備嗎?
錄製的視頻文件保存在哪裡?
可以操作鎖屏界面嗎?比如解鎖手機?
相關資源
GitHub 項目主頁
獲取最新源代碼、報告問題或參與貢獻。
功能演示視頻
觀看Android Puppeteer的實際操作演示。
Model Context Protocol (MCP) 官網
瞭解MCP協議的詳細規範和設計理念。
uiautomator2 項目
本項目核心依賴的Android自動化庫。

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
26.3K
5分

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
34.1K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
98.2K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
26.9K
4.5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
21.7K
4.8分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
15.1K
4.5分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
17.9K
5分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
65.5K
4.7分
