Android Puppeteer MCP
Android Puppeteerは、MCPプロトコルに基づくAndroidデバイスの自動化サーバーで、視覚要素の検出と注釈付けにより、AIエージェントがAndroidデバイスと対話できるようにし、クリック、入力、スライド、録画などのさまざまな自動化操作をサポートします。
スコア : 2ポイント
ダウンロード数 : 5.1K
Android Puppeteerとは?
Android Puppeteerは、AIアシスタント(Claudeなど)とAndroidデバイスをつなぐ架け橋です。AIアシスタントにあなたの携帯電話の画面を「見させ」、ボタンや入力ボックスなどの対話可能な要素を識別し、あなたに代わってクリック、スライド、入力などの操作を実行できます。簡単に言えば、AIに携帯電話の自動操作を任せることができます。Android Puppeteerの使い方は?
使用する前に、Androidデバイスをコンピューターに接続する必要があります(USBまたはWi-Fi経由)。そして、開発者オプションのUSBデバッグ機能を有効にします。次に、Claude DesktopなどのMCPプロトコルをサポートするAIツールでこのサーバーを設定して有効にすると、AIアシスタントが自然言語の命令であなたの携帯電話を操作できるようになります。適用シナリオ
自動化テスト、繰り返しタスクの自動化(アプリの一括インストール、データ入力など)、アプリのデモ録画、視力や行動に不便を感じるユーザーに対する補助操作、または単に音声/文字命令で携帯電話を操作したいシナリオに適しています。主な機能
視覚要素検出
携帯電話の画面を自動分析し、クリック可能なすべてのUI要素(ボタン、テキストボックスなど)を識別して注釈を付け、番号付きのスクリーンショットを生成し、AIが正確に位置を特定できるようにします。
全面的なタッチ対話
クリック、長押し、スライド、スクロール、ドラッグなどのさまざまなジェスチャー操作をサポートし、座標を指定するか、要素番号を使って操作できます。
複数デバイスサポート
複数のAndroidデバイスまたはエミュレーターを同時に接続して管理でき、それぞれに指令を送信できるため、一括自動化タスクに適しています。
画面録画
内蔵の録画機能で、AIが携帯電話を操作する全過程を録画し、ビデオファイルを生成して、チュートリアルの作成やテスト結果の記録に使用できます。
リアルタイムUI分析
画面を「見る」だけでなく、画面構造を「理解」し、要素の詳細属性(文字、タイプ、座標など)を取得し、AIがより賢い操作戦略を策定できるように支援します。
テキスト入力
キーボード入力をシミュレートし、任意の入力ボックスまたは検索バーに指定された文字を入力できます。
利点
直感的で使いやすい:視覚認識に基づいており、複雑なスクリプトを記述する必要がなく、自然言語で説明するだけで操作できます。
機能が充実:日常の携帯電話操作に必要な大部分のジェスチャーと対話をカバーしています。
AIとシームレスに統合:MCPプロトコル用に設計されており、ClaudeなどのAIアシスタントが直接その機能を呼び出せます。
オープンソースで無料:MITライセンスに基づいており、自由に使用および変更できます。
制限
初期設定が必要:AndroidデバイスでUSBデバッグを有効にし、コンピューターに接続する必要があり、技術的な知識がないユーザーには少しハードルがあります。
デバイス性能に依存:操作速度と成功率は、携帯電話の性能と現在の画面の複雑さに影響されます。
システムのセキュリティ制限を回避できない:ロック画面のパスワードや特殊な権限のポップアップなどは、依然として手動で処理する必要があります。
非標準のUIコントロールの認識が不正確になる可能性がある:一部のゲームやカスタム画面の要素は正しく認識できない場合があります。
使い方
環境の準備
コンピューターにPython 3.10以上とADBツールをインストールします。Android携帯電話で「設定」->「携帯電話について」に移動し、「バージョン番号」を連続クリックして開発者モードを有効にし、開発者オプションで「USBデバッグ」を有効にします。
プロジェクトを取得して依存関係をインストールする
GitHubからプロジェクトコードをクローンし、uvツールを使って必要なPythonライブラリをインストールします。
Claude Desktopを設定する
コンピューター上のClaude Desktopの設定ファイルを見つけ、Android Puppeteerサーバーの設定情報を追加します。コマンドパスは、コンピューター上の実際のパスに置き換える必要があります。
再起動して使用する
設定ファイルを保存し、Claude Desktopを再起動します。再起動後、ClaudeはAndroidデバイスを操作する能力を持つはずで、自然言語で命令を与え始めることができます。
使用例
ケース1:アプリの自動設定
AIに新しくインストールしたアプリの初期設定手順を代行してもらい、面倒なガイドページや権限確認をスキップしたい場合。
ケース2:情報収集と入力
紙のフォームに記載された情報を携帯電話の特定のオフィスアプリに入力する必要がある場合。
ケース3:操作チュートリアルビデオの作成
携帯電話で特定の複雑な操作(メール設定など)を完了する手順のビデオを録画し、共有またはアーカイブするために使用したい場合。
よくある質問
携帯電話をコンピューターに接続しても反応がなく、adb devicesのリストが空です。
AIがクリックする位置が常に正しくない、または要素が識別できない場合はどうすればいいですか?
iOSデバイスはサポートされていますか?
録画したビデオファイルはどこに保存されますか?
ロック画面を操作できますか?たとえば、携帯電話のロックを解除することはできますか?
関連リソース
GitHubプロジェクトホームページ
最新のソースコードを取得し、問題を報告したり、貢献したりすることができます。
機能デモビデオ
Android Puppeteerの実際の操作デモを見ることができます。
Model Context Protocol (MCP)公式サイト
MCPプロトコルの詳細な仕様と設計理念を理解することができます。
uiautomator2プロジェクト
このプロジェクトの核心的な依存関係であるAndroid自動化ライブラリです。

Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
20.9K
4.8ポイント

Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
16.4K
4.5ポイント

Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
62.2K
4.7ポイント

Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
31.2K
4.5ポイント

Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
16.2K
4.3ポイント

Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
21.3K
5ポイント

Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
16.5K
5ポイント

Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
27.7K
4.5ポイント
