Android Puppeteer MCP
A

Android Puppeteer MCP

Android Puppeteerは、MCPプロトコルに基づくAndroidデバイスの自動化サーバーで、視覚要素の検出と注釈付けにより、AIエージェントがAndroidデバイスと対話できるようにし、クリック、入力、スライド、録画などのさまざまな自動化操作をサポートします。
2ポイント
5.1K

Android Puppeteerとは?

Android Puppeteerは、AIアシスタント(Claudeなど)とAndroidデバイスをつなぐ架け橋です。AIアシスタントにあなたの携帯電話の画面を「見させ」、ボタンや入力ボックスなどの対話可能な要素を識別し、あなたに代わってクリック、スライド、入力などの操作を実行できます。簡単に言えば、AIに携帯電話の自動操作を任せることができます。

Android Puppeteerの使い方は?

使用する前に、Androidデバイスをコンピューターに接続する必要があります(USBまたはWi-Fi経由)。そして、開発者オプションのUSBデバッグ機能を有効にします。次に、Claude DesktopなどのMCPプロトコルをサポートするAIツールでこのサーバーを設定して有効にすると、AIアシスタントが自然言語の命令であなたの携帯電話を操作できるようになります。

適用シナリオ

自動化テスト、繰り返しタスクの自動化(アプリの一括インストール、データ入力など)、アプリのデモ録画、視力や行動に不便を感じるユーザーに対する補助操作、または単に音声/文字命令で携帯電話を操作したいシナリオに適しています。

主な機能

視覚要素検出
携帯電話の画面を自動分析し、クリック可能なすべてのUI要素(ボタン、テキストボックスなど)を識別して注釈を付け、番号付きのスクリーンショットを生成し、AIが正確に位置を特定できるようにします。
全面的なタッチ対話
クリック、長押し、スライド、スクロール、ドラッグなどのさまざまなジェスチャー操作をサポートし、座標を指定するか、要素番号を使って操作できます。
複数デバイスサポート
複数のAndroidデバイスまたはエミュレーターを同時に接続して管理でき、それぞれに指令を送信できるため、一括自動化タスクに適しています。
画面録画
内蔵の録画機能で、AIが携帯電話を操作する全過程を録画し、ビデオファイルを生成して、チュートリアルの作成やテスト結果の記録に使用できます。
リアルタイムUI分析
画面を「見る」だけでなく、画面構造を「理解」し、要素の詳細属性(文字、タイプ、座標など)を取得し、AIがより賢い操作戦略を策定できるように支援します。
テキスト入力
キーボード入力をシミュレートし、任意の入力ボックスまたは検索バーに指定された文字を入力できます。
利点
直感的で使いやすい:視覚認識に基づいており、複雑なスクリプトを記述する必要がなく、自然言語で説明するだけで操作できます。
機能が充実:日常の携帯電話操作に必要な大部分のジェスチャーと対話をカバーしています。
AIとシームレスに統合:MCPプロトコル用に設計されており、ClaudeなどのAIアシスタントが直接その機能を呼び出せます。
オープンソースで無料:MITライセンスに基づいており、自由に使用および変更できます。
制限
初期設定が必要:AndroidデバイスでUSBデバッグを有効にし、コンピューターに接続する必要があり、技術的な知識がないユーザーには少しハードルがあります。
デバイス性能に依存:操作速度と成功率は、携帯電話の性能と現在の画面の複雑さに影響されます。
システムのセキュリティ制限を回避できない:ロック画面のパスワードや特殊な権限のポップアップなどは、依然として手動で処理する必要があります。
非標準のUIコントロールの認識が不正確になる可能性がある:一部のゲームやカスタム画面の要素は正しく認識できない場合があります。

使い方

環境の準備
コンピューターにPython 3.10以上とADBツールをインストールします。Android携帯電話で「設定」->「携帯電話について」に移動し、「バージョン番号」を連続クリックして開発者モードを有効にし、開発者オプションで「USBデバッグ」を有効にします。
プロジェクトを取得して依存関係をインストールする
GitHubからプロジェクトコードをクローンし、uvツールを使って必要なPythonライブラリをインストールします。
Claude Desktopを設定する
コンピューター上のClaude Desktopの設定ファイルを見つけ、Android Puppeteerサーバーの設定情報を追加します。コマンドパスは、コンピューター上の実際のパスに置き換える必要があります。
再起動して使用する
設定ファイルを保存し、Claude Desktopを再起動します。再起動後、ClaudeはAndroidデバイスを操作する能力を持つはずで、自然言語で命令を与え始めることができます。

使用例

ケース1:アプリの自動設定
AIに新しくインストールしたアプリの初期設定手順を代行してもらい、面倒なガイドページや権限確認をスキップしたい場合。
ケース2:情報収集と入力
紙のフォームに記載された情報を携帯電話の特定のオフィスアプリに入力する必要がある場合。
ケース3:操作チュートリアルビデオの作成
携帯電話で特定の複雑な操作(メール設定など)を完了する手順のビデオを録画し、共有またはアーカイブするために使用したい場合。

よくある質問

携帯電話をコンピューターに接続しても反応がなく、adb devicesのリストが空です。
AIがクリックする位置が常に正しくない、または要素が識別できない場合はどうすればいいですか?
iOSデバイスはサポートされていますか?
録画したビデオファイルはどこに保存されますか?
ロック画面を操作できますか?たとえば、携帯電話のロックを解除することはできますか?

関連リソース

GitHubプロジェクトホームページ
最新のソースコードを取得し、問題を報告したり、貢献したりすることができます。
機能デモビデオ
Android Puppeteerの実際の操作デモを見ることができます。
Model Context Protocol (MCP)公式サイト
MCPプロトコルの詳細な仕様と設計理念を理解することができます。
uiautomator2プロジェクト
このプロジェクトの核心的な依存関係であるAndroid自動化ライブラリです。

インストール

以下のコマンドをクライアントにコピーして設定
{
     "mcpServers": {
       "android-puppeteer": {
         "command": "path/to/uv",
         "args": [
           "--directory",
           "path/to/android-puppeteer",
           "run",
           "puppeteer.py"
         ]
       }
     }
   }
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

R
Rsdoctor
Rsdoctorは、Rspackエコシステム向けに開発されたビルド分析ツールで、webpackと完全に互換性があり、可視化ビルド分析、多次元パフォーマンス診断、インテリジェントな最適化提案を提供し、開発者がビルド効率とエンジニアリング品質を向上させるのに役立ちます。
TypeScript
7.3K
5ポイント
N
Next Devtools MCP
Next.js開発ツールのMCPサーバーです。ClaudeやCursorなどのAIプログラミングアシスタントにNext.js開発ツールとユーティリティを提供します。実行時診断、開発自動化、およびドキュメントアクセス機能が含まれています。
TypeScript
7.2K
5ポイント
T
Testkube
Testkubeは、クラウドネイティブアプリケーション向けのテストオーケストレーションと実行フレームワークで、テストの定義、実行、分析を行うための統一プラットフォームを提供します。既存のテストツールとKubernetesインフラストラクチャをサポートします。
Go
5.5K
5ポイント
M
MCP Windbg
AIモデルをWinDbg/CDBに統合するMCPサーバーで、Windowsのクラッシュダンプファイルの分析とリモートデバッグに使用し、自然言語での対話を通じてデバッグコマンドを実行できます。
Python
8.2K
5ポイント
R
Runno
Runnoは、JavaScriptツールキットのセットで、ブラウザやNode.jsなどの環境で複数のプログラミング言語のコードを安全に実行するためのものです。WebAssemblyとWASIを通じてサンドボックス化された実行を実現し、Python、Ruby、JavaScript、SQLite、C/C++などの言語をサポートし、Webコンポーネント、MCPサーバーなどの統合方法を提供します。
TypeScript
5.5K
5ポイント
N
Netdata
Netdataはオープンソースのリアルタイムインフラストラクチャ監視プラットフォームで、毎秒の指標収集、可視化、機械学習による異常検出、自動化アラートを提供し、複雑な構成なしで全スタックの監視を実現します。
Go
6.2K
5ポイント
M
MCP Server
Mapbox MCPサーバーは、Node.jsで実装されたモデルコンテキストプロトコルサーバーで、AIアプリケーションにMapboxの地理空間APIへのアクセス機能を提供します。地理コーディング、興味のある場所の検索、ルート計画、等時線分析、静的地図生成などの機能が含まれます。
TypeScript
6.1K
4ポイント
U
Uniprof
uniprofは、CPUパフォーマンス分析を簡素化するツールで、複数のプログラミング言語とランタイムをサポートし、コードの変更や依存関係の追加なしに、Dockerコンテナまたはホストモードでワンクリックでパフォーマンスプロファイリングとホットスポット分析を行うことができます。
TypeScript
6.8K
4.5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
20.9K
4.8ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
16.4K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
62.2K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
31.2K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
16.2K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
21.3K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
16.5K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
27.7K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2026AIBase