Desktop Automation
D

Desktop Automation

MCPプロトコルに基づくデスクトップ自動化サービスで、マウスとキーボードの制御およびスクリーンショット機能を提供します
2.5ポイント
9.5K

MCPデスクトップ自動化サーバーとは?

MCPデスクトップ自動化サーバーは、マウス、キーボードを制御し、スクリーンショットを撮ることができるツールです。これはRobotJS技術に基づいており、モデルがあなたのデスクトップ環境とやり取りできるようにします。

MCPデスクトップ自動化サーバーの使い方は?

まず、Node.js(バージョン14.x以上)をインストールする必要があります。その後、サーバーを起動するためのコマンドを実行します。その後、指定されたコマンドを使用して、マウスの移動、テキストの入力、スクリーンショットの撮影など、さまざまな操作を実行できます。

適用シナリオ

繰り返しタスクの自動化、ユーザー行動のシミュレーション、またはデスクトップのリモート監視が必要なアプリケーションシナリオに適しています。

主要機能

画面サイズの取得
現在の画面の幅と高さを検出します。
スクリーンショット
画面全体または特定の領域の画像をキャプチャします。
キーボード入力
キーボードのキーをシミュレートし、テキストを入力します。
マウス制御
マウスの移動とクリックを正確に制御します。
利点
複数のオペレーティングシステムでのデスクトップ自動化をサポートします。
既存のMCPクライアントに簡単に統合できます。
さまざまなニーズに対応するための豊富なAPIインターフェースを提供します。
制限
高解像度の画面に対するサポートが限られており、800x600の解像度の使用をお勧めします。
各応答のデータサイズは1MBに制限されており、大きな画像の転送に影響を与える可能性があります。
初回使用時には、システム権限を手動で許可する必要があります。

使い方

依存関係のインストール
Node.js(バージョン14.x以上)がインストールされていることを確認してください。
サーバーの起動
ターミナルで起動スクリプトを実行します。
クライアントの設定
ドキュメントの指示に従って、あなたのMCPクライアントを設定してください。

使用例

例1:スクリーンショットを撮って保存する
画面をキャプチャし、ファイルとして保存する方法を示します。
例2:キーボード入力をシミュレートする
テキストを入力する動作をシミュレートします。

よくある質問

なぜシステム権限を付与する必要があるのですか?
スクリーンショットが大きすぎて失敗する問題はどう解決すればいいですか?
マルチディスプレイ設定はサポートされていますか?

関連リソース

公式ドキュメント
詳細なインストールガイドと技術ドキュメントを参照してください。
GitHubコードリポジトリ
プロジェクト開発に参加したり、問題を報告したりしてください。
MITライセンス
ライセンス契約の詳細を確認してください。

インストール

以下のコマンドをクライアントにコピーして設定
{
  "mcpServers": {
    "desktop-automation": {
      "command": "npx",
      "args": ["-y", "mcp-desktop-automation"]
    }
  }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

R
Rsdoctor
Rsdoctorは、Rspackエコシステム向けに開発されたビルド分析ツールで、webpackと完全に互換性があり、可視化ビルド分析、多次元パフォーマンス診断、インテリジェントな最適化提案を提供し、開発者がビルド効率とエンジニアリング品質を向上させるのに役立ちます。
TypeScript
9.4K
5ポイント
N
Next Devtools MCP
Next.js開発ツールのMCPサーバーです。ClaudeやCursorなどのAIプログラミングアシスタントにNext.js開発ツールとユーティリティを提供します。実行時診断、開発自動化、およびドキュメントアクセス機能が含まれています。
TypeScript
10.1K
5ポイント
T
Testkube
Testkubeは、クラウドネイティブアプリケーション向けのテストオーケストレーションと実行フレームワークで、テストの定義、実行、分析を行うための統一プラットフォームを提供します。既存のテストツールとKubernetesインフラストラクチャをサポートします。
Go
5.6K
5ポイント
M
MCP Windbg
AIモデルをWinDbg/CDBに統合するMCPサーバーで、Windowsのクラッシュダンプファイルの分析とリモートデバッグに使用し、自然言語での対話を通じてデバッグコマンドを実行できます。
Python
9.2K
5ポイント
R
Runno
Runnoは、JavaScriptツールキットのセットで、ブラウザやNode.jsなどの環境で複数のプログラミング言語のコードを安全に実行するためのものです。WebAssemblyとWASIを通じてサンドボックス化された実行を実現し、Python、Ruby、JavaScript、SQLite、C/C++などの言語をサポートし、Webコンポーネント、MCPサーバーなどの統合方法を提供します。
TypeScript
8.6K
5ポイント
N
Netdata
Netdataはオープンソースのリアルタイムインフラストラクチャ監視プラットフォームで、毎秒の指標収集、可視化、機械学習による異常検出、自動化アラートを提供し、複雑な構成なしで全スタックの監視を実現します。
Go
9.1K
5ポイント
M
MCP Server
Mapbox MCPサーバーは、Node.jsで実装されたモデルコンテキストプロトコルサーバーで、AIアプリケーションにMapboxの地理空間APIへのアクセス機能を提供します。地理コーディング、興味のある場所の検索、ルート計画、等時線分析、静的地図生成などの機能が含まれます。
TypeScript
8.2K
4ポイント
U
Uniprof
uniprofは、CPUパフォーマンス分析を簡素化するツールで、複数のプログラミング言語とランタイムをサポートし、コードの変更や依存関係の追加なしに、Dockerコンテナまたはホストモードでワンクリックでパフォーマンスプロファイリングとホットスポット分析を行うことができます。
TypeScript
8.4K
4.5ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
17.2K
4.5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
21.0K
4.8ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
69.9K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
32.2K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
19.2K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
24.0K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
18.0K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
28.1K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2026AIBase