W

Wayland MCP

Wayland MCPは、現代のLinuxデスクトップにスクリーンショット分析と入力制御ツールを提供するサービスプロジェクトで、現行のソリューションがWayland環境で抱える信頼性の問題を解決します。
2ポイント
12

Wayland MCPサーバーとは?

Wayland MCPサーバーは、現代のLinuxデスクトップ環境向けに設計されたツールで、スクリーンショットのキャプチャ、画像分析、およびマウスキーボードの模擬制御機能を提供します。これにより、従来のスクリーンショットツールがWayland環境で不安定になる問題が解決されます。

Wayland MCPサーバーの使い方は?

簡単なコマンドラインでのインストールと設定を行った後、MCPサーバーに統合し、API呼び出しを通じてデスクトップ環境を制御し、画面情報を取得することができます。

適用シーン

自動化テスト、リモート制御、スマートデスクトップアシスタントなどのシーンに適しており、特にWaylandベースのGNOME/KDEなどの現代のLinuxデスクトップ環境に最適です。

主要機能

スクリーンショットと分析高品質のスクリーンショットをサポートし、VLMモデルを統合して画像内容を分析し、画像比較機能を提供します。
入力模擬移動、クリック、ドラッグ、スクロール、キーボード入力など、完全なマウスキーボード制御機能を備えています。
アクションチェーン複数の入力アクションを組み合わせて複雑な操作シーケンスを形成することをサポートします。

利点と制限

利点
Wayland環境に最適化されており、従来のツールの互換性問題を解決します。
完全な入力制御機能を提供し、複雑な自動化操作をサポートします。
AI画像分析機能を統合し、アプリケーションのシーンを拡張します。
制限
Wayland環境のみをサポートし、X11には適用できません。
入力制御機能にはセキュリティリスクがあり、注意して使用する必要があります。
権限の設定が必要で、初期設定が複雑です。

使い方

インストールの準備
システムがWaylandデスクトップ環境を使用していることを確認し、必要な依存関係をインストールします。
権限の設定
setup.shスクリプトを実行して入力デバイスの権限を設定します。
統合設定
MCPサーバーの設定ファイルにWayland MCPサービスの設定を追加します。

使用例

自動化テストアプリを自動的に開き、画面要素を検証します。
スマートアシスタント画面内容に基づいて操作提案を提供します。

よくある質問

なぜsetup.shを実行する必要があるのですか?
安全に使用するにはどうすればいいですか?
どのWaylandデスクトップ環境をサポートしていますか?

関連リソース

GitHubリポジトリ
プロジェクトのソースコードと最新バージョン
Waylandプロトコルドキュメント
Waylandの公式ドキュメント
MCPサーバーガイド
MCPサーバーの統合ガイド
インストール
以下のコマンドをクライアントにコピーして設定
{
  "mcpServers": {
    "wayland-screenshot": {
      "command": "uvx",
      "args": ["wayland-mcp"],
      "env": {
        "OPENROUTER_API_KEY": "your-api-key",
        "VLM_MODEL": "qwen/qwen2.5-vl-72b-instruct:free",
        "XDG_RUNTIME_DIR": "/run/user/1000",
        "WAYLAND_MCP_PORT": "4999",
        "DISPLAY": ":0",
        "WAYLAND_DISPLAY": "wayland-0",
        "XDG_SESSION_TYPE": "wayland"
      }
    }
  }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。
S
Search1api
Search1API MCPサーバーは、Model Context Protocol (MCP)に基づくサーバーで、検索とクローリング機能を提供し、複数の検索サービスとツールをサポートします。
TypeScript
324
4ポイント
D
Duckduckgo MCP Server
認証済み
DuckDuckGo検索MCPサーバーは、ClaudeなどのLLMにウェブ検索とコンテンツ取得サービスを提供します。
Python
806
4.3ポイント
M
MCP Alchemy
認証済み
MCPアルケミーは、Claude Desktopと複数のデータベースを接続するツールで、SQLクエリ、データベース構造分析、データレポート生成をサポートします。
Python
310
4.2ポイント
P
Postgresql MCP
FastMCPライブラリに基づくPostgreSQLデータベースのMCPサービスで、指定されたテーブルのCRUD操作、スキーマ検査、およびカスタムSQLクエリ機能を提供します。
Python
93
4ポイント
M
MCP Scan
MCP-Scanは、MCPサーバー用のセキュリティスキャンツールで、提示注入、ツール汚染、クロスドメインアップグレードなどの一般的なセキュリティホールを検出します。
Python
605
5ポイント
A
Agentic Radar
エージェンティックレーダーは、エージェントシステムを分析・評価するセキュリティスキャナーで、開発者、研究者、セキュリティ専門家がエージェントシステムのワークフローを理解し、潜在的なホールを特定するのに役立ちます。
Python
540
5ポイント
C
Cloudflare
Changesetsは、マルチパッケージまたはシングルパッケージのリポジトリのバージョン管理とリリースを管理するためのビルドツールです。
TypeScript
1.5K
5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
255
4.8ポイント
厳選MCPサービス
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
255
4.8ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
5.2K
4.7ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
280
4.5ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
709
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
74
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
546
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
1.7K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
262
4.5ポイント
AIbase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIbase