Omniparser Autogui MCP
これはOmniParserに基づくMCPサーバープロジェクトで、画面内容を自動分析し、GUIインターフェイスを操作できます。主にWindowsシステムをサポートしています。
rating : 2.5 points
downloads : 39
Omniparser-Autogui-MCPとは?
Omniparser-Autogui-MCPはMCPサーバーで、OmniParserを利用して画面内容を分析し、自動化スクリプトによりグラフィカルユーザーインターフェイス(GUI)を操作します。効率的な画面解析と自動化操作が必要なシナリオに特に適しています。Omniparser-Autogui-MCPの使い方は?
インストールが完了したら、設定ファイルにサーバー設定を追加するだけで使用を開始できます。設定パラメータを通じて、ターゲットウィンドウ、言語、その他のオプションを指定できます。適用シナリオ
このツールは、GUIの自動化操作が必要なシナリオ、例えばバッチ処理タスク、自動化テスト、データ収集などに適しています。主な機能
画面内容分析OmniParserを利用して、画面上の文字、画像、ボタンなどの要素を解析します。
自動化GUI操作分析結果に基づいて、マウスクリック、キーボード入力などの操作を自動実行します。
多言語対応複数の言語の画面内容解析をサポートし、国際化のニーズを満たします。
柔軟な設定ターゲットウィンドウ、言語環境、OmniParserモデルのパスをカスタマイズできます。
利点と制限
利点
強力な画面解析能力
効率的な自動化操作
複数のオペレーティングシステムと言語をサポート
オープンソースで無料
制限
複雑なGUIへの対応が限られる可能性があります。
OmniParserのパフォーマンスに依存します。
初期設定には一定の技術的背景が必要です。
使い方
リポジトリをクローンする
以下のコマンドを実行して、プロジェクトをクローンして初期化します:`git clone --recursive https://github.com/NON906/omniparser-autogui-mcp.git`。
依存関係をインストールする
プロジェクトディレクトリに切り替えた後、`uv sync`と`uv run download_models.py`を実行して、必要なモデルをダウンロードします。
サーバーを設定する
`claude_desktop_config.json`ファイルを編集して、サーバー設定を追加します。
使用例
ブラウザで「MCPサーバー」を検索するターゲットウィンドウ名を設定することで、ブラウザの検索ボックスを自動的に見つけてクリックし、キーワード「MCPサーバー」を入力してからEnterキーを押します。
フォームを自動入力する特定のウィンドウ名を設定した後、ユーザー名とパスワードを自動入力し、ログインボタンをクリックします。
よくある質問
インストールが失敗した場合はどうすればいいですか?
中国語はサポートされていますか?
自動化スクリプトをどのようにデバッグしますか?
関連リソース
OmniParser公式ドキュメント
OmniParserの核心ドキュメントとチュートリアル。
GitHubリポジトリ
Omniparser-Autogui-MCPのソースコードとサンプル。
YouTubeチュートリアル
クイックスタートビデオ。
Featured MCP Services

Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
259
4.8 points

Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
287
4.5 points

Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
5.2K
4.7 points

Baidu Map
Certified
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
713
4.5 points

Gitlab MCP Server
Certified
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
77
4.3 points

Unity
Certified
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
550
5 points

Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
1.7K
5 points

Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
271
4.5 points