O

Omniparser Autogui MCP

これはOmniParserに基づくMCPサーバープロジェクトで、画面内容を自動分析し、GUIインターフェイスを操作できます。主にWindowsシステムをサポートしています。
2.5 points
39

Omniparser-Autogui-MCPとは?

Omniparser-Autogui-MCPはMCPサーバーで、OmniParserを利用して画面内容を分析し、自動化スクリプトによりグラフィカルユーザーインターフェイス(GUI)を操作します。効率的な画面解析と自動化操作が必要なシナリオに特に適しています。

Omniparser-Autogui-MCPの使い方は?

インストールが完了したら、設定ファイルにサーバー設定を追加するだけで使用を開始できます。設定パラメータを通じて、ターゲットウィンドウ、言語、その他のオプションを指定できます。

適用シナリオ

このツールは、GUIの自動化操作が必要なシナリオ、例えばバッチ処理タスク、自動化テスト、データ収集などに適しています。

主な機能

画面内容分析OmniParserを利用して、画面上の文字、画像、ボタンなどの要素を解析します。
自動化GUI操作分析結果に基づいて、マウスクリック、キーボード入力などの操作を自動実行します。
多言語対応複数の言語の画面内容解析をサポートし、国際化のニーズを満たします。
柔軟な設定ターゲットウィンドウ、言語環境、OmniParserモデルのパスをカスタマイズできます。

利点と制限

利点
強力な画面解析能力
効率的な自動化操作
複数のオペレーティングシステムと言語をサポート
オープンソースで無料
制限
複雑なGUIへの対応が限られる可能性があります。
OmniParserのパフォーマンスに依存します。
初期設定には一定の技術的背景が必要です。

使い方

リポジトリをクローンする
以下のコマンドを実行して、プロジェクトをクローンして初期化します:`git clone --recursive https://github.com/NON906/omniparser-autogui-mcp.git`。
依存関係をインストールする
プロジェクトディレクトリに切り替えた後、`uv sync`と`uv run download_models.py`を実行して、必要なモデルをダウンロードします。
サーバーを設定する
`claude_desktop_config.json`ファイルを編集して、サーバー設定を追加します。

使用例

ブラウザで「MCPサーバー」を検索するターゲットウィンドウ名を設定することで、ブラウザの検索ボックスを自動的に見つけてクリックし、キーワード「MCPサーバー」を入力してからEnterキーを押します。
フォームを自動入力する特定のウィンドウ名を設定した後、ユーザー名とパスワードを自動入力し、ログインボタンをクリックします。

よくある質問

インストールが失敗した場合はどうすればいいですか?
中国語はサポートされていますか?
自動化スクリプトをどのようにデバッグしますか?

関連リソース

OmniParser公式ドキュメント
OmniParserの核心ドキュメントとチュートリアル。
GitHubリポジトリ
Omniparser-Autogui-MCPのソースコードとサンプル。
YouTubeチュートリアル
クイックスタートビデオ。
Installation
Copy the following command to your Client for configuration
Note: Your key is sensitive information, do not share it with anyone.
S
Search1api
Search1API MCPサーバーは、Model Context Protocol (MCP)に基づくサーバーで、検索とクローリング機能を提供し、複数の検索サービスとツールをサポートします。
TypeScript
327
4 points
D
Duckduckgo MCP Server
Certified
DuckDuckGo検索MCPサーバーは、ClaudeなどのLLMにウェブ検索とコンテンツ取得サービスを提供します。
Python
807
4.3 points
M
MCP Alchemy
Certified
MCPアルケミーは、Claude Desktopと複数のデータベースを接続するツールで、SQLクエリ、データベース構造分析、データレポート生成をサポートします。
Python
313
4.2 points
P
Postgresql MCP
FastMCPライブラリに基づくPostgreSQLデータベースのMCPサービスで、指定されたテーブルのCRUD操作、スキーマ検査、およびカスタムSQLクエリ機能を提供します。
Python
96
4 points
M
MCP Scan
MCP-Scanは、MCPサーバー用のセキュリティスキャンツールで、提示注入、ツール汚染、クロスドメインアップグレードなどの一般的なセキュリティホールを検出します。
Python
609
5 points
A
Agentic Radar
エージェンティックレーダーは、エージェントシステムを分析・評価するセキュリティスキャナーで、開発者、研究者、セキュリティ専門家がエージェントシステムのワークフローを理解し、潜在的なホールを特定するのに役立ちます。
Python
543
5 points
C
Cloudflare
Changesetsは、マルチパッケージまたはシングルパッケージのリポジトリのバージョン管理とリリースを管理するためのビルドツールです。
TypeScript
1.5K
5 points
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
259
4.8 points
Featured MCP Services
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
259
4.8 points
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
287
4.5 points
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
5.2K
4.7 points
B
Baidu Map
Certified
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
713
4.5 points
G
Gitlab MCP Server
Certified
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
77
4.3 points
U
Unity
Certified
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
550
5 points
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
1.7K
5 points
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
271
4.5 points
AIbase
Zhiqi Future, Your AI Solution Think Tank
© 2025AIbase