MCP Browser Use
M

MCP Browser Use

MCPプロトコルに基づくAI駆動のブラウザー自動化サーバーで、多モデルのインタラクションと視覚分析をサポートし、ウェブページ操作とセッション保持機能を提供します。
2ポイント
6.5K

ブラウザー利用MCPサーバーとは?

ブラウザー利用MCPサーバーは、Model Context Protocol (MCP)に基づくインテリジェントなブラウザー自動化サーバーです。ユーザーは自然言語の命令で、コードを書かずに、ウェブページのナビゲーション、フォームの入力、要素のインタラクションなどのブラウザー操作を制御できます。

ブラウザー利用MCPサーバーの使い方は?

インストール後、Claude Desktopなどのクライアントでサーバーに接続し、自然言語の命令を送信してブラウザーを制御できます。サーバーは複数のAIモデルプロバイダーをサポートし、必要に応じて設定できます。

適用シーン

自動化ウェブページテスト、データ収集、繰り返しのウェブページ操作、バリアフリーブラウジング支援などのシーンに適しています。特に、複雑なウェブページタスクをインテリジェントに理解して実行する必要があるシーンに適しています。

主要機能

MCPプロトコル統合
Model Context Protocolを完全に実装し、AIエージェントとブラウザーのインテリジェントなインタラクションをサポートします。
ブラウザー自動化
ウェブページのナビゲーション、フォームの入力、要素のクリックなどの一般的なブラウザー操作をサポートします。
視覚理解
スクリーンショット分析により、視覚に基づくウェブページ要素の識別とインタラクションを実現します。
多モデルサポート
OpenAI、Anthropic、Azure、DeepSeekなどの複数のAIモデルプロバイダーをサポートします。
セッション永続化
ブラウザーのセッション状態を保持でき、長時間のタスク実行をサポートします。
利点
プログラミング知識が不要で、自然言語でブラウザーを制御できます。
複数の主流AIモデルをサポートし、必要に応じて柔軟に切り替えられます。
可視化インタラクション能力があり、ウェブページのレイアウトと内容を理解できます。
セッション保持機能があり、多段階の複雑なタスクに適しています。
制限
安定したネットワーク接続とAPIアクセス権が必要です。
複雑なウェブページでは、より正確な命令が必要になる場合があります。
一部の高度な機能には特定のブラウザー設定が必要です。

使い方

インストール準備
Python 3.11以上とChrome/Chromiumブラウザーがインストールされていることを確認してください。
環境変数の設定
APIキーとブラウザーパラメーター(OPENAI_API_KEYなど)を設定します。
サーバーの起動
uvツールでサーバーを実行します。
クライアントの接続
Claude Desktopなどのクライアントで接続パラメーターを設定します。

使用例

ウェブページデータ収集
指定されたウェブページから特定のデータを自動収集します。
フォーム自動入力
ウェブページのフォームを自動入力して送信します。
多段階操作
複数の手順が必要なウェブページタスクを実行します。

よくある質問

なぜ私のブラウザーが起動できないのですか?
AIモデルプロバイダーを切り替えるにはどうすればいいですか?
サーバーはどのブラウザーをサポートしていますか?
視覚機能を有効にするにはどうすればいいですか?

関連リソース

公式ドキュメント
Browser - Useプロジェクトの完全なドキュメント
GitHubリポジトリ
プロジェクトのソースコードと問題追跡
MCPプロトコルの説明
Model Context Protocolの公式説明
サンプル設定
様々な環境での設定サンプル

インストール

以下のコマンドをクライアントにコピーして設定
"mcpServers": {
    "browser-use": {
      "command": "uvx",
      "args": [
        "mcp-server-browser-use",
      ],
      "env": {
        "OPENROUTER_API_KEY": "",
        "OPENROUTER_ENDPOINT": "https://openrouter.ai/api/v1",
        "OPENAI_ENDPOINT": "https://api.openai.com/v1",
        "OPENAI_API_KEY": "",
        "ANTHROPIC_ENDPOINT": "https://api.anthropic.com",
        "ANTHROPIC_API_KEY": "",
        "GOOGLE_API_KEY": "",
        "AZURE_OPENAI_ENDPOINT": "",
        "AZURE_OPENAI_API_KEY": "",
        "DEEPSEEK_ENDPOINT": "https://api.deepseek.com",
        "DEEPSEEK_API_KEY": "",
        "MISTRAL_API_KEY": "",
        "MISTRAL_ENDPOINT": "https://api.mistral.ai/v1",
        "OLLAMA_ENDPOINT": "http://localhost:11434",
        "ANONYMIZED_TELEMETRY": "true",
        "BROWSER_USE_LOGGING_LEVEL": "info",
        "CHROME_PATH": "",
        "CHROME_USER_DATA": "",
        "CHROME_DEBUGGING_PORT": "9222",
        "CHROME_DEBUGGING_HOST": "localhost",
        "CHROME_PERSISTENT_SESSION": "false",
        "BROWSER_HEADLESS": "false",
        "BROWSER_DISABLE_SECURITY": "false",
        "BROWSER_WINDOW_WIDTH": "1280",
        "BROWSER_WINDOW_HEIGHT": "720",
        "BROWSER_TRACE_PATH": "trace.json",
        "BROWSER_RECORDING_PATH": "recording.mp4",
        "RESOLUTION": "1920x1080x24",
        "RESOLUTION_WIDTH": "1920",
        "RESOLUTION_HEIGHT": "1080",
        "VNC_PASSWORD": "youvncpassword",
        "MCP_MODEL_PROVIDER": "anthropic",
        "MCP_MODEL_NAME": "claude-3-5-sonnet-20241022",
        "MCP_TEMPERATURE": "0.3",
        "MCP_MAX_STEPS": "30",
        "MCP_USE_VISION": "true",
        "MCP_MAX_ACTIONS_PER_STEP": "5",
        "MCP_TOOL_CALL_IN_CONTENT": "true"
    }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

K
Klavis
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
TypeScript
9.2K
5ポイント
D
Devtools Debugger MCP
Node.jsデバッガーMCPサーバーは、Chrome DevToolsプロトコルに基づく完全なデバッグ機能を提供します。ブレークポイントの設定、ステップ実行、変数のチェック、式の評価などが含まれます。
TypeScript
5.4K
4ポイント
M
Mcpjungle
MCPJungleは自ホスト型のMCPゲートウェイで、複数のMCPサーバーを集中的に管理および代理し、AIエージェントに統一されたツールアクセスインターフェースを提供します。
Go
0
4.5ポイント
N
Nexus
NexusはAIツール集約ゲートウェイで、複数のMCPサーバーとLLMプロバイダーの接続をサポートし、統一されたエンドポイントを通じてツール検索、実行、およびモデルルーティング機能を提供し、セキュリティ認証とレート制限をサポートします。
Rust
0
4ポイント
Z
Zen MCP Server
Zen MCPは多モデルAI協調開発サーバーで、ClaudeやGemini CLIなどのAIコーディングアシスタントに強化されたワークフローツールとモデル間のコンテキスト管理を提供します。これは複数のAIモデルのシームレスな協調をサポートし、コードレビュー、デバッグ、リファクタリングなどの開発タスクを実現し、異なるワークフロー間で会話のコンテキストを維持することができます。
Python
13.2K
5ポイント
O
Opendia
OpenDiaはオープンソースのブラウザ拡張ツールで、AIモデルが直接ユーザーのブラウザを制御でき、既存のログイン状態、ブックマークなどのデータを利用して自動化操作を行います。複数のブラウザとAIモデルをサポートし、プライバシー保護に配慮しています。
JavaScript
9.9K
5ポイント
N
Notte Browser
認証済み
NotteはオープンソースのフルスタックネットワークAIエージェントフレームワークで、ブラウザセッション、自動化されたLLM駆動エージェント、ウェブページの監視と操作、資格情報管理などの機能を提供し、インターネットをエージェントに優しい環境に変え、自然言語でウェブサイトの構造を記述することでLLMの認知負荷を軽減することを目的としています。
14.3K
4.5ポイント
B
Bing Search MCP
Microsoft Bing検索APIを統合するためのMCPサーバーで、ウェブページ、ニュース、画像の検索機能をサポートし、AIアシスタントにウェブ検索機能を提供します。
Python
13.9K
4ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
15.1K
4.8ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
42.9K
4.7ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
13.4K
4.5ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
23.4K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
12.0K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
14.9K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
15.6K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
21.3K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIBase