Browsercontrol
BrowserControlは、AIエージェントに対して、視覚優先のアプローチを用いた、本物のブラウザ自動化機能を提供するMCPサーバーです。番号付きの要素を使用して、クリック、入力などのインタラクションを実行でき、CSSセレクタやXPathは必要ありません。
2.5ポイント
4.9K

BrowserControlとは?

BrowserControlは、AIエージェントに完全なブラウザ制御機能を与えるMCP(モデルコンテキストプロトコル)サーバーです。従来のテキストベースのブラウザ自動化とは異なり、BrowserControlは視覚優先のアプローチを採用しています。AIは番号が付けられたウェブページのスクリーンショットを見ることができ、クリックする数字を指定するだけで、対応する操作を実行することができます。この方法は、人間がウェブページを閲覧する方法に近く、AIとウェブページのインタラクションの複雑さを大幅に軽減します。

BrowserControlの使い方は?

BrowserControlはMCPサーバーとして動作し、MCPプロトコルをサポートする任意のAIエージェント(Claude、Geminiなど)またはIDEと統合することができます。インストール後、AIエージェントはナビゲーション、クリック、入力、フォーム入力、タブ管理などの一連のブラウザ制御ツールを利用できるようになります。AIは番号が付けられたウェブページのスクリーンショットを見て、インタラクティブな要素を識別し、対応するツールを呼び出して操作を実行します。

適用シーン

BrowserControlは、AIがウェブページとインタラクションする必要があるさまざまなシーンに適用できます。 1. ウェブページの自動テスト:AIにウェブサイトの機能とフローを自動テストさせる 2. データ収集と監視:定期的にウェブサイトにアクセスして最新情報を取得する 3. 自動化ワークフロー:フォームの自動入力、申請の自動送信などの繰り返しタスクを実行する 4. ウェブページの内容分析:AIにウェブページの内容を閲覧させ、分析させる 5. ユーザー行動のシミュレーション:実際のユーザーとウェブサイトのインタラクションプロセスをシミュレートする

主要機能

視覚優先方法(Set of Marks)
各ウェブページのスクリーンショットには、自動的にインタラクティブな要素に番号が付けられます。AIは数字を識別し、対応する操作を呼び出すだけでよく、複雑なHTML構造やCSSセレクタを理解する必要はありません。
多タブ管理
ブラウザのタブの作成、切り替え、閉じる、およびすべての開いているタブの一覧表示をサポートしています。AIは複数のウェブページ間を自由に切り替え、協調動作を行うことができます。
セッションとCookie管理
完全なCookie操作ツールを提供し、Cookieの設定、取得、削除、およびクリアをサポートしています。これにより、持続的なログイン状態を維持することができます。
ファイルアップロードサポート
ネイティブのファイルアップロードツールを提供しています。AIは複雑なシミュレーション操作を必要とせずに、ウェブページのファイルアップロードフォームを簡単に処理することができます。
開発者ツールセット
コンソールログの表示、ネットワークリクエストの監視、ページエラーの検出、要素の検査などの専門的なデバッグツールが含まれています。これらのツールは、AIがウェブページの問題を診断するのに役立ちます。
セッション録画機能
完全なブラウザセッションの録画をサポートしており、再生可能な記録ファイルを生成します。これは、AIの操作プロセスのデバッグやレビューに便利です。
動的ビューポート制御
ブラウザウィンドウのサイズをいつでも調整することができ、異なるデバイス(携帯電話、タブレット、デスクトップなど)の表示效果をシミュレートすることができます。
永続的なセッション
ブラウザの状態(Cookie、localStorageなど)を自動的に保存します。AIが再起動した後も、以前のログイン状態と閲覧履歴を保持することができます。
利点
直感的で使いやすい:視覚優先の方法により、AIがウェブページを操作するのがより簡単で直感的になります。
機能が充実している:基本的なナビゲーションから高度なデバッグまで、完全なツールセットを提供しています。
持続的で安定している:セッション状態を自動的に保存するため、繰り返しのログインを避けることができます。
完全にローカルで動作する:すべての操作はローカルで行われ、クラウドサービスは必要ありません。
無料で利用できる:オープンソースで無料であり、使用料はかかりません。
互換性が良好:すべてのMCP互換のAIエージェントとIDEをサポートしています。
制限
インストールが必要:Python環境とChromiumブラウザが必要です。
リソースを消費する:ブラウザインスタンスを実行するには、一定のメモリとCPUリソースが必要です。
視覚に依存する:AIの視覚認識能力に依存しているため、複雑なレイアウトの場合、正確に認識できない可能性があります。
学習曲線がある:AIが番号付きのマークシステムを効果的に使用する方法を学習する必要があります。

使い方

BrowserControlのインストール
pipまたはuvを使用してBrowserControlパッケージをインストールします。
MCPサーバーの起動
BrowserControlをMCPサーバーとして起動します。
AIエージェントの設定
AIエージェント(Claude Desktopなど)の設定ファイルにBrowserControlサーバーを追加します。
使用開始
AIエージェントを再起動すると、AIはブラウザ制御機能を使用できるようになります。

使用例

ウェブページの自動テスト
AIにウェブサイトのログイン機能を自動テストさせ、ログインフローが正常に動作するかを検証します。
データ収集タスク
AIにニュースウェブサイトに定期的にアクセスさせ、最新のニュースのタイトルとリンクを収集します。
多段階フォームの入力
AIに複雑な多ページのフォームを入力させ、送信させます。
ウェブページのデバッグと診断
AIにウェブページの読み込み問題を診断させ、エラーを報告させます。

よくある質問

BrowserControlはネットワーク接続が必要ですか?
どのブラウザをサポートしていますか?
「Missing X server」エラーを解決するにはどうすればいいですか?
BrowserControlは安全ですか?
録画されたセッションをどうやって見ることができますか?
モバイルデバイスのシミュレーションをサポートしていますか?

関連リソース

GitHubリポジトリ
BrowserControlのソースコードと最新バージョン
MCPプロトコルドキュメント
Model Context Protocolの公式ドキュメント
Playwrightドキュメント
BrowserControlが基盤として使用しているブラウザ自動化フレームワーク
FastMCPドキュメント
BrowserControlが使用しているMCPサーバーフレームワーク
問題フィードバック
バグを報告したり、新機能をリクエストしたりする

インストール

以下のコマンドをクライアントにコピーして設定
{
  "mcpServers": {
    "browsercontrol": {
      "command": "browsercontrol"
    }
  }
}

{
  "mcpServers": [
    {
      "name": "browsercontrol",
      "command": "browsercontrol"
    }
  ]
}

{
  "mcpServers": {
    "browsercontrol": {
      "command": "uvx",
      "args": ["browsercontrol"]
    }
  }
}

{
  "mcpServers": {
    "browsercontrol": {
      "command": "pipx",
      "args": ["run", "browsercontrol"]
    }
  }
}

{
  "mcpServers": {
    "browsercontrol": {
      "command": "browsercontrol",
      "env": {
        "BROWSER_HEADLESS": "false",
        "BROWSER_VIEWPORT_WIDTH": "1920",
        "BROWSER_VIEWPORT_HEIGHT": "1080",
        "LOG_LEVEL": "DEBUG"
      }
    }
  }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

B
Bm.md
機能豊富なMarkdown排版ツールで、様々なスタイルテーマとプラットフォーム対応をサポートし、リアルタイム編集プレビュー、画像エクスポート、API統合機能を提供します
TypeScript
3.8K
5ポイント
P
Paperbanana
Python
7.3K
5ポイント
B
Better Icons
20万以上のアイコンの検索と検索を提供するMCPサーバーとCLIツールで、150以上のアイコンライブラリをサポートし、AIアシスタントと開発者が迅速にアイコンを取得して使用できるように支援します。
TypeScript
5.9K
4.5ポイント
A
Assistant Ui
assistant-uiは、生産レベルのAIチャットインターフェイスを迅速に構築するためのオープンソースのTypeScript/Reactライブラリで、組み合わせ可能なUIコンポーネント、ストリーミング応答、アクセシビリティなどの機能を提供し、複数のAIバックエンドとモデルをサポートしています。
TypeScript
6.6K
5ポイント
A
Apify MCP Server
Apify MCPサーバーは、モデルコンテキストプロトコル(MCP)に基づくツールで、AIアシスタントが数千の既成のクローラー、スクレイパー、自動化ツール(Apifyアクター)を通じて、ソーシャルメディア、検索エンジン、電子商取引などのウェブサイトからデータを抽出できるようにします。OAuthとSkyfireプロキシ支払いをサポートしており、HTTPSエンドポイントまたはローカルのstdio方式でClaude、VS CodeなどのMCPクライアントに統合できます。
TypeScript
7.7K
5ポイント
R
Rsdoctor
Rsdoctorは、Rspackエコシステム向けに開発されたビルド分析ツールで、webpackと完全に互換性があり、可視化ビルド分析、多次元パフォーマンス診断、インテリジェントな最適化提案を提供し、開発者がビルド効率とエンジニアリング品質を向上させるのに役立ちます。
TypeScript
10.5K
5ポイント
N
Next Devtools MCP
Next.js開発ツールのMCPサーバーです。ClaudeやCursorなどのAIプログラミングアシスタントにNext.js開発ツールとユーティリティを提供します。実行時診断、開発自動化、およびドキュメントアクセス機能が含まれています。
TypeScript
10.8K
5ポイント
T
Testkube
Testkubeは、クラウドネイティブアプリケーション向けのテストオーケストレーションと実行フレームワークで、テストの定義、実行、分析を行うための統一プラットフォームを提供します。既存のテストツールとKubernetesインフラストラクチャをサポートします。
Go
7.6K
5ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
19.5K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
78.5K
4.7ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
24.9K
4.8ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
35.9K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
22.0K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
27.9K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
19.4K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
30.8K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2026AIBase