ブラウザエージェントプロトコル(BAP)は、AIエージェントがウェブブラウザと対話するために設計されたオープン標準で、CLIとMCPの2種類のインターフェースを提供し、セマンティックセレクター、複合操作、構造化データ抽出などの機能をサポートしています。
2.5ポイント
4.6K

BAP MCPサーバーとは?

BAP MCPサーバーは、Model Context Protocolに基づくツールで、AIアシスタント(Claude、Codexなど)がウェブブラウザを直接操作できるようにします。ナビゲート、要素クリック、フォーム入力、スクリーンショット、データ抽出など23種類のブラウザ操作ツールを提供し、AIアシスタントが人間のようにウェブページを閲覧し操作できるようにします。

BAP MCPサーバーの使い方は?

BAP MCPサーバーをインストールすると、AIアシスタントは自動的にブラウザ操作機能を獲得します。自然言語でアシスタントに指示を与えることができます。例えば、「Hacker Newsを開き、最初の5つのニュースを要約する」と指示すると、アシスタントはBAPツールを使って自動的にこれらの操作を実行します。

適用シーン

BAPは、自動化されたウェブ操作が必要なシーンに適しています。データ収集、ウェブテスト、自動化タスク、コンテンツ分析、価格監視、ニュース集約、フォーム入力、ウェブページのスクリーンショットなどです。

主要機能

複合操作
複数のステップ(ナビゲート+観察+クリックなど)を1つのコマンドで実行でき、段階的な操作よりもトークンを40倍節約できます。
融合操作
ナビゲート+観察、操作+観察などを1つのサーバー呼び出しにまとめ、往復通信を50 - 85%削減します。
セマンティックセレクター
要素の位置ではなく、要素の用途(例:'role:button:"送信"')で要素を特定します。ウェブページが再設計されても正常に動作します。
構造化抽出
JSON Schemaを使用して、任意のウェブページから構造化データを抽出し、データ形式が正しいことを保証します。
アクセシビリティ優先設計
アクセシビリティツリーチェックに基づいて構築され、AIが理解しやすいように設計されており、明確なページ構造情報を提供します。
要素参照
安定した要素参照(@e1、e15など)を提供し、複数の観察間で一貫性を保ちます。
スクリーンショット注釈
視覚モデルに番号付きのマークが付いたスクリーンショットオーバーレイを提供し、AIがページ要素を識別しやすくします。
利点
APIキー不要で、完全にローカルで実行されるため、プライバシーが保護されます。
Chrome、Firefox、WebKit、Edgeなど、複数のブラウザをサポートします。
一般的なブラウザ操作のニーズをカバーする23種類のツールを提供します。
セマンティックセレクターにより、操作がより安定し、ページレイアウトの変更の影響を受けにくくなります。
複合操作により、AIアシスタントの思考ステップとトークン消費が大幅に削減されます。
Claude、Codex、Gemini、Cursorなどの主流のAIプラットフォームをサポートします。
制限
Node.jsとnpm/npxをローカルにインストールする必要があります。
初回実行時にブラウザをダウンロードする必要があります(約100 - 300MB)。
複雑なウェブページでは、セレクターを手動で調整する必要がある場合があります。
JavaScriptが多く使われているページでは、追加の待機時間が必要になる場合があります。
AIアシスタントがMCPプロトコルをサポートしている必要があり、完全な機能を使用するにはそれが必要です。

使い方

BAP MCPサーバーのインストール
npmを使ってグローバルにインストールするか、npxを使って直接実行します。
AIアシスタントの設定
使用しているAIアシスタントプラットフォームに応じて、BAP MCPサーバーを設定に追加します。
使用開始
AIアシスタントを再起動し、自然言語でブラウザを操作できるようになります。

使用例

ニュース集約と要約
自動的にニュースサイトにアクセスし、トップニュースを収集して要約を生成します。
自動フォーム入力
自動的にサイトにログインしたり、オンラインフォームを入力します。
価格監視と比較
電子商取引サイトから商品価格情報を抽出します。
ウェブページのスクリーンショットとアーカイブ
自動的にウェブページの内容をスクリーンショットし、アーカイブまたは共有に使用します。

よくある質問

BAPはネットワーク接続が必要ですか?
どのブラウザをサポートしていますか?
ページ上の特定の要素をどのように選択しますか?
BAPはログインが必要なサイトを処理できますか?
インストールに必要なディスク容量はどれくらいですか?
BAPは安全ですか?閲覧データを保存しますか?

関連リソース

GitHubリポジトリ
BAPのソースコード、問題追跡、コントリビューションガイド
npmパッケージページ
MCPサーバーのnpmパッケージ情報とバージョン履歴
CLIドキュメント
コマンドラインインターフェイスの詳細な使用方法とサンプル
MCPプロトコルドキュメント
MCPサーバーのツールリファレンスと設定説明
Python SDK
PythonバージョンのBAPクライアントSDK

インストール

以下のコマンドをクライアントにコピーして設定
{
  "mcpServers": {
    "bap-browser": {
      "command": "npx",
      "args": ["-y", "@browseragentprotocol/mcp"]
    }
  }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

V
Vestige
Vestigeは認知科学に基づくAI記憶エンジンで、予測誤差ゲート、FSRS - 6間隔反復、記憶の夢など29の神経科学モジュールを実装することで、AIに長期記憶能力を提供します。3D可視化ダッシュボードと21のMCPツールを備え、完全にローカルで動作し、クラウドは必要ありません。
Rust
4.8K
4.5ポイント
M
Moltbrain
MoltBrainは、OpenClaw、MoltBook、Claude Code用に設計された長期記憶層プラグインで、自動的にプロジェクトのコンテキストを学習し、思い出すことができます。スマートな検索、観察記録、分析統計、永続的なストレージ機能を提供します。
TypeScript
5.4K
4.5ポイント
B
Bm.md
機能豊富なMarkdown排版ツールで、様々なスタイルテーマとプラットフォーム対応をサポートし、リアルタイム編集プレビュー、画像エクスポート、API統合機能を提供します
TypeScript
4.9K
5ポイント
S
Security Detections MCP
Security Detections MCPは、Model Context Protocolに基づくサーバーで、LLMがSigma、Splunk ESCU、Elastic、KQL形式を含む統一されたセキュリティ検出ルールデータベースをクエリできます。最新のバージョン3.0は自律型検出エンジニアリングプラットフォームにアップグレードされ、自動的に脅威インテリジェンスからTTPを抽出し、カバレッジのギャップを分析し、SIEMネイティブ形式の検出ルールを生成し、テストを実行して検証できます。プロジェクトには71以上のツール、11の事前構築されたワークフロープロンプト、および知識グラフシステムが含まれ、複数のSIEMプラットフォームをサポートしています。
TypeScript
6.2K
4ポイント
P
Paperbanana
Python
6.4K
5ポイント
B
Better Icons
20万以上のアイコンの検索と検索を提供するMCPサーバーとCLIツールで、150以上のアイコンライブラリをサポートし、AIアシスタントと開発者が迅速にアイコンを取得して使用できるように支援します。
TypeScript
6.0K
4.5ポイント
A
Assistant Ui
assistant-uiは、生産レベルのAIチャットインターフェイスを迅速に構築するためのオープンソースのTypeScript/Reactライブラリで、組み合わせ可能なUIコンポーネント、ストリーミング応答、アクセシビリティなどの機能を提供し、複数のAIバックエンドとモデルをサポートしています。
TypeScript
7.7K
5ポイント
A
Apify MCP Server
Apify MCPサーバーは、モデルコンテキストプロトコル(MCP)に基づくツールで、AIアシスタントが数千の既成のクローラー、スクレイパー、自動化ツール(Apifyアクター)を通じて、ソーシャルメディア、検索エンジン、電子商取引などのウェブサイトからデータを抽出できるようにします。OAuthとSkyfireプロキシ支払いをサポートしており、HTTPSエンドポイントまたはローカルのstdio方式でClaude、VS CodeなどのMCPクライアントに統合できます。
TypeScript
7.7K
5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
24.9K
4.8ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
18.5K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
77.5K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
36.0K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
22.1K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
28.0K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
19.5K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
30.8K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2026AIBase