Bap
ブラウザエージェントプロトコル(BAP)は、AIエージェントがウェブブラウザと対話するために設計されたオープン標準で、CLIとMCPの2種類のインターフェースを提供し、セマンティックセレクター、複合操作、構造化データ抽出などの機能をサポートしています。
スコア : 2.5ポイント
ダウンロード数 : 4.6K
BAP MCPサーバーとは?
BAP MCPサーバーは、Model Context Protocolに基づくツールで、AIアシスタント(Claude、Codexなど)がウェブブラウザを直接操作できるようにします。ナビゲート、要素クリック、フォーム入力、スクリーンショット、データ抽出など23種類のブラウザ操作ツールを提供し、AIアシスタントが人間のようにウェブページを閲覧し操作できるようにします。BAP MCPサーバーの使い方は?
BAP MCPサーバーをインストールすると、AIアシスタントは自動的にブラウザ操作機能を獲得します。自然言語でアシスタントに指示を与えることができます。例えば、「Hacker Newsを開き、最初の5つのニュースを要約する」と指示すると、アシスタントはBAPツールを使って自動的にこれらの操作を実行します。適用シーン
BAPは、自動化されたウェブ操作が必要なシーンに適しています。データ収集、ウェブテスト、自動化タスク、コンテンツ分析、価格監視、ニュース集約、フォーム入力、ウェブページのスクリーンショットなどです。主要機能
複合操作
複数のステップ(ナビゲート+観察+クリックなど)を1つのコマンドで実行でき、段階的な操作よりもトークンを40倍節約できます。
融合操作
ナビゲート+観察、操作+観察などを1つのサーバー呼び出しにまとめ、往復通信を50 - 85%削減します。
セマンティックセレクター
要素の位置ではなく、要素の用途(例:'role:button:"送信"')で要素を特定します。ウェブページが再設計されても正常に動作します。
構造化抽出
JSON Schemaを使用して、任意のウェブページから構造化データを抽出し、データ形式が正しいことを保証します。
アクセシビリティ優先設計
アクセシビリティツリーチェックに基づいて構築され、AIが理解しやすいように設計されており、明確なページ構造情報を提供します。
要素参照
安定した要素参照(@e1、e15など)を提供し、複数の観察間で一貫性を保ちます。
スクリーンショット注釈
視覚モデルに番号付きのマークが付いたスクリーンショットオーバーレイを提供し、AIがページ要素を識別しやすくします。
利点
APIキー不要で、完全にローカルで実行されるため、プライバシーが保護されます。
Chrome、Firefox、WebKit、Edgeなど、複数のブラウザをサポートします。
一般的なブラウザ操作のニーズをカバーする23種類のツールを提供します。
セマンティックセレクターにより、操作がより安定し、ページレイアウトの変更の影響を受けにくくなります。
複合操作により、AIアシスタントの思考ステップとトークン消費が大幅に削減されます。
Claude、Codex、Gemini、Cursorなどの主流のAIプラットフォームをサポートします。
制限
Node.jsとnpm/npxをローカルにインストールする必要があります。
初回実行時にブラウザをダウンロードする必要があります(約100 - 300MB)。
複雑なウェブページでは、セレクターを手動で調整する必要がある場合があります。
JavaScriptが多く使われているページでは、追加の待機時間が必要になる場合があります。
AIアシスタントがMCPプロトコルをサポートしている必要があり、完全な機能を使用するにはそれが必要です。
使い方
BAP MCPサーバーのインストール
npmを使ってグローバルにインストールするか、npxを使って直接実行します。
AIアシスタントの設定
使用しているAIアシスタントプラットフォームに応じて、BAP MCPサーバーを設定に追加します。
使用開始
AIアシスタントを再起動し、自然言語でブラウザを操作できるようになります。
使用例
ニュース集約と要約
自動的にニュースサイトにアクセスし、トップニュースを収集して要約を生成します。
自動フォーム入力
自動的にサイトにログインしたり、オンラインフォームを入力します。
価格監視と比較
電子商取引サイトから商品価格情報を抽出します。
ウェブページのスクリーンショットとアーカイブ
自動的にウェブページの内容をスクリーンショットし、アーカイブまたは共有に使用します。
よくある質問
BAPはネットワーク接続が必要ですか?
どのブラウザをサポートしていますか?
ページ上の特定の要素をどのように選択しますか?
BAPはログインが必要なサイトを処理できますか?
インストールに必要なディスク容量はどれくらいですか?
BAPは安全ですか?閲覧データを保存しますか?
関連リソース
GitHubリポジトリ
BAPのソースコード、問題追跡、コントリビューションガイド
npmパッケージページ
MCPサーバーのnpmパッケージ情報とバージョン履歴
CLIドキュメント
コマンドラインインターフェイスの詳細な使用方法とサンプル
MCPプロトコルドキュメント
MCPサーバーのツールリファレンスと設定説明
Python SDK
PythonバージョンのBAPクライアントSDK

Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
24.9K
4.8ポイント

Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
18.5K
4.5ポイント

Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
77.5K
4.7ポイント

Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
36.0K
4.5ポイント

Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
22.1K
4.3ポイント

Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
28.0K
5ポイント

Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
19.5K
5ポイント

Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
30.8K
4.5ポイント





