W

Web Crawler

WebクローラーMCPサーバーのデプロイガイド
2.5ポイント
59

WebクローラーMCPサーバーとは?

WebクローラーMCPサーバーは、Webページの内容を取得して分析するためのツールです。リンクをたどり、ページデータを収集することで、ウェブサイトの構造と内容を深く理解するのに役立ちます。

WebクローラーMCPサーバーの使い方は?

まず、必要な依存関係をインストールしてサーバーを起動し、次にMCPクライアントでタスクを設定してリクエストを送信します。

適用シナリオ

SEO分析、コンテンツ収集、競合情報収集、ウェブサイトの健全性チェックなどのシナリオに適しています。

主要機能

深層クローリング最大クローリング深度を設定して、クローラーの動作を制限できます。
並列制御最大並列リクエスト数を設定して、システムパフォーマンスを最適化できます。
カスタム遅延リクエスト間隔時間を調整することで、ターゲットサイトに過度の負荷をかけないようにします。

利点と制限

利点
効率的なWebページ取得能力。
さまざまなニーズに対応する柔軟な設定オプション。
既存のMCPフレームワークに容易に統合できる。
制限
初期デプロイには一定の技術的背景が必要です。
非常に複雑な動的Webページ構造を処理できない場合があります。

使い方

コードリポジトリをクローンする
以下のコマンドを実行してプロジェクトコードをクローンします:git clone https://github.com/jitsmaster/web-crawler-mcp.git。
依存関係をインストールする
プロジェクトディレクトリに移動して、npm installコマンドを実行して必要な依存関係をインストールします。
プロジェクトをビルドする
インストールが完了したら、npm run buildを実行して実行可能ファイルを生成します。
サーバーを起動する
最後にnpm startを実行してWebクローラーMCPサーバーを起動します。

使用例

指定URLをクローリングするサーバーに簡単なクローリングリクエストを送信します。例えば、example.comのホームページをクローリングします。
深層クローリングの例example.comの複数階層のページをクローリングしてみます。

よくある質問

Node.jsとnpmをどのようにインストールしますか?
現在のクローリング進捗状況をどのように確認しますか?
HTTPSプロトコルをサポートしていますか?

関連リソース

GitHubコードリポジトリ
公式のオープンソースコードリポジトリで、完全なドキュメントとサンプルが含まれています。
MCP公式ドキュメント
MCPプロトコルの基礎知識と高度な使い方を学びます。
ビデオチュートリアル
WebクローラーMCPサーバーをすばやく使い始めるための入門ビデオです。
インストール
以下のコマンドをクライアントにコピーして設定
{
  "mcpServers": {
    "web-crawler": {
      "command": "node",
      "args": ["/path/to/web-crawler/build/index.js"],
      "env": {
        "CRAWL_LINKS": "false",
        "MAX_DEPTH": "3",
        "REQUEST_DELAY": "1000",
        "TIMEOUT": "5000",
        "MAX_CONCURRENT": "5"
      }
    }
  }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。
S
Search1api
Search1API MCPサーバーは、Model Context Protocol (MCP)に基づくサーバーで、検索とクローリング機能を提供し、複数の検索サービスとツールをサポートします。
TypeScript
322
4ポイント
D
Duckduckgo MCP Server
認証済み
DuckDuckGo検索MCPサーバーは、ClaudeなどのLLMにウェブ検索とコンテンツ取得サービスを提供します。
Python
803
4.3ポイント
M
MCP Server Airbnb
認証済み
Airbnbの宿泊施設検索と詳細照会のMCPサービス
TypeScript
236
4ポイント
M
MCP Alchemy
認証済み
MCPアルケミーは、Claude Desktopと複数のデータベースを接続するツールで、SQLクエリ、データベース構造分析、データレポート生成をサポートします。
Python
307
4.2ポイント
P
Postgresql MCP
FastMCPライブラリに基づくPostgreSQLデータベースのMCPサービスで、指定されたテーブルのCRUD操作、スキーマ検査、およびカスタムSQLクエリ機能を提供します。
Python
91
4ポイント
M
MCP Scan
MCP-Scanは、MCPサーバー用のセキュリティスキャンツールで、提示注入、ツール汚染、クロスドメインアップグレードなどの一般的なセキュリティホールを検出します。
Python
605
5ポイント
A
Agentic Radar
エージェンティックレーダーは、エージェントシステムを分析・評価するセキュリティスキャナーで、開発者、研究者、セキュリティ専門家がエージェントシステムのワークフローを理解し、潜在的なホールを特定するのに役立ちます。
Python
538
5ポイント
C
Cloudflare
Changesetsは、マルチパッケージまたはシングルパッケージのリポジトリのバージョン管理とリリースを管理するためのビルドツールです。
TypeScript
1.5K
5ポイント
厳選MCPサービス
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
252
4.8ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
5.2K
4.7ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
276
4.5ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
705
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
70
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
541
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
1.7K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
259
4.5ポイント
AIbase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIbase