Web Crawler MCP Server
W

Web Crawler MCP Server

MCPプロトコルに基づくウェブクローリングサービスで、AIアシスタントにウェブページ内容の抽出機能を提供し、反クローラーメカニズムを迂回してフォーマットされたテキストを返すことができます。
2ポイント
7.4K

Web Crawler MCPサーバーとは?

Web Crawler MCPサーバーは、Model Context Protocol(MCP)に基づくツールで、任意の公開ウェブページからメインテキスト内容を抽出してクリーニングすることができます。Puppeteerと反クローラー防止プラグインを利用して、内容抽出の正確性と互換性を確保します。

Web Crawler MCPサーバーの使い方は?

簡単な設定とURLの入力で、ウェブページの主要なテキスト内容をすぐに取得できます。研究用途でも他のツールに統合する場合でも、非常に便利です。

適用シナリオ

ウェブページからテキスト内容を抽出する必要がある研究者、開発者、AIアシスタントユーザーに適しています。例えば、ニュース記事、研究報告書、製品レビューの抽出などです。

主要機能

ウェブページのテキスト抽出
指定されたURLからウェブページの主要なテキスト内容を抽出し、不要な広告やその他の干渉要素を除去します。
内容のクリーニングと最適化
HTMLタグや空白文字を自動的にクリーニングし、読みやすく処理しやすいクリーンなテキストを生成します。
反クローラーメカニズムを迂回する
Puppeteerと反クローラー防止プラグインを利用して、一般的な反クローラー保護措置を突破します。
AIアシスタントとの統合
Claude Desktop、CursorなどのMCP互換のAIアシスタントとのシームレスな接続をサポートします。
利点
強力なウェブページ解析能力で、複雑なページ構造にも対応
組み込みの反クローラーメカニズムで、安定性と信頼性を向上
出力形式が簡単で使いやすく、AIモデルに直接入力するのに適している
複数のデバイスとオペレーティングシステムをサポート
制限
一定のネットワーク環境のサポートが必要
一部の高度に動的なウェブページでは追加の設定が必要な場合がある
実行環境としてNode.jsのインストールが必要

使い方

依存関係のインストール
ローカルコンピューターにNode.jsをインストールし、サーバーのソースコードをダウンロードします。
サーバーの構築
TypeScriptコードをコンパイルして実行可能ファイルを生成します。
サーバーの起動
サーバースクリプトを実行してサービスを開始します。
クライアントの設定
サーバーアドレスをあなたのMCPクライアント設定に追加します。

使用例

ニュース記事の抽出
ニュースサイトから最新の報道の本文内容を抽出します。
製品レビューのクリーニング
電子商取引サイトからユーザーレビューを抽出し、関係のない情報を除去します。

よくある質問

Web Crawler MCPサーバーは無料で使用できますか?
反クローラー問題をどのように解決しますか?
中国語のウェブページに対応していますか?

関連リソース

公式ドキュメント
詳細なサーバーの使用ガイドと技術ドキュメント。
GitHubリポジトリ
プロジェクトのソースコードと更新履歴。
インストールチュートリアル動画
サーバーのインストールと設定方法をすぐに理解できます。

インストール

以下のコマンドをクライアントにコピーして設定
{
  "mcpServers": {
    "web-crawler-mcp": {
      "command": "node",
      "args": ["<absolute-path-to>/server/web_crawler/build/index.js"]
    }
  }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

A
Acemcp
Acemcpは、コードライブラリのインデックス化と意味検索を行うMCPサーバーです。自動増分インデックス、複数エンコーディングファイルの処理、.gitignore統合、およびWeb管理インターフェイスをサポートしており、開発者がコードのコンテキストをすばやく検索し、理解するのに役立ちます。
Python
9.2K
5ポイント
B
Blueprint MCP
Blueprint MCPは、Arcadeエコシステムに基づくチャート生成ツールで、Nano Banana Proなどの技術を利用して、コードベースとシステムアーキテクチャを分析し、アーキテクチャ図、フローチャートなどのビジュアルチャートを自動生成し、開発者が複雑なシステムを理解するのを支援します。
Python
8.1K
4ポイント
M
MCP Agent Mail
MCPエージェントメールは、AIプログラミングエージェント向けのメール形式の調整レイヤーで、ID管理、メッセージの送受信、ファイルの予約、検索機能を提供し、複数のエージェントの非同期協力と競合の回避をサポートします。
Python
8.4K
5ポイント
K
Klavis
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
TypeScript
13.9K
5ポイント
M
MCP
Microsoft公式のMCPサーバーで、AIアシスタントに最新のMicrosoft技術ドキュメントの検索と取得機能を提供します。
11.9K
5ポイント
A
Aderyn
アデリンは、Rustで書かれたオープンソースのSolidityスマートコントラクト静的分析ツールで、開発者やセキュリティ研究者がSolidityコードの脆弱性を発見するのを支援します。FoundryとHardhatプロジェクトをサポートし、複数の形式のレポートを生成でき、VSCode拡張機能も提供します。
Rust
10.6K
5ポイント
D
Devtools Debugger MCP
Node.jsデバッガーMCPサーバーは、Chrome DevToolsプロトコルに基づく完全なデバッグ機能を提供します。ブレークポイントの設定、ステップ実行、変数のチェック、式の評価などが含まれます。
TypeScript
8.9K
4ポイント
S
Scrapling
Scraplingは適応型ウェブページのスクレイピングライブラリで、ウェブサイトの変化を自動的に学習し、要素を再配置します。複数のスクレイピング方法とAI統合をサポートし、高性能な解析と開発者に優しい体験を提供します。
Python
10.7K
5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
17.6K
4.8ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
57.2K
4.7ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
14.6K
4.5ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
28.9K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
14.8K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
18.7K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
17.2K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
24.4K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIBase