W

Web Crawler MCP Server

MCPプロトコルに基づくウェブクローリングサービスで、AIアシスタントにウェブページ内容の抽出機能を提供し、反クローラーメカニズムを迂回してフォーマットされたテキストを返すことができます。
2ポイント
13

Web Crawler MCPサーバーとは?

Web Crawler MCPサーバーは、Model Context Protocol(MCP)に基づくツールで、任意の公開ウェブページからメインテキスト内容を抽出してクリーニングすることができます。Puppeteerと反クローラー防止プラグインを利用して、内容抽出の正確性と互換性を確保します。

Web Crawler MCPサーバーの使い方は?

簡単な設定とURLの入力で、ウェブページの主要なテキスト内容をすぐに取得できます。研究用途でも他のツールに統合する場合でも、非常に便利です。

適用シナリオ

ウェブページからテキスト内容を抽出する必要がある研究者、開発者、AIアシスタントユーザーに適しています。例えば、ニュース記事、研究報告書、製品レビューの抽出などです。

主要機能

ウェブページのテキスト抽出指定されたURLからウェブページの主要なテキスト内容を抽出し、不要な広告やその他の干渉要素を除去します。
内容のクリーニングと最適化HTMLタグや空白文字を自動的にクリーニングし、読みやすく処理しやすいクリーンなテキストを生成します。
反クローラーメカニズムを迂回するPuppeteerと反クローラー防止プラグインを利用して、一般的な反クローラー保護措置を突破します。
AIアシスタントとの統合Claude Desktop、CursorなどのMCP互換のAIアシスタントとのシームレスな接続をサポートします。

利点と制限

利点
強力なウェブページ解析能力で、複雑なページ構造にも対応
組み込みの反クローラーメカニズムで、安定性と信頼性を向上
出力形式が簡単で使いやすく、AIモデルに直接入力するのに適している
複数のデバイスとオペレーティングシステムをサポート
制限
一定のネットワーク環境のサポートが必要
一部の高度に動的なウェブページでは追加の設定が必要な場合がある
実行環境としてNode.jsのインストールが必要

使い方

依存関係のインストール
ローカルコンピューターにNode.jsをインストールし、サーバーのソースコードをダウンロードします。
サーバーの構築
TypeScriptコードをコンパイルして実行可能ファイルを生成します。
サーバーの起動
サーバースクリプトを実行してサービスを開始します。
クライアントの設定
サーバーアドレスをあなたのMCPクライアント設定に追加します。

使用例

ニュース記事の抽出ニュースサイトから最新の報道の本文内容を抽出します。
製品レビューのクリーニング電子商取引サイトからユーザーレビューを抽出し、関係のない情報を除去します。

よくある質問

Web Crawler MCPサーバーは無料で使用できますか?
反クローラー問題をどのように解決しますか?
中国語のウェブページに対応していますか?

関連リソース

公式ドキュメント
詳細なサーバーの使用ガイドと技術ドキュメント。
GitHubリポジトリ
プロジェクトのソースコードと更新履歴。
インストールチュートリアル動画
サーバーのインストールと設定方法をすぐに理解できます。
インストール
以下のコマンドをクライアントにコピーして設定
{
  "mcpServers": {
    "web-crawler-mcp": {
      "command": "node",
      "args": ["<absolute-path-to>/server/web_crawler/build/index.js"]
    }
  }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。
S
Search1api
Search1API MCPサーバーは、Model Context Protocol (MCP)に基づくサーバーで、検索とクローリング機能を提供し、複数の検索サービスとツールをサポートします。
TypeScript
322
4ポイント
D
Duckduckgo MCP Server
認証済み
DuckDuckGo検索MCPサーバーは、ClaudeなどのLLMにウェブ検索とコンテンツ取得サービスを提供します。
Python
803
4.3ポイント
M
MCP Server Airbnb
認証済み
Airbnbの宿泊施設検索と詳細照会のMCPサービス
TypeScript
236
4ポイント
M
MCP Alchemy
認証済み
MCPアルケミーは、Claude Desktopと複数のデータベースを接続するツールで、SQLクエリ、データベース構造分析、データレポート生成をサポートします。
Python
307
4.2ポイント
P
Postgresql MCP
FastMCPライブラリに基づくPostgreSQLデータベースのMCPサービスで、指定されたテーブルのCRUD操作、スキーマ検査、およびカスタムSQLクエリ機能を提供します。
Python
91
4ポイント
M
MCP Scan
MCP-Scanは、MCPサーバー用のセキュリティスキャンツールで、提示注入、ツール汚染、クロスドメインアップグレードなどの一般的なセキュリティホールを検出します。
Python
605
5ポイント
A
Agentic Radar
エージェンティックレーダーは、エージェントシステムを分析・評価するセキュリティスキャナーで、開発者、研究者、セキュリティ専門家がエージェントシステムのワークフローを理解し、潜在的なホールを特定するのに役立ちます。
Python
538
5ポイント
C
Cloudflare
Changesetsは、マルチパッケージまたはシングルパッケージのリポジトリのバージョン管理とリリースを管理するためのビルドツールです。
TypeScript
1.5K
5ポイント
厳選MCPサービス
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
252
4.8ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
5.2K
4.7ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
276
4.5ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
705
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
70
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
541
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
1.7K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
259
4.5ポイント
AIbase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIbase