Web Crawler MCP Server
W

Web Crawler MCP Server

MCPプロトコルに基づくウェブクローリングサービスで、AIアシスタントにウェブページ内容の抽出機能を提供し、反クローラーメカニズムを迂回してフォーマットされたテキストを返すことができます。
2ポイント
8.5K

Web Crawler MCPサーバーとは?

Web Crawler MCPサーバーは、Model Context Protocol(MCP)に基づくツールで、任意の公開ウェブページからメインテキスト内容を抽出してクリーニングすることができます。Puppeteerと反クローラー防止プラグインを利用して、内容抽出の正確性と互換性を確保します。

Web Crawler MCPサーバーの使い方は?

簡単な設定とURLの入力で、ウェブページの主要なテキスト内容をすぐに取得できます。研究用途でも他のツールに統合する場合でも、非常に便利です。

適用シナリオ

ウェブページからテキスト内容を抽出する必要がある研究者、開発者、AIアシスタントユーザーに適しています。例えば、ニュース記事、研究報告書、製品レビューの抽出などです。

主要機能

ウェブページのテキスト抽出
指定されたURLからウェブページの主要なテキスト内容を抽出し、不要な広告やその他の干渉要素を除去します。
内容のクリーニングと最適化
HTMLタグや空白文字を自動的にクリーニングし、読みやすく処理しやすいクリーンなテキストを生成します。
反クローラーメカニズムを迂回する
Puppeteerと反クローラー防止プラグインを利用して、一般的な反クローラー保護措置を突破します。
AIアシスタントとの統合
Claude Desktop、CursorなどのMCP互換のAIアシスタントとのシームレスな接続をサポートします。
利点
強力なウェブページ解析能力で、複雑なページ構造にも対応
組み込みの反クローラーメカニズムで、安定性と信頼性を向上
出力形式が簡単で使いやすく、AIモデルに直接入力するのに適している
複数のデバイスとオペレーティングシステムをサポート
制限
一定のネットワーク環境のサポートが必要
一部の高度に動的なウェブページでは追加の設定が必要な場合がある
実行環境としてNode.jsのインストールが必要

使い方

依存関係のインストール
ローカルコンピューターにNode.jsをインストールし、サーバーのソースコードをダウンロードします。
サーバーの構築
TypeScriptコードをコンパイルして実行可能ファイルを生成します。
サーバーの起動
サーバースクリプトを実行してサービスを開始します。
クライアントの設定
サーバーアドレスをあなたのMCPクライアント設定に追加します。

使用例

ニュース記事の抽出
ニュースサイトから最新の報道の本文内容を抽出します。
製品レビューのクリーニング
電子商取引サイトからユーザーレビューを抽出し、関係のない情報を除去します。

よくある質問

Web Crawler MCPサーバーは無料で使用できますか?
反クローラー問題をどのように解決しますか?
中国語のウェブページに対応していますか?

関連リソース

公式ドキュメント
詳細なサーバーの使用ガイドと技術ドキュメント。
GitHubリポジトリ
プロジェクトのソースコードと更新履歴。
インストールチュートリアル動画
サーバーのインストールと設定方法をすぐに理解できます。

インストール

以下のコマンドをクライアントにコピーして設定
{
  "mcpServers": {
    "web-crawler-mcp": {
      "command": "node",
      "args": ["<absolute-path-to>/server/web_crawler/build/index.js"]
    }
  }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

R
Rsdoctor
Rsdoctorは、Rspackエコシステム向けに開発されたビルド分析ツールで、webpackと完全に互換性があり、可視化ビルド分析、多次元パフォーマンス診断、インテリジェントな最適化提案を提供し、開発者がビルド効率とエンジニアリング品質を向上させるのに役立ちます。
TypeScript
8.7K
5ポイント
N
Next Devtools MCP
Next.js開発ツールのMCPサーバーです。ClaudeやCursorなどのAIプログラミングアシスタントにNext.js開発ツールとユーティリティを提供します。実行時診断、開発自動化、およびドキュメントアクセス機能が含まれています。
TypeScript
8.4K
5ポイント
T
Testkube
Testkubeは、クラウドネイティブアプリケーション向けのテストオーケストレーションと実行フレームワークで、テストの定義、実行、分析を行うための統一プラットフォームを提供します。既存のテストツールとKubernetesインフラストラクチャをサポートします。
Go
6.2K
5ポイント
M
MCP Windbg
AIモデルをWinDbg/CDBに統合するMCPサーバーで、Windowsのクラッシュダンプファイルの分析とリモートデバッグに使用し、自然言語での対話を通じてデバッグコマンドを実行できます。
Python
8.6K
5ポイント
R
Runno
Runnoは、JavaScriptツールキットのセットで、ブラウザやNode.jsなどの環境で複数のプログラミング言語のコードを安全に実行するためのものです。WebAssemblyとWASIを通じてサンドボックス化された実行を実現し、Python、Ruby、JavaScript、SQLite、C/C++などの言語をサポートし、Webコンポーネント、MCPサーバーなどの統合方法を提供します。
TypeScript
7.5K
5ポイント
P
Praisonai
PraisonAIは、自動反省機能を備えた本番環境で使用可能な多AIエージェントフレームワークです。簡単なタスクから複雑な課題まで、様々な問題を自動的に解決するAIエージェントを作成することを目的としています。PraisonAIエージェント、AG2、CrewAIを低コードソリューションに統合することで、多エージェントLLMシステムの構築と管理を簡素化し、簡単さ、カスタマイズ性、および効果的な人間との協働を重視しています。
Python
6.2K
5ポイント
N
Netdata
Netdataはオープンソースのリアルタイムインフラストラクチャ監視プラットフォームで、毎秒の指標収集、可視化、機械学習による異常検出、自動化アラートを提供し、複雑な構成なしで全スタックの監視を実現します。
Go
9.6K
5ポイント
M
MCP Server
Mapbox MCPサーバーは、Node.jsで実装されたモデルコンテキストプロトコルサーバーで、AIアプリケーションにMapboxの地理空間APIへのアクセス機能を提供します。地理コーディング、興味のある場所の検索、ルート計画、等時線分析、静的地図生成などの機能が含まれます。
TypeScript
7.7K
4ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
22.1K
4.8ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
15.3K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
65.5K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
32.8K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
18.1K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
22.7K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
17.4K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
28.1K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2026AIBase