Mcpserver
MCPプロトコルに基づくTypeScriptのウェブクローリングサーバーで、複数のエクスポート形式、ヘッドレスブラウザー、カスタムルールセットをサポートし、さまざまなウェブページコンテンツ収集ニーズに適しています。
2ポイント
5.7K

WebスクレイパーMCPサーバーとは?

これはModel Context Protocol (MCP)に基づくウェブページコンテンツ収集サーバーで、ユーザーが様々なウェブサイトから構造化されたコンテンツを抽出するのを支援します。大量のウェブページ情報を取得する必要がある非技術者に特に適しています。

WebスクレイパーMCPサーバーの使い方は?

ターゲットのURLと簡単な設定パラメータを提供するだけで、サーバーが自動的にコンテンツを収集し、フォーマットされた内容を返します。コードを書かなくても複雑なウェブページ収集タスクを完了できます。

適用シナリオ

コンテンツ収集、市場調査、競合分析、ニュース集約、データアーカイブなど、さまざまなビジネスシナリオに適しています。特定のウェブサイトの更新を定期的に取得する必要があるユーザーに特に適しています。

主要機能

多形式エクスポート
収集したコンテンツをMarkdown、純テキスト、HTML、JSON形式でエクスポートすることをサポートし、さまざまな使用ニーズに対応します。
ヘッドレスブラウザーサポート
JavaScriptでレンダリングされる動的なページを処理でき、シングルページアプリケーション(SPA)のコンテンツ収集問題を解決します。
インテリジェントルールエンジン
複数の事前定義されたルールセットが組み込まれており、ウェブページの主要コンテンツ領域をインテリジェントに識別して抽出できます。
バッチ収集
複数のURLを同時に収集することをサポートし、データ収集の効率を向上させます。
カスタムリクエストヘッダー
特定のドメインのリクエストヘッダーを設定でき、ウェブサイトのログインと反スクレイピング制限を回避できます。
利点
使いやすく、プログラミング知識がなくても複雑な収集タスクを完了できます。
インテリジェントなコンテンツ識別が組み込まれており、広告や関係のないコンテンツを自動的にフィルタリングします。
現代のWebアプリケーション(SPA)の動的コンテンツの処理をサポートします。
柔軟なエクスポート形式の選択肢があり、さまざまなシナリオのニーズに対応します。
拡張可能なルールシステムで、カスタムコンテンツ抽出ルールをサポートします。
制限
高度に動的なページや複雑なインタラクションが必要なページに対するサポートが限られています。
大規模な収集を行う場合、プロキシIPの設定が必要になることがあります。
一部のウェブサイトには反スクレイピングメカニズムがあり、収集に失敗する可能性があります。
ヘッドレスブラウザーモードでは、多くのシステムリソースを消費します。

使い方

サーバーのインストール
プロジェクトをクローンし、必要な依存関係をインストールします。
サービスの起動
起動コマンドを実行してMCPサーバーを起動します。
リクエストの送信
HTTPリクエストを通じてサーバーが提供するさまざまなツールを呼び出します。

使用例

ニュース記事の収集
ニュースサイトから記事の本文を取得し、Markdown形式で保存します。
商品情報の一括取得
電子商取引サイトから複数の商品ページの重要な情報を収集します。
ログインが必要なコンテンツの収集
認証情報を設定して、ログインが必要なページのコンテンツを収集します。

よくある質問

なぜ一部のウェブサイトからコンテンツが収集できないのですか?
動的にロードされるコンテンツはどう処理すればいいですか?
ログインが必要なウェブサイトを収集できますか?
収集速度を上げるにはどうすればいいですか?
収集したコンテンツが正確でない場合はどうすればいいですか?

関連リソース

MCPプロトコルドキュメント
Model Context Protocolの公式ドキュメント
サンプルルールセット設定
一般的なウェブサイトのコンテンツ抽出ルールのサンプル
Puppeteer使用ガイド
ヘッドレスブラウザーPuppeteerの公式ドキュメント
Web収集のベストプラクティス
ウェブページ収集の倫理と法律ガイド

インストール

以下のコマンドをクライアントにコピーして設定
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

R
Rsdoctor
Rsdoctorは、Rspackエコシステム向けに開発されたビルド分析ツールで、webpackと完全に互換性があり、可視化ビルド分析、多次元パフォーマンス診断、インテリジェントな最適化提案を提供し、開発者がビルド効率とエンジニアリング品質を向上させるのに役立ちます。
TypeScript
8.7K
5ポイント
N
Next Devtools MCP
Next.js開発ツールのMCPサーバーです。ClaudeやCursorなどのAIプログラミングアシスタントにNext.js開発ツールとユーティリティを提供します。実行時診断、開発自動化、およびドキュメントアクセス機能が含まれています。
TypeScript
8.3K
5ポイント
T
Testkube
Testkubeは、クラウドネイティブアプリケーション向けのテストオーケストレーションと実行フレームワークで、テストの定義、実行、分析を行うための統一プラットフォームを提供します。既存のテストツールとKubernetesインフラストラクチャをサポートします。
Go
6.2K
5ポイント
M
MCP Windbg
AIモデルをWinDbg/CDBに統合するMCPサーバーで、Windowsのクラッシュダンプファイルの分析とリモートデバッグに使用し、自然言語での対話を通じてデバッグコマンドを実行できます。
Python
8.6K
5ポイント
R
Runno
Runnoは、JavaScriptツールキットのセットで、ブラウザやNode.jsなどの環境で複数のプログラミング言語のコードを安全に実行するためのものです。WebAssemblyとWASIを通じてサンドボックス化された実行を実現し、Python、Ruby、JavaScript、SQLite、C/C++などの言語をサポートし、Webコンポーネント、MCPサーバーなどの統合方法を提供します。
TypeScript
6.5K
5ポイント
P
Praisonai
PraisonAIは、自動反省機能を備えた本番環境で使用可能な多AIエージェントフレームワークです。簡単なタスクから複雑な課題まで、様々な問題を自動的に解決するAIエージェントを作成することを目的としています。PraisonAIエージェント、AG2、CrewAIを低コードソリューションに統合することで、多エージェントLLMシステムの構築と管理を簡素化し、簡単さ、カスタマイズ性、および効果的な人間との協働を重視しています。
Python
6.2K
5ポイント
N
Netdata
Netdataはオープンソースのリアルタイムインフラストラクチャ監視プラットフォームで、毎秒の指標収集、可視化、機械学習による異常検出、自動化アラートを提供し、複雑な構成なしで全スタックの監視を実現します。
Go
9.6K
5ポイント
M
MCP Server
Mapbox MCPサーバーは、Node.jsで実装されたモデルコンテキストプロトコルサーバーで、AIアプリケーションにMapboxの地理空間APIへのアクセス機能を提供します。地理コーディング、興味のある場所の検索、ルート計画、等時線分析、静的地図生成などの機能が含まれます。
TypeScript
6.7K
4ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
22.1K
4.8ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
15.3K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
65.5K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
31.7K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
19.1K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
22.7K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
18.4K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
28.1K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2026AIBase