Mcpserver
MCPプロトコルに基づくTypeScriptのウェブクローリングサーバーで、複数のエクスポート形式、ヘッドレスブラウザー、カスタムルールセットをサポートし、さまざまなウェブページコンテンツ収集ニーズに適しています。
2ポイント
4.0K

WebスクレイパーMCPサーバーとは?

これはModel Context Protocol (MCP)に基づくウェブページコンテンツ収集サーバーで、ユーザーが様々なウェブサイトから構造化されたコンテンツを抽出するのを支援します。大量のウェブページ情報を取得する必要がある非技術者に特に適しています。

WebスクレイパーMCPサーバーの使い方は?

ターゲットのURLと簡単な設定パラメータを提供するだけで、サーバーが自動的にコンテンツを収集し、フォーマットされた内容を返します。コードを書かなくても複雑なウェブページ収集タスクを完了できます。

適用シナリオ

コンテンツ収集、市場調査、競合分析、ニュース集約、データアーカイブなど、さまざまなビジネスシナリオに適しています。特定のウェブサイトの更新を定期的に取得する必要があるユーザーに特に適しています。

主要機能

多形式エクスポート
収集したコンテンツをMarkdown、純テキスト、HTML、JSON形式でエクスポートすることをサポートし、さまざまな使用ニーズに対応します。
ヘッドレスブラウザーサポート
JavaScriptでレンダリングされる動的なページを処理でき、シングルページアプリケーション(SPA)のコンテンツ収集問題を解決します。
インテリジェントルールエンジン
複数の事前定義されたルールセットが組み込まれており、ウェブページの主要コンテンツ領域をインテリジェントに識別して抽出できます。
バッチ収集
複数のURLを同時に収集することをサポートし、データ収集の効率を向上させます。
カスタムリクエストヘッダー
特定のドメインのリクエストヘッダーを設定でき、ウェブサイトのログインと反スクレイピング制限を回避できます。
利点
使いやすく、プログラミング知識がなくても複雑な収集タスクを完了できます。
インテリジェントなコンテンツ識別が組み込まれており、広告や関係のないコンテンツを自動的にフィルタリングします。
現代のWebアプリケーション(SPA)の動的コンテンツの処理をサポートします。
柔軟なエクスポート形式の選択肢があり、さまざまなシナリオのニーズに対応します。
拡張可能なルールシステムで、カスタムコンテンツ抽出ルールをサポートします。
制限
高度に動的なページや複雑なインタラクションが必要なページに対するサポートが限られています。
大規模な収集を行う場合、プロキシIPの設定が必要になることがあります。
一部のウェブサイトには反スクレイピングメカニズムがあり、収集に失敗する可能性があります。
ヘッドレスブラウザーモードでは、多くのシステムリソースを消費します。

使い方

サーバーのインストール
プロジェクトをクローンし、必要な依存関係をインストールします。
サービスの起動
起動コマンドを実行してMCPサーバーを起動します。
リクエストの送信
HTTPリクエストを通じてサーバーが提供するさまざまなツールを呼び出します。

使用例

ニュース記事の収集
ニュースサイトから記事の本文を取得し、Markdown形式で保存します。
商品情報の一括取得
電子商取引サイトから複数の商品ページの重要な情報を収集します。
ログインが必要なコンテンツの収集
認証情報を設定して、ログインが必要なページのコンテンツを収集します。

よくある質問

なぜ一部のウェブサイトからコンテンツが収集できないのですか?
動的にロードされるコンテンツはどう処理すればいいですか?
ログインが必要なウェブサイトを収集できますか?
収集速度を上げるにはどうすればいいですか?
収集したコンテンツが正確でない場合はどうすればいいですか?

関連リソース

MCPプロトコルドキュメント
Model Context Protocolの公式ドキュメント
サンプルルールセット設定
一般的なウェブサイトのコンテンツ抽出ルールのサンプル
Puppeteer使用ガイド
ヘッドレスブラウザーPuppeteerの公式ドキュメント
Web収集のベストプラクティス
ウェブページ収集の倫理と法律ガイド

インストール

以下のコマンドをクライアントにコピーして設定
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

K
Klavis
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
TypeScript
10.0K
5ポイント
M
MCP
Microsoft公式のMCPサーバーで、AIアシスタントに最新のMicrosoft技術ドキュメントの検索と取得機能を提供します。
10.5K
5ポイント
A
Aderyn
アデリンは、Rustで書かれたオープンソースのSolidityスマートコントラクト静的分析ツールで、開発者やセキュリティ研究者がSolidityコードの脆弱性を発見するのを支援します。FoundryとHardhatプロジェクトをサポートし、複数の形式のレポートを生成でき、VSCode拡張機能も提供します。
Rust
5.1K
5ポイント
D
Devtools Debugger MCP
Node.jsデバッガーMCPサーバーは、Chrome DevToolsプロトコルに基づく完全なデバッグ機能を提供します。ブレークポイントの設定、ステップ実行、変数のチェック、式の評価などが含まれます。
TypeScript
6.5K
4ポイント
S
Scrapling
Scraplingは適応型ウェブページのスクレイピングライブラリで、ウェブサイトの変化を自動的に学習し、要素を再配置します。複数のスクレイピング方法とAI統合をサポートし、高性能な解析と開発者に優しい体験を提供します。
Python
9.2K
5ポイント
M
Mcpjungle
MCPJungleは自ホスト型のMCPゲートウェイで、複数のMCPサーバーを集中的に管理および代理し、AIエージェントに統一されたツールアクセスインターフェースを提供します。
Go
0
4.5ポイント
C
Cipher
Cipherは、プログラミングAIエージェント向けに設計されたオープンソースのメモリ層フレームワークです。MCPプロトコルを通じてさまざまなIDEとAIコーディングアシスタントと統合し、自動記憶生成、チーム記憶共有、デュアルシステム記憶管理などの核心機能を提供します。
TypeScript
0
5ポイント
N
Nexus
NexusはAIツール集約ゲートウェイで、複数のMCPサーバーとLLMプロバイダーの接続をサポートし、統一されたエンドポイントを通じてツール検索、実行、およびモデルルーティング機能を提供し、セキュリティ認証とレート制限をサポートします。
Rust
0
4ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
13.4K
4.5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
16.4K
4.8ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
45.7K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
25.0K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
12.3K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
15.1K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
15.7K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
20.8K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIBase