Mcpserver
MCPプロトコルに基づくTypeScriptのウェブクローリングサーバーで、複数のエクスポート形式、ヘッドレスブラウザー、カスタムルールセットをサポートし、さまざまなウェブページコンテンツ収集ニーズに適しています。
2ポイント
6.3K

WebスクレイパーMCPサーバーとは?

これはModel Context Protocol (MCP)に基づくウェブページコンテンツ収集サーバーで、ユーザーが様々なウェブサイトから構造化されたコンテンツを抽出するのを支援します。大量のウェブページ情報を取得する必要がある非技術者に特に適しています。

WebスクレイパーMCPサーバーの使い方は?

ターゲットのURLと簡単な設定パラメータを提供するだけで、サーバーが自動的にコンテンツを収集し、フォーマットされた内容を返します。コードを書かなくても複雑なウェブページ収集タスクを完了できます。

適用シナリオ

コンテンツ収集、市場調査、競合分析、ニュース集約、データアーカイブなど、さまざまなビジネスシナリオに適しています。特定のウェブサイトの更新を定期的に取得する必要があるユーザーに特に適しています。

主要機能

多形式エクスポート
収集したコンテンツをMarkdown、純テキスト、HTML、JSON形式でエクスポートすることをサポートし、さまざまな使用ニーズに対応します。
ヘッドレスブラウザーサポート
JavaScriptでレンダリングされる動的なページを処理でき、シングルページアプリケーション(SPA)のコンテンツ収集問題を解決します。
インテリジェントルールエンジン
複数の事前定義されたルールセットが組み込まれており、ウェブページの主要コンテンツ領域をインテリジェントに識別して抽出できます。
バッチ収集
複数のURLを同時に収集することをサポートし、データ収集の効率を向上させます。
カスタムリクエストヘッダー
特定のドメインのリクエストヘッダーを設定でき、ウェブサイトのログインと反スクレイピング制限を回避できます。
利点
使いやすく、プログラミング知識がなくても複雑な収集タスクを完了できます。
インテリジェントなコンテンツ識別が組み込まれており、広告や関係のないコンテンツを自動的にフィルタリングします。
現代のWebアプリケーション(SPA)の動的コンテンツの処理をサポートします。
柔軟なエクスポート形式の選択肢があり、さまざまなシナリオのニーズに対応します。
拡張可能なルールシステムで、カスタムコンテンツ抽出ルールをサポートします。
制限
高度に動的なページや複雑なインタラクションが必要なページに対するサポートが限られています。
大規模な収集を行う場合、プロキシIPの設定が必要になることがあります。
一部のウェブサイトには反スクレイピングメカニズムがあり、収集に失敗する可能性があります。
ヘッドレスブラウザーモードでは、多くのシステムリソースを消費します。

使い方

サーバーのインストール
プロジェクトをクローンし、必要な依存関係をインストールします。
サービスの起動
起動コマンドを実行してMCPサーバーを起動します。
リクエストの送信
HTTPリクエストを通じてサーバーが提供するさまざまなツールを呼び出します。

使用例

ニュース記事の収集
ニュースサイトから記事の本文を取得し、Markdown形式で保存します。
商品情報の一括取得
電子商取引サイトから複数の商品ページの重要な情報を収集します。
ログインが必要なコンテンツの収集
認証情報を設定して、ログインが必要なページのコンテンツを収集します。

よくある質問

なぜ一部のウェブサイトからコンテンツが収集できないのですか?
動的にロードされるコンテンツはどう処理すればいいですか?
ログインが必要なウェブサイトを収集できますか?
収集速度を上げるにはどうすればいいですか?
収集したコンテンツが正確でない場合はどうすればいいですか?

関連リソース

MCPプロトコルドキュメント
Model Context Protocolの公式ドキュメント
サンプルルールセット設定
一般的なウェブサイトのコンテンツ抽出ルールのサンプル
Puppeteer使用ガイド
ヘッドレスブラウザーPuppeteerの公式ドキュメント
Web収集のベストプラクティス
ウェブページ収集の倫理と法律ガイド

インストール

以下のコマンドをクライアントにコピーして設定
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

V
Vestige
Vestigeは認知科学に基づくAI記憶エンジンで、予測誤差ゲート、FSRS - 6間隔反復、記憶の夢など29の神経科学モジュールを実装することで、AIに長期記憶能力を提供します。3D可視化ダッシュボードと21のMCPツールを備え、完全にローカルで動作し、クラウドは必要ありません。
Rust
5.9K
4.5ポイント
M
Moltbrain
MoltBrainは、OpenClaw、MoltBook、Claude Code用に設計された長期記憶層プラグインで、自動的にプロジェクトのコンテキストを学習し、思い出すことができます。スマートな検索、観察記録、分析統計、永続的なストレージ機能を提供します。
TypeScript
7.0K
4.5ポイント
B
Bm.md
機能豊富なMarkdown排版ツールで、様々なスタイルテーマとプラットフォーム対応をサポートし、リアルタイム編集プレビュー、画像エクスポート、API統合機能を提供します
TypeScript
13.4K
5ポイント
S
Security Detections MCP
Security Detections MCPは、Model Context Protocolに基づくサーバーで、LLMがSigma、Splunk ESCU、Elastic、KQL形式を含む統一されたセキュリティ検出ルールデータベースをクエリできます。最新のバージョン3.0は自律型検出エンジニアリングプラットフォームにアップグレードされ、自動的に脅威インテリジェンスからTTPを抽出し、カバレッジのギャップを分析し、SIEMネイティブ形式の検出ルールを生成し、テストを実行して検証できます。プロジェクトには71以上のツール、11の事前構築されたワークフロープロンプト、および知識グラフシステムが含まれ、複数のSIEMプラットフォームをサポートしています。
TypeScript
5.8K
4ポイント
P
Paperbanana
Python
7.2K
5ポイント
F
Finlab Ai
FinLab AIは金融定量分析プラットフォームで、AI技術を通じてユーザーが投資戦略の超過収益(アルファ)を発見するのを支援します。豊富なデータセット、バックテストフレームワーク、および戦略サンプルを提供し、自動化されたインストールと主流のAIプログラミングアシスタントへの統合をサポートします。
6.6K
4ポイント
B
Better Icons
20万以上のアイコンの検索と検索を提供するMCPサーバーとCLIツールで、150以上のアイコンライブラリをサポートし、AIアシスタントと開発者が迅速にアイコンを取得して使用できるように支援します。
TypeScript
8.5K
4.5ポイント
A
Assistant Ui
assistant-uiは、生産レベルのAIチャットインターフェイスを迅速に構築するためのオープンソースのTypeScript/Reactライブラリで、組み合わせ可能なUIコンポーネント、ストリーミング応答、アクセシビリティなどの機能を提供し、複数のAIバックエンドとモデルをサポートしています。
TypeScript
6.9K
5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
23.4K
4.8ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
19.3K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
80.3K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
37.3K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
23.0K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
31.2K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
20.2K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
31.9K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2026AIBase