Mcpserver
MCPプロトコルに基づくTypeScriptのウェブクローリングサーバーで、複数のエクスポート形式、ヘッドレスブラウザー、カスタムルールセットをサポートし、さまざまなウェブページコンテンツ収集ニーズに適しています。
スコア : 2ポイント
ダウンロード数 : 4.0K
WebスクレイパーMCPサーバーとは?
これはModel Context Protocol (MCP)に基づくウェブページコンテンツ収集サーバーで、ユーザーが様々なウェブサイトから構造化されたコンテンツを抽出するのを支援します。大量のウェブページ情報を取得する必要がある非技術者に特に適しています。WebスクレイパーMCPサーバーの使い方は?
ターゲットのURLと簡単な設定パラメータを提供するだけで、サーバーが自動的にコンテンツを収集し、フォーマットされた内容を返します。コードを書かなくても複雑なウェブページ収集タスクを完了できます。適用シナリオ
コンテンツ収集、市場調査、競合分析、ニュース集約、データアーカイブなど、さまざまなビジネスシナリオに適しています。特定のウェブサイトの更新を定期的に取得する必要があるユーザーに特に適しています。主要機能
多形式エクスポート
収集したコンテンツをMarkdown、純テキスト、HTML、JSON形式でエクスポートすることをサポートし、さまざまな使用ニーズに対応します。
ヘッドレスブラウザーサポート
JavaScriptでレンダリングされる動的なページを処理でき、シングルページアプリケーション(SPA)のコンテンツ収集問題を解決します。
インテリジェントルールエンジン
複数の事前定義されたルールセットが組み込まれており、ウェブページの主要コンテンツ領域をインテリジェントに識別して抽出できます。
バッチ収集
複数のURLを同時に収集することをサポートし、データ収集の効率を向上させます。
カスタムリクエストヘッダー
特定のドメインのリクエストヘッダーを設定でき、ウェブサイトのログインと反スクレイピング制限を回避できます。
利点
使いやすく、プログラミング知識がなくても複雑な収集タスクを完了できます。
インテリジェントなコンテンツ識別が組み込まれており、広告や関係のないコンテンツを自動的にフィルタリングします。
現代のWebアプリケーション(SPA)の動的コンテンツの処理をサポートします。
柔軟なエクスポート形式の選択肢があり、さまざまなシナリオのニーズに対応します。
拡張可能なルールシステムで、カスタムコンテンツ抽出ルールをサポートします。
制限
高度に動的なページや複雑なインタラクションが必要なページに対するサポートが限られています。
大規模な収集を行う場合、プロキシIPの設定が必要になることがあります。
一部のウェブサイトには反スクレイピングメカニズムがあり、収集に失敗する可能性があります。
ヘッドレスブラウザーモードでは、多くのシステムリソースを消費します。
使い方
サーバーのインストール
プロジェクトをクローンし、必要な依存関係をインストールします。
サービスの起動
起動コマンドを実行してMCPサーバーを起動します。
リクエストの送信
HTTPリクエストを通じてサーバーが提供するさまざまなツールを呼び出します。
使用例
ニュース記事の収集
ニュースサイトから記事の本文を取得し、Markdown形式で保存します。
商品情報の一括取得
電子商取引サイトから複数の商品ページの重要な情報を収集します。
ログインが必要なコンテンツの収集
認証情報を設定して、ログインが必要なページのコンテンツを収集します。
よくある質問
なぜ一部のウェブサイトからコンテンツが収集できないのですか?
動的にロードされるコンテンツはどう処理すればいいですか?
ログインが必要なウェブサイトを収集できますか?
収集速度を上げるにはどうすればいいですか?
収集したコンテンツが正確でない場合はどうすればいいですか?
関連リソース
MCPプロトコルドキュメント
Model Context Protocolの公式ドキュメント
サンプルルールセット設定
一般的なウェブサイトのコンテンツ抽出ルールのサンプル
Puppeteer使用ガイド
ヘッドレスブラウザーPuppeteerの公式ドキュメント
Web収集のベストプラクティス
ウェブページ収集の倫理と法律ガイド

Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
13.4K
4.5ポイント

Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
16.4K
4.8ポイント

Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
45.7K
4.7ポイント

Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
25.0K
4.5ポイント

Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
12.3K
4.3ポイント

Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
15.1K
5ポイント

Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
15.7K
5ポイント

Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
20.8K
4.5ポイント

