Firecrawl MCP Server

Firecrawl MCPサーバーは、Firecrawlのウェブページ取得機能を統合したモデルコンテキストプロトコルサーバーで、豊富なウェブページ取得、検索、コンテンツ抽出機能を提供します。

研究とデータ開発者ツール #ウェブページ取得 #コンテンツ抽出 #スマート検索 #バッチ処理ローカル .TypeScript

スコア : 5ポイント

ダウンロード数 : 81.2K

更新時間 : 2025-04-28

サイトを開く

Firecrawl MCPサーバーとは？

Firecrawl MCPサーバーは、モデルコンテキストプロトコル（MCP）に基づいて実装されたウェブクローラーツールで、強力なFirecrawl機能を統合しています。これには、ウェブページの取得、検索、深掘り調査、バッチ処理が含まれます。JavaScriptレンダリング、自動リトライ、スマートフィルタリングなどの高度な機能をサポートしています。

Firecrawl MCPサーバーの使い方は？

簡単なコマンドライン操作でサーバーを起動でき、単一ページの取得、バッチ取得、検索エンジン分析などの様々な機能をサポートしています。APIキーと環境変数を設定するだけで使用を開始できます。

適用シナリオ

自動化されたウェブページ取得、データ分析、またはSEO最適化が必要な企業や個人開発者に適しています。検索エンジン最適化や大規模なデータ収集のいずれにも、Firecrawl MCPは対応できます。

主要機能

ウェブページ取得

単一のウェブページを深く取得し、主要なページコンテンツを抽出し、複数の形式で出力できます。

バッチ取得

複数のURLのバッチ取得タスクを効率的に処理し、組み込みのスマートレート制限メカニズムがあります。

検索エンジン分析

キーワード検索で関連するウェブページの内容を取得し、さらに重要な情報を抽出できます。

深掘り調査

スマートクローラーと言語モデルを組み合わせて、詳細な業界調査レポートを生成します。

LLMs.txt生成

標準化されたllms.txtファイルを生成し、大規模言語モデルとウェブサイトの相互作用ルールを定義します。

利点

JavaScriptレンダリングをサポートし、動的なコンテンツを取得できます。

組み込みの自動リトライメカニズムで成功率を向上させます。

複数のデバイスビューポートへの適合をサポートし、より実際のユーザー体験に近づけます。

強力なバッチ処理能力で大幅に効率を向上させます。

制限

クラウドAPIバージョンは有料サブスクリプションが必要です。

非常に複雑なウェブページ構造に対しては、手動で設定を調整する必要がある場合があります。

自前でホストするモードでは、一定の運用経験が必要です。

使い方

依存関係のインストール

Node.js環境がインストールされていることを確認し、`npm install`を実行してプロジェクトの依存関係をインストールします。

サーバーの起動

APIキーを設定してからFirecrawl MCPサーバーを起動します。

取得タスクの実行

提供されたツールを使用して、単一ページの取得またはバッチ取得を実行します。

使用例

例1：単一ページの取得

指定されたウェブページの主要な内容を取得し、Markdown形式でエクスポートします。

例2：バッチ取得

複数のウェブページを一度に取得し、結果をローカルに保存します。

よくある質問

Firecrawl APIキーを取得するにはどうすればいいですか？

自前でホストするモードをサポートしていますか？

なぜ私のリクエストが失敗するのですか？

🚀 火焰爬虫システム（Firecrawl）

火焰爬虫システムは、強力な機能を備えたウェブクローラーツールです。深層ウェブのクローリング、スマートなデータ抽出、自動化タスクの実行をサポートしています。このシステムはモジュール化アーキテクチャで設計されており、高い拡張性と柔軟性を持ち、様々な複雑なネットワークアプリケーションシーンに適しています。

✨ 主な機能

1. ウェブクローリングと監視（Web Crawl & Monitoring）

深層ウェブクローリング：マルチスレッドの並行クローリングをサポートし、柔軟な設定が可能で、さまざまなウェブサイト構造に対応できます。
ウェブページの変更検出：対象のウェブページを継続的に監視し、内容の更新や変更をすぐに検出します。
ネットワークトラフィック分析：リアルタイムでネットワーク状態を監視し、異常なトラフィックや潜在的なセキュリティ脅威を識別します。

2. データ処理と分析（Data Processing & Analysis）

データクリーニング：自動的に冗長な情報を削除し、データの質を向上させます。
パターン認識：機械学習アルゴリズムを使用して、隠れたデータの関連性や傾向を発見します。
ログマイニング：システムログを解析し、価値のある情報や行動パターンを抽出します。

3. 自動化タスク実行（Automation & Task Execution）

定期タスクスケジューリング：定期的なタスクを設定し、クローリングや分析などの操作を自動的に実行します。
ルールエンジン：事前に設定した条件に基づいて自動化操作をトリガーし、インテリジェントなビジネスプロセス管理を実現します。
異常処理メカニズム：ネットワークエラーや反クローリングメカニズムに遭遇した場合、システムは自動的に再試行または戦略を調整します。

📦 インストール

インストールと設定（Installation & Configuration）

依存関係のインストール：
```
npm install firecrawl
```
設定ファイルの初期化：
```
firecraw init
```
サービスの起動：
```
node app.js
```

💻 使用例

基本的なウェブクローリング（Basic Web Crawl）

const FireCrawler = require('firecrawl');

async function basicCrawl() {
    try {
        const crawler = new FireCrawler();
        const response = await crawler.goto('http://example.com');
        console.log(response.status);
        console.log(response.html);
    } catch (error) {
        console.error('クローリング中にエラーが発生しました:', error.message);
    }
}

basicCrawl();

深層ウェブクローリング（Deep Web Crawl）

const FireCrawler = require('firecrawl');

async function deepCrawl() {
    try {
        const crawler = new FireCrawler();
        await crawler.start({
            startUrls: ['http://example.com/'],
            maxDepth: 5,
            concurrency: 10
        });
        console.log('クローリング完了、取得したページ数:', crawler.totalPages);
    } catch (error) {
        console.error('深層クローリング中にエラーが発生しました:', error.message);
    }
}

deepCrawl();

ウェブページの内容抽出（Content Extraction）

const FireCrawler = require('firecrawl');

async function contentExtraction() {
    try {
        const crawler = new FireCrawler();
        const response = await crawler.goto('http://example.com');
        const extractedData = crawler.extract({
            rules: [
                { selector: 'h1', attribute: 'text' },
                { selector: '.price', attribute: 'text' }
            ]
        });
        console.log('抽出したデータ:', extractedData);
    } catch (error) {
        console.error('内容抽出中にエラーが発生しました:', error.message);
    }
}

contentExtraction();

📚 ドキュメント

設定オプション

ネットワークリクエスト設定（HTTP Request Settings）

{
  "proxy": {
    "enabled": true,
    "host": "127.0.0.1",
    "port": 8080
  },
  "headers": {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.113 Safari/537.3",
    "Accept-Language": "zh-CN,zh;q=0.9"
  },
  "timeout": {
    "connect": 10000,
    "read": 10000
  }
}

データストレージ設定（Data Storage Settings）

{
  "database": {
    "type": "mysql",
    "host": "localhost",
    "port": 3306,
    "username": "root",
    "password": "password"
  },
  "filesystem": {
    "enabled": true,
    "directory": "/var/www/html/data/",
    "gzip": true
  }
}

ログ設定（Logging Settings）

{
  "log_level": "INFO",
  "log_file": "/var/log/firecrawl.log",
  "console_logging": true,
  "file_logging": true,
  "retention_days": 30
}

システムログ例

実行ログ（Runtime Logs）

INFO: システムが正常に起動しました、バージョン番号：1.0.0
INFO: クローラータスクを開始します、ターゲットURL：http://example.com
DEBUG: 現在のスレッド数：4
WARNING: 反クローリングメカニズムを検出しました、戦略を調整中...
ERROR: ターゲットサーバーに接続できません、再試行中...
SUCCESS: ページを正常に取得しました、ステータスコード：200
INFO: クローラータスクが完了しました、取得したページ数：100

エラーログ（Error Logs）

ERROR: リクエスト中にタイムアウトエラーが発生しました
ERROR: 無効なHTTPレスポンスヘッダー情報です
FATAL: データベースに接続できません、データを保存できません

ネットワークトラフィック分析例

基本統計（Basic Statistics）

時間範囲	平均応答時間 (ms)	成功リクエスト数	失敗リクエスト数	総リクエスト数
最近5分	200	1000	20	1020
最近1時間	250	6000	150	6150

応答時間分布（Response Time Distribution）

応答時間 (ms) 範囲   | パーセント
--------------------|----------
< 100              | 70%
100-200            | 25%
> 200              | 5%

拡張開発（Extension Development）

プラグインメカニズム：システムはカスタムプラグインをサポートし、開発者が機能モジュールを拡張できます。
フック関数：さまざまなフックインターフェースを提供し、特定の段階でカスタムロジックを挿入しやすくします。
データプロセッサ：データ処理フローをカスタマイズでき、さまざまなビジネスニーズに対応できます。

エラー処理とデバッグ（Error Handling & Debugging）

一般的なエラーと解決策

接続タイムアウト
- ネットワーク設定を確認する
- タイムアウト設定を調整する
```
crawler.config.timeout = 30000;
```
反クローリングメカニズムがトリガーされた
- リクエストヘッダー情報を変更する
- プロキシサーバーを使用する
```
crawler.useProxy();
```
データベース接続失敗
- データベースの状態を確認する
- 認証情報を確認する
```
db.connect().catch(err => console.error('データベース接続エラー:', err));
```

問題解決（Troubleshooting）

システム起動失敗
- 依存関係が正しくインストールされていることを確認する
- 起動ログを確認し、具体的なエラー情報を探す
データ抽出が不完全
- 抽出ルールが正しく設定されていることを確認する
- リクエストをシミュレートし、ページ構造に変更がないか確認する
パフォーマンスのボトルネック
- システム負荷を分析し、ボトルネックの部分を特定する
- データベースクエリの効率を最適化する
- サーバーリソースを増やす

パフォーマンスチューニング（Performance Tuning）

スレッドプール設定
```
crawler.config.concurrency = 50;
```
キャッシュ戦略の調整
```
crawler.useCache(true);
```
データベースの最適化
- インデックスの最適化
- クエリオプティマイザーの調整

セキュリティに関する注意事項（Security Considerations）

DDoS攻撃の防止
- 並行接続数を制限する
- レート制限を実施する
データ保護
- データを暗号化して転送する
- 定期的にデータをバックアップする
権限管理
- ユーザー権限を最小化する
- アクセスログを定期的にレビューする

更新履歴（Release Notes）

バージョン 1.0.0 (2023-10-10)

基本機能モジュールを含む初期バージョンがリリースされました。
Webインターフェースとコマンドラインツールが提供されます。

バージョン 1.1.0 (2023-10-25)

ネットワーク層の監視機能が追加されました。
データ抽出のパフォーマンスが最適化され、効率が30%向上しました。
いくつかの既知の重大なエラーが修正されました。

バージョン 1.2.0 (2023-11-10)

複数のデータベースバックエンド（MySQL、PostgreSQL）がサポートされます。
ログ分析モジュールが追加されました。
システムの安定性が向上し、クラッシュ率が低下しました。

連絡先（Contact Information）

公式ウェブサイト：https://firecrawl.com
メールサポート：support@fire

システムアーキテクチャ図

+-------------------+       +-------------------+
|                   |       |                   |
|     ユーザー          |       |     データベース         |
|     (Web UI)      |       |     (MySQL/PostgreSQL)|
|                   |       |                   |
+-------------------+       +-------------------+
          ||                         ||
          ||                         ||
+--------+||+---------+        +-----+||+-------+
|  Web   |++| ネットワーク層  |        | ログ |++| データベース|
| Server |   |         |        | ストレージ |     |
+--------+   +---------+        +-----+
          ||                         ||
          ||                         ||
+--------+||+---------+        +-----+||+-------+
| コントローラー |++| リクエスト処理|        | 監視 |++| 分析モジュール|
| Module |   |         |        | システム |     |
+--------+   +---------+        +-----+

データフロー図

開始 -> 設定解析 -> コンポーネント初期化 -> タスク実行 -> データ処理 -> 結果保存 -> 終了

📄 ライセンス

火焰爬虫システムはMITオープンソースライセンスに準拠しており、ユーザーはこのソフトウェアを自由に使用、変更、配布することができます。詳細なライセンス条項は、ソフトウェアに同梱されているLICENSEファイルを参照してください。

firecrawl_scrape

指定されたウェブページの内容を取得します。

パラメータ

url : string*

説明

取得するウェブページのURL。

パラメータ

options : object*

説明

オプションパラメーター。他の取得オプションを含みます。

firecrawl_batch_scrape

複数のウェブページの内容をバッチで取得します。

パラメータ

urls : array*

説明

取得する複数のURLを含む配列。

パラメータ

options : object*

説明

オプションパラメーター。他のバッチ取得オプションを含みます。

firecrawl_search

検索を実行して結果を返します。

パラメータ

query : string*

説明

実行する検索クエリ。

パラメータ

scrapeOptions : object*

説明

オプションパラメーター。検索関連の取得オプションを含みます。

firecrawl_crawl

クローラータスクを開始します。

パラメータ

url : string*

説明

クローラータスクの開始URL。

パラメータ

options : object*

説明

オプションパラメーター。クローラーの深さなどのオプションを含みます。

google

Googleを使用して検索します。

パラメータ

searchTerm : string*

説明

検索するキーワードまたはフレーズ。

パラメータ

numResults : number*

説明

返す結果の数。デフォルトは10です。

firecrawler-crawl

指定されたウェブページの内容をクロールします。

パラメータ

url : string*

説明

クロールするウェブページのURL。

パラメータ

options : object*

説明

オプションパラメーター。他のクロールオプションを含みます。

firecrawler_search

検索を実行して結果を返します。

パラメータ

query : string*

説明

実行する検索クエリ。

パラメータ

scrapeOptions : object*

説明

オプションパラメーター。検索関連のクロールオプションを含みます。

firecrawler_batch_scrape

複数のウェブページの内容をバッチで取得します。

パラメータ

urls : array*

説明

取得する複数のURLを含む配列。

パラメータ

options : object*

説明

オプションパラメーター。他のバッチ取得オプションを含みます。

firecrawler_crawl

クローラータスクを開始します。

パラメータ

url : string*

説明

クローラータスクの開始URL。

パラメータ

options : object*

説明

オプションパラメーター。クローラーの深さなどのオプションを含みます。

Gmail MCP Server

Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。

TypeScript

13.5K

4.5ポイント

Edgeone Pages MCP Server

EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。

Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。

百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。

GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。

UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。

18.4K

5ポイント

Magic MCP

Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。

JavaScript

17.1K

5ポイント

Sequential Thinking MCP Server

MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。

Python

25.2K

4.5ポイント

智啓未来、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

Firecrawl MCP Server

概要

ツールリスト

コンテンツ詳細

代替品

Firecrawl MCPサーバーとは？

Firecrawl MCPサーバーの使い方は？

適用シナリオ

主要機能

使い方

使用例

よくある質問

関連リソース

インストール

🚀 火焰爬虫システム（Firecrawl）

✨ 主な機能

1. ウェブクローリングと監視（Web Crawl & Monitoring）

2. データ処理と分析（Data Processing & Analysis）

3. 自動化タスク実行（Automation & Task Execution）

📦 インストール

インストールと設定（Installation & Configuration）

💻 使用例

基本的なウェブクローリング（Basic Web Crawl）

深層ウェブクローリング（Deep Web Crawl）

ウェブページの内容抽出（Content Extraction）

📚 ドキュメント

設定オプション

ネットワークリクエスト設定（HTTP Request Settings）

データストレージ設定（Data Storage Settings）

ログ設定（Logging Settings）

システムログ例

実行ログ（Runtime Logs）

エラーログ（Error Logs）

ネットワークトラフィック分析例

基本統計（Basic Statistics）

応答時間分布（Response Time Distribution）

拡張開発（Extension Development）

エラー処理とデバッグ（Error Handling & Debugging）

一般的なエラーと解決策

問題解決（Troubleshooting）

パフォーマンスチューニング（Performance Tuning）

セキュリティに関する注意事項（Security Considerations）

更新履歴（Release Notes）

バージョン 1.0.0 (2023-10-10)

バージョン 1.1.0 (2023-10-25)

バージョン 1.2.0 (2023-11-10)

連絡先（Contact Information）

システムアーキテクチャ図

データフロー図

📄 ライセンス

代替品