Crawl4ai RAG
C

Crawl4ai RAG

Crawl4AI RAG MCPサーバーは、ウェブクローラーとRAG機能を統合したAIエージェントサービスで、スマートURL検出、再帰的クローリング、並列処理、ベクトル検索をサポートし、AIコーディングアシスタントに強力な知識取得と検索機能を提供することを目的としています。
3.5ポイント
5.6K

Crawl4AI RAG MCPサーバーとは?

Crawl4AI RAG MCPサーバーは、インターネットから情報を収集してデータベースに保存し、意味検索に基づく知識検索(RAG)をサポートする強力なツールです。AIエージェントがモデルコンテキストプロトコルを通じてこれらの知識にアクセスできるようにします。

Crawl4AI RAG MCPサーバーの使い方は?

簡単なコマンドでサーバーを起動し、クライアントを設定して接続できます。このサーバーは、ウェブページの収集、ベクトル検索、ソースフィルタリングなど、さまざまなツールをサポートしています。

適用シナリオ

リアルタイムでインターネット情報を収集して検索する必要があるAIアプリケーション、たとえばプログラミングアシスタント、スマートカスタマーサービスシステム、またはパーソナライズされた推薦エンジンに適しています。

主要機能

スマートURL検出通常のウェブページ、サイトマップ、テキストファイルなど、さまざまなタイプのURLを自動的に識別します。
再帰的クローリング内部リンクをたどってより多くのコンテンツを発見します。
コンテンツ分割タイトルとサイズに基づいてコンテンツをスマートに分割し、さらなる処理を容易にします。
ベクトル検索意味検索を利用して収集したコンテンツの中から関連情報を検索します。
ソース検索フィルタリング可能なソースリストを提供し、RAGプロセスをガイドします。

利点と制限

利点
さまざまなURLタイプをサポートし、高い適応性を持ちます。
効率的な並列処理により、クローリング速度を向上させます。
柔軟なフィルタリングオプションで、検索精度を確保します。
オープンソースで拡張可能で、必要に応じて機能をカスタマイズできます。
制限
埋め込みを生成するために外部API(OpenAIなど)に依存する必要があり、費用が発生する可能性があります。
大規模なウェブサイトのクローリングには多くのリソースを消費する可能性があります。
初期設定が複雑で、特定の環境をインストールする必要があります。

使い方

リポジトリをクローンする
Gitを使用してこのプロジェクトのコードをローカルにクローンします。
環境を設定する
`.env`ファイルを作成し、必要な設定パラメータを記入します。
サーバーを起動する
Dockerコンテナを起動するか、直接スクリプトを実行します。

使用例

単一のウェブページを収集する単一のウェブページを収集して意味検索を行う方法をデモンストレーションします。
ウェブサイト全体のコンテンツを収集する複数のページを含むウェブサイトを収集する方法をデモンストレーションします。

よくある質問

このサーバーをオフラインで実行できますか?
収集時に元のデータが損傷することはありますか?
収集ルールをカスタマイズできますか?

関連リソース

公式ドキュメント
サーバーの機能と設定方法を詳細に説明しています。
GitHubリポジトリ
ソースコードとその貢献ガイドです。
Supabase公式チュートリアル
Supabaseデータベースの設定方法を学びます。

インストール

以下のコマンドをクライアントにコピーして設定
{
  "mcpServers": {
    "crawl4ai-rag": {
      "transport": "sse",
      "url": "http://localhost:8051/sse"
    }
  }
}

> {
>   "mcpServers": {
>     "crawl4ai-rag": {
>       "transport": "sse",
>       "serverUrl": "http://localhost:8051/sse"
>     }
>   }
> }
>

{
  "mcpServers": {
    "crawl4ai-rag": {
      "command": "python",
      "args": ["path/to/crawl4ai-mcp/src/crawl4ai_mcp.py"],
      "env": {
        "TRANSPORT": "stdio",
        "OPENAI_API_KEY": "your_openai_api_key",
        "SUPABASE_URL": "your_supabase_url",
        "SUPABASE_SERVICE_KEY": "your_supabase_service_key"
      }
    }
  }
}

{
  "mcpServers": {
    "crawl4ai-rag": {
      "command": "docker",
      "args": ["run", "--rm", "-i", 
               "-e", "TRANSPORT", 
               "-e", "OPENAI_API_KEY", 
               "-e", "SUPABASE_URL", 
               "-e", "SUPABASE_SERVICE_KEY", 
               "mcp/crawl4ai"],
      "env": {
        "TRANSPORT": "stdio",
        "OPENAI_API_KEY": "your_openai_api_key",
        "SUPABASE_URL": "your_supabase_url",
        "SUPABASE_SERVICE_KEY": "your_supabase_service_key"
      }
    }
  }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。

厳選MCPサービス

E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
12.2K
4.8ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
23.5K
4.7ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
9.9K
4.5ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
18.6K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
9.4K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
11.3K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
12.0K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
13.4K
4.5ポイント
AIbase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIbase