MCP Local Rag
プライバシーを重視したドキュメント検索サーバーで、完全にローカルで動作します。MCPプロトコルを通じてAIプログラミングツールに意味検索機能を提供し、APIキーやクラウドサービスは必要ありません。すべてのデータ処理はユーザーのコンピュータ上で行われます。
2.5ポイント
0

MCP Local RAGとは?

MCP Local RAGはローカルドキュメントのインテリジェント検索システムで、キーワードマッチングだけでなく、AI技術を使ってドキュメントの内容を理解します。PDF、Wordドキュメント、テキストファイルなどをシステムにアップロードし、自然言語で質問すると、システムは最も関連するドキュメントの断片を見つけて返します。すべての処理はあなたのコンピュータ上で行われ、データのプライバシーとセキュリティが保証されます。

MCP Local RAGの使い方は?

使用方法は3つの簡単なステップに分かれています:1) MCPサーバーをあなたのAIツール(Cursor/Codex/Claude Code)に設定する;2) ドキュメントをシステムにアップロードする;3) 自然言語でドキュメントの内容を検索する。システムは自動的にドキュメントの分割、意味理解、インテリジェント検索を行います。

適用シーン

機密性の高いドキュメントを扱うシーンに特に適しています。例えば、企業内の技術文書、顧客契約書、研究論文、個人ノート、法律文書などです。ドキュメントをクラウドサービスにアップロードできない場合でも、特定の情報を素早く見つけることができます。

主要機能

ドキュメントのアップロードと処理
PDF、DOCX、TXT、Markdown形式をサポートします。テキスト内容を自動的に抽出し、検索可能な断片に分割し、意味ベクトルを生成します。同じファイルを再アップロードすると、自動的に古いバージョンが置き換わり、データの重複を避けます。
意味検索
自然言語で意味検索を行い、単なるキーワードマッチングではなく、クエリの深い意味を理解します。例えば、「認証フロー」を検索すると、「ログイン方法」や「資格情報の検証」を含む関連内容も見つけることができます。
ファイル管理
アップロードされたすべてのファイルのリストを表示します。ファイルパス、処理時間、生成された断片の数が含まれます。システムにインデックスされた内容を把握するのに役立ちます。
ファイル削除
システムからドキュメントとそれに関連するすべてのデータを永久に削除します。ドキュメントが古くなったり、機密情報を含んでいる場合に使用します。
システム状態監視
システムの稼働状態を表示します。ドキュメントの総数、断片の総数、メモリ使用状況、稼働時間などが含まれます。パフォーマンスの監視や問題の解決に役立ちます。
完全なオフラインでの動作
初回使用時にモデルファイル(約90MB)をダウンロードした後は、すべての操作がローカルで行われ、ネットワーク接続は必要ありません。データのプライバシーと常時利用可能を保証します。
利点
🔒 完全なプライバシー保護:すべてのデータ処理はローカルで行われ、ドキュメントは決してコンピュータを離れません
💰 ゼロ使用コスト:API呼び出し料がなく、無制限の検索で追加コストは発生しません
🌐 オフラインで利用可能:モデルをダウンロードした後は、ネットワーク接続なしで使用できます
⚡ 高速応答:数千のドキュメント断片があっても、クエリは通常3秒以内に結果を返します
🔄 自動更新:ドキュメントを再アップロードすると、自動的に古いバージョンが置き換わり、データを最新の状態に保ちます
制限
📁 ファイル形式の制限:現在はPDF、DOCX、TXT、MD形式のみをサポートし、Excel、PPT、画像OCRはサポートしていません
💾 ローカルストレージの必要性:モデルファイル(約120MB)とベクトルデータベースを保存するために十分なディスクスペースが必要です
⚙️ 設定手順:AIツールにMCPサーバーを設定する必要があり、非技術ユーザーには学習コストがあるかもしれません
🔍 検索精度:ローカルモデルの精度は大型クラウドサービスよりもやや低い場合がありますが、ほとんどのドキュメント検索には十分です
🌍 言語サポート:デフォルトのモデルは英語に最適化されており、他の言語ではモデルを変更する必要があるかもしれません

使い方

MCPサーバーの設定
使用しているAIツールに応じて、MCP Local RAGを設定ファイルに追加します。ドキュメントを保存する基本ディレクトリ(BASE_DIR)を指定する必要があります。
AIツールの再起動
設定ファイルを保存した後、AIツール(Cursor/Codex/Claude Code)を完全に終了して再起動し、設定を有効にします。
ドキュメントのアップロード
自然言語コマンドを使って最初のドキュメントをアップロードします。システムは必要なモデルを自動的にダウンロードします(初回使用時は約1 - 2分かかります)。
検索の開始
ドキュメントの処理が完了したら、自然言語で質問してドキュメントの内容を検索します。システムは最も関連する断片を返します。

使用例

技術文書の検索
開発者は大量のAPI文書や技術仕様を頻繁に参照する必要があります。MCP Local RAGを使うと、特定の機能やエラーの解決方法を素早く見つけることができます。
研究論文の整理
研究者は複数のPDF形式の研究論文を参照する必要があります。意味検索を使うと、特定の理論や方法に関するすべての論文を見つけることができます。たとえ異なる用語を使っていても、関連する論文を見つけることができます。
企業内ドキュメント管理
企業には大量の内部ドキュメント(政策、プロセス、会議記録)があり、社員は関連情報を素早く見つける必要があります。ドキュメントが機密性が高いため、クラウドサービスを使用することはできません。
個人の知識ベース
個人ユーザーは大量のノート、ブックマーク、参考資料を収集しています。MCP Local RAGを使うと、個人用のインテリジェント検索システムを構築することができます。

よくある質問

私のドキュメントは本当にコンピュータを離れないのですか?
どのファイル形式がサポートされていますか?
初回使用時になぜ待たなければならないのですか?
中国語のドキュメントを検索できますか?
データをどのようにバックアップしますか?
検索が結果を返さない場合はどうすればいいですか?
複数人で同じデータベースを共有できますか?
ドキュメントが大きすぎてアップロードできない場合はどうすればいいですか?

関連リソース

GitHubリポジトリ
プロジェクトのソースコード、問題の報告、貢献ガイドライン
Model Context Protocol公式サイト
MCPプロトコルの技術的詳細と仕様を理解する
HuggingFaceモデルページ
使用している埋め込みモデルの技術的詳細とパフォーマンス指標を確認する
LanceDBドキュメント
ベクトルデータベースの技術原理と使用方法を理解する
Transformers.js
ブラウザとNode.jsでのTransformerモデルの実行ライブラリ

インストール

以下のコマンドをクライアントにコピーして設定
{
  "mcpServers": {
    "local-rag": {
      "command": "npx",
      "args": ["-y", "mcp-local-rag"],
      "env": {
        "BASE_DIR": "/path/to/your/documents"
      }
    }
  }
}

{
  "mcpServers": {
    "local-rag": {
      "command": "npx",
      "args": ["-y", "mcp-local-rag"],
      "env": {
        "BASE_DIR": "/path/to/your/documents",
        "DB_PATH": "./lancedb",
        "CACHE_DIR": "./models"
      }
    }
  }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

C
Claude Context
Claude ContextはMCPプラグインで、セマンティックコード検索によりAIプログラミングアシスタントにコードベース全体の深いコンテキストを提供し、複数の埋め込みモデルとベクトルデータベースをサポートし、効率的なコード検索を実現します。
TypeScript
5.7K
5ポイント
A
Acemcp
Acemcpは、コードライブラリのインデックス化と意味検索を行うMCPサーバーです。自動増分インデックス、複数エンコーディングファイルの処理、.gitignore統合、およびWeb管理インターフェイスをサポートしており、開発者がコードのコンテキストをすばやく検索し、理解するのに役立ちます。
Python
9.8K
5ポイント
M
MCP
Microsoft公式のMCPサーバーで、AIアシスタントに最新のMicrosoft技術ドキュメントの検索と取得機能を提供します。
13.0K
5ポイント
C
Cipher
Cipherは、プログラミングAIエージェント向けに設計されたオープンソースのメモリ層フレームワークです。MCPプロトコルを通じてさまざまなIDEとAIコーディングアシスタントと統合し、自動記憶生成、チーム記憶共有、デュアルシステム記憶管理などの核心機能を提供します。
TypeScript
0
5ポイント
A
Annas MCP
Anna's ArchiveのMCPサーバーとCLIツールは、このプラットフォームのドキュメントを検索およびダウンロードするためのもので、APIキーを使用したアクセスをサポートしています。
Go
6.2K
4.5ポイント
S
Search1api
Search1API MCPサーバーは、Model Context Protocol (MCP)に基づくサーバーで、検索とクローリング機能を提供し、複数の検索サービスとツールをサポートします。
TypeScript
12.8K
4ポイント
D
Duckduckgo MCP Server
認証済み
DuckDuckGo検索MCPサーバーは、ClaudeなどのLLMにウェブ検索とコンテンツ取得サービスを提供します。
Python
50.0K
4.3ポイント
B
Bing Search MCP
Microsoft Bing検索APIを統合するためのMCPサーバーで、ウェブページ、ニュース、画像の検索機能をサポートし、AIアシスタントにウェブ検索機能を提供します。
Python
14.8K
4ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
17.6K
4.8ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
14.6K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
57.6K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
29.2K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
14.9K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
17.9K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
16.3K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
25.6K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIBase