rag - vault：多形式対応のローカル優先MCPツール、AIアシスタントの私有文書高速アクセスをサポート

Rag Vault

RAG Vaultは、ローカル優先のドキュメント検索強化生成ツールで、MCPプロトコルを通じてAIアシスタントにプライベートドキュメントへの迅速なアクセスを提供します。複数のファイルフォーマットをサポートし、ローカルでインデックス作成と検索を行うことでデータのプライバシーを確保し、ハイブリッド検索、Webインターフェイス、リモートサーバーモードを提供します。

知識管理と記憶検索ツール #ローカル検索 #ドキュメントインデックス化 #ハイブリッド検索 #プライバシー優先 .TypeScript

スコア : 2ポイント

ダウンロード数 : 5.9K

更新時間 : 2026-03-13

サイトを開く

RAG Vaultとは？

RAG Vaultは、AIアシスタント向けに設計されたローカル優先のドキュメント検索システムです。これにより、API仕様書、研究論文、内部ドキュメントなどのプライベートドキュメントをインデックス化し、セマンティック検索を通じて関連情報を迅速に検索できます。すべての処理はあなたのローカルマシンで行われ、データのプライバシーとセキュリティが確保されます。

RAG Vaultの使い方は？

1つのコマンドでRAG Vaultを起動し、AIツール（Cursor、Claude Code、Codexなど）を接続するように設定します。AIアシスタントインターフェイスまたはWebインターフェイスを通じて、ドキュメントをアップロードし、内容を検索し、知識ベースを管理できます。

適用シーン

RAG Vaultは、企業内部ドキュメント、個人の研究資料、コードベースのドキュメント、API仕様書など、機密性の高いまたはプライベートなドキュメントを扱うシーンに特に適しています。また、データをクラウドサービスにアップロードしたくないユーザーにも最適です。

主要機能

ローカル優先

すべてのデータ処理はあなたのローカルマシンで行われ、ドキュメントをクラウドサーバーにアップロードする必要はありません。明示的に要求した場合のみ、リモートURLからコンテンツを取得します。

ハイブリッド検索

セマンティック検索とキーワードマッチングを組み合わせることで、クエリの意図を理解し、技術用語やコードスニペットを正確にマッチングできます。

簡単なセットアップ

1つのnpxコマンドと少量の設定で使用を開始でき、Docker、Python、データベースなどの複雑な依存関係をインストールする必要はありません。

Webインターフェイス

完全なWebインターフェイスを提供し、ドラッグアンドドロップによるアップロード、リアルタイム検索、ドキュメントプレビュー、知識ベース管理をサポートし、コマンドラインを使用する必要はありません。

リモートモード

HTTPサーバーとして実行することをサポートし、リモートMCPクライアント（Claude.aiなど）があなたのローカル知識ベースに接続できるようにします。

複数のフォーマットサポート

PDF、DOCX、Markdown、TXT、JSON、JSONL、NDJSON、HTMLなどの複数のドキュメントフォーマットをサポートします。

セキュリティ機能

APIキー認証、レート制限、CORS制御、セキュリティヘッダーなどの本番環境レベルのセキュリティ機能を提供します。

AIスキルパッケージ

オプションのスキルパッケージをインストールすることで、AIアシスタントがクエリをより適切に作成し、結果を解釈し、RAG Vaultツールを使用する方法を学習できます。

利点

データが完全にローカル化されており、プライバシーとセキュリティが保障されます

無料で使用でき、クエリ料金やサブスクリプション料金はかかりません

使いやすく、複雑なサーバーインフラストラクチャは必要ありません

オフラインでの使用をサポートし、モデルをキャッシュした後はネットワーク接続が不要です

ハイブリッド検索により、検索結果の品質が向上します

複数のAIツール（Cursor、Claude Code、Codexなど）との統合をサポートします

制限

ドキュメントとベクトルデータベースを保存するためのローカルストレージが必要です

初回実行時に埋め込みモデル（約90MB）をダウンロードする必要があります

一部のシステムでは、GPUアクセラレーションに追加の設定が必要な場合があります

大きなファイルの処理は、ローカルハードウェアの性能に制限される可能性があります

使い方

環境の準備

Node.js 20以上をインストールし、ドキュメントを保存するディレクトリを選択します。

AIツールの設定

使用するAIツールに応じて、対応する設定ファイルを編集してRAG Vaultサーバーを追加します。

AIツールの再起動

設定ファイルを保存した後、AIツールを完全に再起動して設定を有効にします。

使用の開始

AIアシスタントインターフェイスまたはWebインターフェイスを通じて、ドキュメントをアップロードし、検索を行います。

使用例

コードベースのドキュメントの検索

プロジェクトのドキュメントディレクトリ内のすべてのMarkdownファイルをRAG Vaultにインデックス化し、特定の技術的な質問を検索します。

Webページのドキュメントのインデックス化

オンラインのAPIドキュメントサイトからHTMLコンテンツを取得し、ローカルの知識ベースにインデックス化します。

個人の知識ベースの構築

個人の研究論文フォルダ内のPDFドキュメントをRAG Vaultにインデックス化し、学術研究に使用します。

正確な技術用語の検索

ハイブリッド検索機能を使用して、特定のエラーコードや技術用語を検索します。

よくある質問

私のデータは本当にプライベートですか？

RAG Vaultはオフラインで使用できますか？

GPUアクセラレーションを有効にするにはどうすればいいですか？

埋め込みモデルを変更できますか？

データをバックアップするにはどうすればいいですか？

なぜ検索に結果が出ないのですか？

どのようなファイルフォーマットがサポートされていますか？

ファイルサイズに制限はありますか？

🚀 RAG Vault

あなたのドキュメント。あなたのマシン。あなたのコントロール。

RAG Vaultは、API仕様書、研究論文、社内文書などのプライベートなドキュメントにAIコーディングアシスタントが高速にアクセスできるようにします。インデックス作成と検索はローカルで実行され、明示的にリモートURLからコンテンツを取り込まない限り、データはあなたのマシン上に留まります。

1つのコマンドで実行でき、最小限のセットアップで、デフォルトでプライバシーが保護されます。

🚀 クイックスタート

初期セットアップチェックリスト

MCP設定を追加する前に以下の手順を実行してください。

Node.js 20以上をインストールします。
ドキュメントディレクトリを選択し、BASE_DIRをそのパスに設定します。
AIツールのプロセスがBASE_DIRを読み取れることを確認します。
設定を編集した後、AIツールを再起動します。

各ツールでの使用方法

Cursorの場合

~/.cursor/mcp.jsonに以下を追加します。

{
  "mcpServers": {
    "local-rag": {
      "type": "stdio",
      "command": "npx",
      "args": ["-y", "github:RobThePCGuy/rag-vault"],
      "env": {
        "BASE_DIR": "/path/to/your/documents"
      }
    }
  }
}

/path/to/your/documentsを実際の絶対パスに置き換えてください。

Claude Codeの場合

プロジェクトディレクトリの.mcp.jsonに以下を追加します。

{
  "mcpServers": {
    "local-rag": {
      "type": "stdio",
      "command": "npx",
      "args": ["-y", "github:RobThePCGuy/rag-vault"],
      "env": {
        "BASE_DIR": "./documents",
        "DB_PATH": "./documents/.rag-db",
        "CACHE_DIR": "./.cache",
        "RAG_EMBEDDING_DEVICE": "cpu",
        "RAG_HYBRID_WEIGHT": "0.6",
        "RAG_GROUPING": "related"
      }
    }
  }
}

または、CLIを介してインラインで追加します。

claude mcp add local-rag --scope user --env BASE_DIR=/path/to/your/documents -- npx -y github:RobThePCGuy/rag-vault

Codexの場合

~/.codex/config.tomlに以下を追加します。

[mcp_servers.local-rag]
command = "npx"
args = ["-y", "github:RobThePCGuy/rag-vault"]

[mcp_servers.local-rag.env]
BASE_DIR = "/path/to/your/documents"

スキルのインストール（オプション）

クエリの作成や結果の解釈に関するAIガイダンスを強化するために、RAG Vaultのスキルをインストールします。

# Claude Code（プロジェクトレベル - チームプロジェクトでおすすめ）
npx github:RobThePCGuy/rag-vault skills install --claude-code

# Claude Code（ユーザーレベル - すべてのプロジェクトで利用可能）
npx github:RobThePCGuy/rag-vault skills install --claude-code --global

# Codex（ユーザーレベル）
npx github:RobThePCGuy/rag-vault skills install --codex

# カスタム場所
npx github:RobThePCGuy/rag-vault skills install --path /your/custom/path

スキルはClaudeに以下のベストプラクティスを教えます。

クエリの作成と拡張戦略
スコアの解釈（< 0.3 = 適切なマッチ、> 0.5 = スキップ）
ingest_fileとingest_dataの使い分け
HTMLの取り込みとURLの処理

AIツールを再起動して会話を始めましょう。

You: "Ingest api-spec.pdf"
AI:  Successfully ingested api-spec.pdf (47 chunks)

You: "How does authentication work?"
AI:  Based on section 3.2, authentication uses OAuth 2.0 with JWT tokens...

これで完了です。DockerやPython、サーバーインフラストラクチャの管理は必要ありません。

✨ 主な機能

RAG Vaultを選ぶ理由

問題点	RAG Vaultの解決策
"自分のドキュメントを他人のサーバーに置きたくない"	デフォルトですべてがローカルに留まります。インデックス作成や検索のためのバックグラウンドのクラウド呼び出しはありません。
"意味検索では正確なコード用語が見つからない"	ハイブリッド検索：意味 + `useEffect`のような正確なマッチ
"セットアップにDocker、Python、データベースなどが必要"	1つの`npx`コマンドと小さなMCP設定ブロックです。
"クラウドAPIはクエリごとに料金がかかる"	永久無料。サブスクリプション不要。

セキュリティ

RAG Vaultには、本番環境でのデプロイに必要なセキュリティ機能が含まれています。

API認証：RAG_API_KEYを介したオプションのAPIキー
レート制限：設定可能なリクエストスロットリング
CORS制御：許可されたオリジンの制限
セキュリティヘッダー：Helmet.jsによる保護

詳細なドキュメントはSECURITY.mdを参照してください。

📦 インストール

コマンドによるインストール

npx github:RobThePCGuy/rag-vault

💻 使用例

コードベースのドキュメントを検索する

You: "Ingest all the markdown files in /docs"
AI:  Ingested 23 files (847 chunks total)

You: "What's the retry policy for failed API calls?"
AI:  According to error-handling.md, failed requests retry 3 times
     with exponential backoff: 1s, 2s, 4s...

Webドキュメントをインデックスする

You: "Fetch https://docs.example.com/api and ingest the HTML"
AI:  Ingested "docs.example.com/api" (156 chunks)

You: "What rate limits apply to the /users endpoint?"
AI:  The API limits /users to 100 requests per minute per API key...

個人の知識ベースを構築する

You: "Ingest my research papers folder"
AI:  Ingested 12 PDFs (2,341 chunks)

You: "What do recent studies say about transformer attention mechanisms?"
AI:  Based on attention-mechanisms-2024.pdf, the key finding is...

正確な技術用語を検索する

RAG Vaultのハイブリッド検索は、意味と正確なマッチの両方を捕捉します。

You: "Search for ERR_CONNECTION_REFUSED"
AI:  Found 3 results mentioning ERR_CONNECTION_REFUSED:
     1. troubleshooting.md - "When you see ERR_CONNECTION_REFUSED..."
     2. network-errors.pdf - "Common causes include..."

純粋な意味検索ではこれを見逃しますが、RAG Vaultは見つけます。

📚 詳細ドキュメント

ウェブインターフェイス

RAG Vaultには、コマンドラインを使用せずにドキュメントを管理するためのフル機能のウェブUIが含まれています。

ウェブUIを起動する

npx github:RobThePCGuy/rag-vault web

ブラウザでhttp://localhost:3000を開きます。

できること

ドキュメントをアップロードする：PDF、DOCX、Markdown、TXT、JSON、JSONL、NDJSONファイルをドラッグアンドドロップでアップロードできます。
即座に検索する：クエリを入力し、関連性スコア付きの結果を表示します。
コンテンツをプレビューする：任意の結果をクリックして、コンテキスト内の完全なチャンクを表示します。
ファイルを管理する：すべてのインデックス化されたドキュメントを表示し、不要なものを削除できます。
データベースを切り替える：複数の知識ベースを作成して切り替えることができます。
ステータスを監視する：ドキュメント数、メモリ使用量、検索モードを確認できます。
設定をエクスポート/インポートする：ボールトの設定をバックアップして復元できます。
テーマ設定：ライト、ダーク、またはシステムテーマを切り替えることができます。
フォルダブラウザ：ディレクトリをナビゲートしてドキュメントを選択できます。

REST API

ウェブサーバーは、プログラムからアクセスするためのREST APIを公開しています。認証を要求するにはRAG_API_KEYを設定します。

# 認証付き（RAG_API_KEYが設定されている場合）
curl -X POST "http://localhost:3000/api/v1/search" \
  -H "Authorization: Bearer your-api-key" \
  -H "Content-Type: application/json" \
  -d '{"query": "authentication", "limit": 5}'

# ドキュメントを検索する（RAG_API_KEYが設定されていない場合は認証不要）
curl -X POST "http://localhost:3000/api/v1/search" \
  -H "Content-Type: application/json" \
  -d '{"query": "authentication", "limit": 5}'

# すべてのファイルをリストする
curl "http://localhost:3000/api/v1/files"

# ドキュメントをアップロードする
curl -X POST "http://localhost:3000/api/v1/files/upload" \
  -F "file=@spec.pdf"

# ファイルを削除する
curl -X DELETE "http://localhost:3000/api/v1/files" \
  -H "Content-Type: application/json" \
  -d '{"filePath": "/path/to/spec.pdf"}'

# システムステータスを取得する
curl "http://localhost:3000/api/v1/status"

# ヘルスチェック（ロードバランサー用）
curl "http://localhost:3000/api/v1/health"

リーダーAPIエンドポイント

プログラムからのドキュメント読み取りとクロスドキュメント検索のためのエンドポイントです。

# ドキュメントのすべてのチャンクを取得する（インデックス順）
curl "http://localhost:3000/api/v1/documents/chunks?filePath=/path/to/doc.pdf"

# クロスドキュメント検索のための関連チャンクを見つける
curl "http://localhost:3000/api/v1/chunks/related?filePath=/path/to/doc.pdf&chunkIndex=0&limit=5"

# 複数のチャンクのバッチリクエスト（UIに効率的）
curl -X POST "http://localhost:3000/api/v1/chunks/batch-related" \
  -H "Content-Type: application/json" \
  -d '{"chunks": [{"filePath": "/path/to/doc.pdf", "chunkIndex": 0}], "limit": 3}'

リモートモード

RAG Vaultは、Claude.ai、Claude DesktopなどのリモートMCPクライアントや、Streamable HTTPまたはSSEトランスポートをサポートする任意のクライアント向けにHTTPサーバーとしても実行できます。

# リモートサーバーを起動する（デフォルトポート3001）
npx github:RobThePCGuy/rag-vault --remote

# カスタムポート
npx github:RobThePCGuy/rag-vault --remote --port 8080

Stdioモードは変更されません。--remoteを省略すると、Cursor、Claude Code、Codexで以前と同じように動作します。

Claude Desktopから接続する

Claude Desktopの設定に以下を追加します。

{
  "mcpServers": {
    "rag-vault-remote": {
      "type": "url",
      "url": "http://localhost:3001/mcp"
    }
  }
}

またはClaude Code CLIを介して追加します。

claude mcp add --transport http rag-vault http://localhost:3001/mcp

Claude.aiから接続する

Claude.ai（Pro/Max/Team/Enterprise）の場合は、URL https://your-host:3001/mcpでカスタムコネクタとして追加します。ローカル開発の場合は、トンネルを使用してサーバーを公開します。

cloudflared tunnel --url http://localhost:3001

リモートで公開する場合は、認証のためにRAG_API_KEYを設定します。サーバーはStreamable HTTP (/mcp) とレガシーSSE (/sse) の両方のトランスポートをサポートし、/healthでヘルスチェックができます。

🔧 技術詳細

動作原理

Document → Parse → Chunk by meaning → Embed locally → Store in LanceDB
                         ↓
Query → Embed → Vector search → Keyword boost → Quality filter → Results

スマートチャンキング：文字数ではなく意味で分割します。コードブロックはそのまま保持されます。
ハイブリッド検索：ベクトル類似度で関連コンテンツを見つけ、キーワードブーストで正確なマッチを上位にランク付けします。
品質フィルタリング：任意のトップKカットオフではなく、関連性のギャップで結果をグループ化します。
デフォルトでローカル：Transformers.jsを介した埋め込み、LanceDBを介したストレージ。ネットワークは初期のモデルダウンロードまたは明示的にリモートURLを取り込む場合にのみ必要です。
MCPツール付属：query_documents, ingest_file, ingest_data, delete_file, list_files, status, feedback_pin, feedback_dismiss, feedback_stats

サポートされる形式

形式	拡張子	備考
PDF	`.pdf`	全文抽出、ヘッダー/フッターのフィルタリング
Word	`.docx`	テーブル、リスト、書式が保持されます
Markdown	`.md`	コードブロックがそのまま保持されます
テキスト	`.txt`	プレーンテキスト
JSON	`.json`	検索可能なキーバリューテキストに変換されます
JSONL / NDJSON	`.jsonl`, `.ndjson`	ログや構造化レコードのために1行ずつ解析されます
HTML	`ingest_data`経由	Readabilityで自動クリーニングされます

設定

環境変数

変数	デフォルト	説明
`BASE_DIR`	現在のディレクトリ	このパス以下のファイルのみアクセス可能
`DB_PATH`	`./lancedb/`	ベクトルが保存される場所
`CACHE_DIR`	`./models/`	モデルキャッシュディレクトリ
`MODEL_NAME`	`Xenova/all-MiniLM-L6-v2`	HuggingFaceの埋め込みモデル
`MAX_FILE_SIZE`	`104857600` (100 MB)	取り込みの最大ファイルサイズ（バイト）
`RAG_EMBEDDING_DEVICE`	`auto`	推論デバイス: `auto`, `cpu`, `cuda`, `dml`, `webgpu`, `wasm`, `gpu`, `webnn`
`WEB_PORT`	`3000`	ウェブインターフェイスのポート
`UPLOAD_DIR`	`./uploads/`	ウェブUIのファイルアップロード用の一時ディレクトリ

Windowsユーザー: RAG_EMBEDDING_DEVICE=autoはGPUプロバイダー（DirectML）を試みますが、ONNX Runtime GPUバイナリが利用可能でない場合に失敗することがあります。埋め込みの初期化エラーが表示された場合は、MCP設定でRAG_EMBEDDING_DEVICE=cpuを設定して安定した動作を確保してください。詳細は「よくある質問」の「GPUアクセラレーションについては？」を参照してください。

1つのコマンドで上書きすることができます（.envを編集する必要はありません）。

# MCPモード
npx github:RobThePCGuy/rag-vault --embedding-device cpu

# ウェブモード
npx github:RobThePCGuy/rag-vault web --embedding-device dml

# 明示的に自動検出を強制する
npx github:RobThePCGuy/rag-vault --gpu-auto

検索の微調整

変数	デフォルト	説明
`RAG_HYBRID_WEIGHT`	`0.6`	キーワードブーストの強度。`0` = 意味のみ、`1.0` = BM25のみ、値が高いほど正確なキーワードマッチのブーストが強くなります
`RAG_GROUPING`	未設定	品質フィルタリングのグループ化モード: `similar` = トップグループのみ、`related` = トップ2グループ
`RAG_MAX_DISTANCE`	未設定	この関連性閾値を下回る結果をフィルタリングします
`RAG_GROUPING_STD_MULTIPLIER`	`1.5`	結果グループ間の関連性ギャップを検出するための標準偏差の乗数
`RAG_HYBRID_CANDIDATE_MULTIPLIER`	`2`	キーワードの再ランキング前に取得するベクトル候補の数の乗数
`RAG_FTS_MAX_FAILURES`	`3`	全文検索が失敗する回数の上限
`RAG_FTS_COOLDOWN_MS`	`300000` (5分)	最大失敗回数に達した後に全文検索を再試行するまでのクールダウン期間

セキュリティ（オプション）

変数	デフォルト	説明
`RAG_API_KEY`	未設定	認証用のAPIキー
`CORS_ORIGINS`	localhost	許可されたオリジン（カンマ区切り、または`*`）
`RATE_LIMIT_WINDOW_MS`	`60000`	レート制限の時間ウィンドウ（ミリ秒）
`RATE_LIMIT_MAX_REQUESTS`	`100`	ウィンドウごとの最大リクエスト数

高度な設定

変数	デフォルト	説明
`ALLOWED_SCAN_ROOTS`	ホームディレクトリ	データベーススキャンが許可されたディレクトリ
`JSON_BODY_LIMIT`	`5mb`	最大リクエストボディサイズ
`REQUEST_TIMEOUT_MS`	`30000`	APIリクエストのタイムアウト
`REQUEST_LOGGING`	`false`	リクエストの監査ログを有効にする

をコピーして、完全な設定テンプレートを取得してください。

コード主体のコンテンツの場合、以下の設定を試してみてください。

"env": {
  "RAG_HYBRID_WEIGHT": "0.8",
  "RAG_GROUPING": "similar"
}

よくある質問

私のデータは本当にプライベートですか？

ローカルファイルの場合は、はい。埋め込みモデルをダウンロードした後（約90MB）、インデックス作成と検索はあなたのマシン上で実行されます。RAG Vaultは、明示的にリモートURLを取り込むか、モデルをダウンロードする必要がある場合にのみネットワークを使用します。

オフラインで動作しますか？

初回実行後は、はい。モデルはローカルにキャッシュされます。

GPUアクセラレーションについては？

RAG VaultはデフォルトでTransformers.jsのデバイス自動選択を使用します（RAG_EMBEDDING_DEVICE=auto）。GPUプロバイダーが適切に構成されている場合、これにより埋め込み生成を高速化できます。

重要: Windowsでは、autoはDirectML (dml) を試みますが、これにはONNX Runtime GPUバイナリが必要です。これらのバイナリがインストールされていないか、GPUの設定が不完全な場合、サーバーはまったく起動しなくなります。CPUに優雅にフォールバックすることはありません。LinuxでCUDAバイナリがない場合も同様です。

推奨: 埋め込みの初期化エラーが発生した場合は、MCP設定でRAG_EMBEDDING_DEVICE=cpuを設定してください。CPUモードはすべてのプラットフォームで信頼性が高く、ほとんどのワークロードに対して十分な速度です（デフォルトのモデルは約90MBのみです）。

"env": {
  "RAG_EMBEDDING_DEVICE": "cpu"
}

サポートされるデバイス値: auto, cpu, cuda, dml, gpu, wasm, webgpu, webnn, webnn-npu, webnn-gpu, webnn-cpu。エイリアスdirectmlも受け付けられ、dmlにマッピングされます。

埋め込みモデルを変更できますか？

はい。MODEL_NAMEを互換性のある任意のHuggingFaceモデルに設定できます。異なるモデルは互換性のないベクトルを生成するため、DB_PATHを削除して再取り込みする必要があります。

推奨アップグレード: より高品質で多言語対応の場合、EmbeddingGemmaを使用します。

"MODEL_NAME": "onnx-community/embeddinggemma-300m-ONNX"

このモデルは、多言語および高品質な検索ユースケースに適した強力なオプションです。

その他の専用モデル:

科学分野: sentence-transformers/allenai-specter
コード分野: jinaai/jina-embeddings-v2-base-code

データをバックアップするにはどうすればいいですか？

DB_PATHディレクトリ（デフォルト: ./lancedb/）をコピーします。

トラブルシューティング

問題	解決策
結果が見つからない	まずドキュメントを取り込む必要があります。「すべての取り込み済みファイルをリストする」を実行して確認してください。
モデルのダウンロードに失敗した	インターネット接続を確認してください。モデルはHuggingFaceから約90MBです。
埋め込みの初期化に失敗した	MCP設定で`RAG_EMBEDDING_DEVICE=cpu`を設定してください。デフォルトの`auto`はWindowsでGPUバイナリがない場合に失敗することがあります。
`Protobuf parsing failed`	モデルキャッシュが破損しています。`CACHE_DIR`（デフォルト: `./models/`）を削除して再起動してください。RAG Vaultはまた、分離された回復キャッシュで自動的に再試行します。
ファイルが大きすぎる	デフォルトの制限は100MBです。`MAX_FILE_SIZE`をより大きく設定するか、ファイルを分割してください。
パスが`BASE_DIR`の外にある	すべてのファイルパスは`BASE_DIR`以下である必要があります。絶対パスを使用してください。
MCPツールが表示されない	設定構文を確認し、AIツールを完全に再起動してください（MacではCmd+Q）。
`mcp-publisher login github`が`slow_down`で失敗する	代わりにトークンログインを使用してください: `mcp-publisher login github --token "$(gh auth token)"`（またはPATを渡します）
401 Unauthorized	APIキーが必要です。`RAG_API_KEY`を設定するか、正しいヘッダー形式を使用してください。
429 Too Many Requests	レート制限されました。リセットを待つか、`RATE_LIMIT_MAX_REQUESTS`を増やしてください。
CORSエラー	オリジンを`CORS_ORIGINS`環境変数に追加してください。

開発

git clone https://github.com/RobThePCGuy/rag-vault.git
cd rag-vault
pnpm install
pnpm --prefix web-ui install

# ローカルのgitフックをインストールする（推奨、単独開発でも）
pnpm hooks:install

# 高速なローカル品質ゲート（バックエンド + ウェブUIの型チェック/リント/フォーマット、依存関係、未使用コード、ビルド、単体テスト）
pnpm check:all

# 単体テストのみ（モデルダウンロード不要）
pnpm test:unit

# 統合/E2Eテスト（モデルダウンロード/ネットワークが必要）
pnpm test:integration

# ビルド
pnpm build

# ローカルでMCPサーバーを実行する（stdio）
pnpm dev

# ローカルでMCPサーバーを実行する（リモートHTTP + SSE）
pnpm dev:remote

# ローカルでウェブサーバーを実行する
pnpm web:dev

# npmにリリースする（ローカル、保護付き）
pnpm release          # patch
pnpm release:minor
pnpm release:major
pnpm release:dry

テストのレベル

pnpm test:unit: モデルダウンロードの統合パスを除く、ローカル/CIの品質チェック用の決定的なテスト。
pnpm test:integration: 埋め込みモデルの初期化を含む、完全な統合およびE2Eワークフロー。

RUN_EMBEDDING_INTEGRATION=1を使用して、ネットワーク/モデルに依存するテストスイートを明示的に選択できます。

リリース戦略

リリースはscripts/release-npm.shを介してローカルでスクリプト化されています。
サポートされるバンプ: patch, minor, major。
スクリプトは、依存関係のインストール、pnpm check:all、pnpm ui:buildを実行してから、バージョンファイルに触れます。
package.jsonとserver.jsonのバージョンは、チェックが通過した後にのみ更新され、後続のステップで失敗した場合は自動的に復元されます。
pnpm release:dryは完全なゲートとnpmのドライラン公開を実行し、常にバージョンファイルを復元します。

プロジェクト構造

src/
├── bin/             # CLIサブコマンド（skills install）
├── chunker/         # 意味に基づくテキスト分割
├── embedder/        # Transformers.jsラッパー
├── errors/          # エラー処理ユーティリティ
├── explainability/  # キーワードベースの結果説明
├── flywheel/        # フィードバックループ（ピン留め/却下の再ランキング）
├── parser/          # PDF、DOCX、HTMLの解析
├── query/           # 高度なクエリ構文解析器
├── server/          # MCPツールハンドラー + リモートトランスポート
├── utils/           # 設定、ファイルヘルパー、プロセスハンドラー
├── vectordb/        # LanceDB + ハイブリッド検索
└── web/             # Expressサーバー + REST API

web-ui/              # Reactフロントエンド（Vite + Tailwind）