Context Lens MCP：LanceDBを統合したローカル化語義検索ツールで、データをローカル処理して検索可能な知識ベースを構築

Context Lens

Context Lensはローカルの意味検索ツールで、あらゆるコンテンツを検索可能な知識ベースに変換し、AIアシスタントがキーワードのマッチングだけでなく意味を理解できるようにします。組み込みのLanceDBベクトルデータベースを使用し、ローカルファイル、GitHubリポジトリ、およびURLコンテンツをサポートします。APIキーやクラウドサービスは不要で、すべてのデータはローカルで処理されます。

開発者ツール知識管理と記憶 #意味検索 #ローカル知識ベース #ベクトルデータベース #コード理解 .Python

スコア : 2.5ポイント

ダウンロード数 : 7.7K

更新時間 : 2025-12-03

サイトを開く

Context Lensとは？

Context Lensは、Model Context Protocol (MCP)に基づくインテリジェントサーバーで、あなたのコードベース、ドキュメント、契約書などのあらゆるテキストコンテンツを検索可能な知識ベースに変換します。従来のキーワード検索とは異なり、Context Lensはコンテンツの意味を理解し、AIアシスタントがあなたのコンテンツに関する複雑な質問に答えることができます。

Context Lensの使い方は？

あなたのプロジェクト、GitHubリポジトリ、またはドキュメントをContext Lensに追加するだけで、AIアシスタントがその内容をすぐに理解できます。自然言語で質問すると、AIは意味理解に基づいて最も関連性の高い答えを返します。

適用シーン

コード理解、ドキュメント分析、プロジェクト学習、法律契約書の審査、技術研究など、テキストコンテンツを深く理解する必要があるシーンに適しています。特に開発者、技術ドキュメント作成者、プロジェクトマネージャー、研究者に最適です。

主要機能

意味検索

キーワードの単純なマッチングではなく、コンテンツの意味を理解するため、特定の単語が使用されていなくても関連するコンテンツを見つけることができます。

ゼロコンフィグレーションインストール

複雑なインストールや設定は必要ありません。APIキーも不要で、すぐに使えます。

ローカル処理

すべてのデータ処理はローカルで行われるため、データのプライバシーとセキュリティが確保されます。

複数ソースのサポート

ローカルファイル、GitHubリポジトリ、直接のURLなど、複数のコンテンツソースをサポートします。

インテリジェント解析

ファイルタイプに応じて最適な解析戦略を自動的に使用し、コードやドキュメントの構造を維持します。

組み込みベクトルデータベース

LanceDBをローカルベクトルストレージとして使用するため、外部のデータベースサービスは不要です。

利点

完全に無料でローカルで実行され、クラウドサービスやサブスクリプションは不要です。

データのプライバシーが保障され、すべてのコンテンツはローカルで処理されます。

意味理解能力が強く、検索結果がより正確で関連性が高いです。

複数のファイルタイプとコンテンツソースをサポートします。

設定が簡単で、主流のAIクライアントと互換性が良好です。

制限

初回実行時にモデルファイル（約100MB）をダウンロードする必要があります。

大型のコードベースを処理する場合は、多くのディスクスペースが必要になる場合があります。

テキストファイルのみをサポートし、バイナリファイルはサポートされません。

MCPプロトコルをサポートするクライアントが必要です。

使い方

Context Lensをインストールする

pipまたはuvを使用してContext Lensパッケージをインストールします。

MCPクライアントを設定する

あなたのAIクライアント（Claude Desktop、Cursorなど）の設定ファイルにContext Lensサーバーを追加します。

コンテンツを知識ベースに追加する

AIアシスタントを使用して、あなたのプロジェクト、ドキュメント、またはGitHubリポジトリを追加します。

質問を開始する

自然言語で質問すると、AIは意味検索に基づいて答えを返します。

使用例

オープンソースプロジェクトの学習

FastAPIフレームワークの動作原理とアーキテクチャ設計を迅速に理解する

コードレビューと分析

プロジェクト内の認証システムとセキュリティ実装を分析する

ドキュメント理解

複雑な技術ドキュメントや契約書の重要な条項を迅速に把握する

コードパターンの発見

大型のコードベース内で特定の実装パターンやベストプラクティスを探す

よくある質問

Context LensとGitHubのMCPサーバーの違いは何ですか？

初回実行が遅いのはなぜですか？

私のデータはどこに保存され、安全ですか？

どのようなファイルタイプをサポートしていますか？

どのくらいの大きさのコードベースを処理できますか？

ネットワーク接続は必要ですか？

🚀 Context Lens

AIにキーワードの一致だけでなく、意味を理解する能力を与えます。

🚀 クイックスタート

プロジェクトの追加

You: Add all Python files from ./src to the knowledge base
LLM: ✓ Added 23 Python files with 156 chunks

You: How does the authentication system work?
LLM: The authentication system uses JWT tokens. The login flow starts in 
     auth/login.py where credentials are validated, then a token is generated
     with the user's ID and expiration time...

You: Show me all the database models
LLM: Based on the codebase, here are the main database models:
     1. User model (models/user.py) - handles user accounts and authentication
     2. Post model (models/post.py) - manages blog posts with relationships...

オープンソースから学ぶ

You: Add https://github.com/fastapi/fastapi to the knowledge base
LLM: ✓ Added 247 files from repository with 1,543 chunks

You: How does FastAPI handle dependency injection?
LLM: FastAPI uses a sophisticated dependency injection system. The Depends()
     function in fastapi/dependencies.py analyzes function signatures and
     automatically resolves dependencies. Here's how it works...

You: Compare FastAPI's routing to Flask
LLM: FastAPI uses decorator-based routing similar to Flask, but with key
     differences: 1) Type hints for automatic validation, 2) Async support
     built-in, 3) Automatic OpenAPI documentation generation...

ドキュメントの分析

You: Add all contracts from ./legal/contracts
LLM: ✓ Added 12 contract documents with 487 chunks

You: Find all termination clauses
LLM: I found termination clauses in 8 contracts. Here's a summary:
     - Service Agreement: 30-day notice required for either party
     - Vendor Contract: Immediate termination for breach of confidentiality...

You: What are the payment terms across all contracts?
LLM: Payment terms vary by contract type:
     - Service contracts: Net 30 days from invoice date
     - Vendor agreements: 50% upfront, 50% on delivery...

URLからファイルを取得

You: Add https://raw.githubusercontent.com/fastapi/fastapi/master/README.md
LLM: ✓ Document 'README.md' added successfully with 42 chunks

You: What is FastAPI and what are its key features?
LLM: FastAPI is a modern, fast web framework for building APIs with Python 3.7+.
     Key features include:
     - Fast performance (on par with NodeJS and Go)
     - Automatic API documentation
     - Type hints for validation
     - Async support built-in...

📖 詳細な例とクエリパターン: USAGE_GUIDE.md

✨ 主な機能

🔍 意味検索 - キーワードだけでなく、意味を理解します
🚀 ゼロセットアップ - インストール不要、設定不要、APIキー不要
💾 サーバーレスストレージ - 組み込みのLanceDBを使用し、外部データベース不要
🔒 100% ローカル&プライベート - すべてのデータはあなたのマシン上に留まります
📁 ローカルとGitHub - ローカルファイルまたは公開GitHubリポジトリをインデックス化できます
🎯 スマートパーシング - 言語を考慮したチャンク分割により、より良い結果を得ます

📦 インストール

Kiro IDE

.kiro/settings/mcp.jsonに追加します:

{
  "mcpServers": {
    "context-lens": {
      "command": "uvx",
      "args": ["context-lens"],
      "autoApprove": ["list_documents", "search_documents"]
    }
  }
}

再読み込み: コマンドパレット → "MCP: Reload Servers"

Cursor

.cursor/mcp.jsonに追加します:

{
  "mcpServers": {
    "context-lens": {
      "command": "uvx",
      "args": ["context-lens"]
    }
  }
}

その他のMCPクライアント

Claude Desktop、Continue.dev、またはMCP互換のクライアントの場合:

{
  "mcpServers": {
    "context-lens": {
      "command": "uvx",
      "args": ["context-lens"]
    }
  }
}

📖 詳細なセットアップ手順が必要ですか？ すべてのクライアント、プログラムによる使用方法、および設定オプションについては、SETUP.mdを参照してください。

💻 使用例

基本的な使用法

#!/usr/bin/env python3
import os
from dotenv import load_dotenv
from mcp import StdioServerParameters, stdio_client
from strands import Agent
from strands.models.openai import OpenAIModel
from strands.tools.mcp import MCPClient

def main():
    # Load environment variables from .env file
    load_dotenv()
    
    # Create MCP client for context-lens server
    mcp_client = MCPClient(
        lambda: stdio_client(
            StdioServerParameters(command="uvx", args=["context-lens"])
        )
    )
    
    # Create an agent with OpenAI model and MCP tools
    model = OpenAIModel(model_id="gpt-4o-mini")
    agent = Agent(model=model, tools=[mcp_client])
    
    print("Chatbot started! Type 'quit' to exit.")
    
    while True:
        user_input = input("\nYou: ").strip()
        
        if user_input.lower() in ['quit', 'exit', 'bye']:
            print("Goodbye!")
            break
            
        if not user_input:
            continue
            
        try:
            response = agent(user_input)
            print(f"Bot: {response}")
        except Exception as e:
            print(f"Error: {e}")

if __name__ == "__main__":
    main()

会話の例:

You: Add https://github.com/fastapi/fastapi to the knowledge base
Bot: ✓ Added 247 files from repository with 1,543 chunks

You: How does FastAPI handle dependency injection?
Bot: FastAPI uses a sophisticated dependency injection system...

📖 完全な例: 完全なコードとその他のフレームワークについては、SETUP.mdを参照してください。

📚 ドキュメント

Context Lensとは？

Context Lensは、あらゆるコンテンツをAIアシスタント用の検索可能な知識ベースに変換します。組み込みのサーバーレスベクトルストレージ（LanceDB）を備えたこの自己完結型のモデルコンテキストプロトコル（MCP）サーバーは、会話に意味検索をもたらします。コードベース、ドキュメント、契約書、またはテキストファイルなど、あらゆるコンテンツを指定すると、AIはすぐにコンテンツを理解し、質問に答えることができます。

従来のキーワード検索は、特定の単語を含むファイルを見つけます。正確な用語を見逃すと、コンテンツも見逃します。

Context Lensは意味を理解します。「認証」について尋ねると、「認証」という単語を使用していないファイルでも、ログイン、資格情報、トークン、OAuth、およびアクセス制御に関するコードを見つけることができます。

実際に動作を確認する

Context-Lensの動作を理解したいですか？面白いことに、Context-Lensを使ってContext-Lensについて学ぶことができます。

Context-Lens Demo

デモ: Context-Lensを使用したClaude Desktopで、このリポジトリ自体をインデックス化してクエリを実行します。git cloneもコードをスクロールする必要もなく、質問と回答だけです。

なぜLanceDBを使用するのか？

Context LensはLanceDB - 最新のサーバーレスベクトルデータベースを使用します:

🆓 完全に無料&ローカル - クラウドサービス、APIキー、またはサブスクリプション不要
⚡ インフラストラクチャ不要 - 組み込みデータベースで、ディスク上の単一のファイルです
🚀 高速&効率的 - Apache Arrowをベースに構築され、ベクトル検索に最適化されています
💾 シンプルなストレージ - 単一ファイルのデータベースで、バックアップや移動が簡単です

「AI埋め込み用のSQLite」と考えてください - 複雑さを伴わずにベクトル検索のすべての機能を備えています。

スマートパーシングとチャンク分割

Context Lensは、テキストを無差別に分割するのではなく、コード構造を理解し、言語の境界を尊重するインテリジェントなチャンクを作成します。

違い: 一般的なチャンク分割は、文字数でコードを任意に分割するため、関数を途中で分割することがよくあります。スマートパーシングは、コードの構造を理解し、完全で意味のあるチャンクを作成します。

サポートされるファイルタイプ

🐍 Python (.py, .pyw) - 関数、クラス、インポート
⚡ JavaScript/TypeScript (.js, .jsx, .ts, .tsx, .mjs, .cjs) - 関数、クラス、インポート
📦 JSON (.json, .jsonc) - トップレベルのキー、ネストされたオブジェクト
📋 YAML (.yaml, .yml) - トップレベルのキー、リスト、マッピング
📝 Markdown (.md, .markdown, .mdx) - ヘッダー階層、コードブロック
🦀 Rust (.rs) - 構造体、トレイト、implブロック、関数
📄 その他のファイル (.txt, .log, .cpp, .java, など) - インテリジェントな段落/文の分割

利点

✅ 完全なコード単位 - 関数やクラスを途中で分割することはありません
✅ コンテキストの保持 - ドキュメント文字列、コメント、および構造がそのまま維持されます
✅ より良い検索 - 完全で理解しやすいコードスニペットを見つけることができます
✅ 自動化 - 設定不要、ファイル拡張子に基づいて動作します

📖 動作を確認したいですか？ 詳細な例については、PARSING_EXAMPLES.mdを参照してください。

追加できるもの

Context Lensは、複数のソースからのテキストベースのファイルで動作します:

📁 ローカルファイルとフォルダ - あなたのプロジェクト、ドキュメント、任意のテキストファイル
🌐 GitHubリポジトリ - 公開リポジトリ、特定のブランチ、ディレクトリ、またはファイル
🔗 直接のファイルURL - HTTP/HTTPSでアクセス可能な任意のファイル
📄 ドキュメント - 契約書、ポリシー、研究論文、技術ドキュメント

サポートされるファイルタイプ: .py, .js, .ts, .java, .cpp, .go, .rs, .rb, .php, .json, .yaml, .md, .txt, .sh, など（25以上の拡張子）

最大ファイルサイズ: 10 MB（MAX_FILE_SIZE_MB環境変数で設定可能）

例:

./src/ - ローカルディレクトリ
/path/to/file.py - 単一のローカルファイル
https://github.com/fastapi/fastapi - 全体のリポジトリ
https://github.com/django/django/tree/main/django/contrib/auth - 特定のディレクトリ
https://example.com/config.yaml - 直接のファイルURL
/path/to/contracts/ - 契約書

📖 詳細な例: USAGE_GUIDE.md

利用可能なツール

📥 add_document - ファイル、フォルダ、またはGitHubのURLを追加します
🔍 search_documents - すべてのコンテンツを対象に意味検索を行います
📋 list_documents - インデックス化されたドキュメントを閲覧します
ℹ️ get_document_info - ドキュメントのメタデータを取得します
🗑️ remove_document - 特定のドキュメントを削除します
🧹 clear_knowledge_base - すべてのドキュメントを削除します

📖 詳細な例: USAGE_GUIDE.md

よくある質問 (FAQ)

これはGitHubのMCPサーバーとどう違いますか？
それぞれ異なる目的を持ち、互いに補完し合います:

Context Lensの方が優れている点:

🧠 意味理解 - 「認証コードを見つける」という質問で、「認証」という単語がなくても、ログイン、資格情報、トークン、OAuthに関するコードが返されます
📚 コードベースの学習 - 「Xはどのように動作するか」と質問すると、プロジェクト全体で概念的に関連する結果が得られます
🔍 パターン発見 - 似たコードパターン、エラーハンドリングのアプローチ、またはアーキテクチャの決定を見つけることができます
💾 オフライン開発 - 一度インデックス化すると、インターネット接続なしでも動作します
🔒 プライバシー - すべての処理はローカルで行われ、外部サービスにデータは送信されません

GitHubのMCPサーバーの方が優れている点:

🔧 リポジトリ管理 - イシューの作成、PRの管理、CI/CD操作の処理
📊 リアルタイム状態 - 常にGitHubから最新バージョンを取得します
🌐 GitHub固有の機能 - GitHubのエコシステム（Actions、Projectsなど）と統合されます

主な違い: Context Lensは一度クローンし、すべてをインデックス化して高速な意味検索を行います（オフライン）。GitHub MCPは、クエリごとにAPI呼び出しを行い、リアルタイムアクセスを提供します（オンライン）。Context Lensを使用してコードを理解し、GitHub MCPを使用してリポジトリを管理します。

初回実行が遅いのはなぜですか？
初回使用時に埋め込みモデル（約100MB）がダウンロードされます。これは一度だけ行われます。

APIキーは必要ですか？
いいえ！Context Lensは完全にローカルで動作します。APIキーもクラウドサービスも必要ありません。

データはどこに保存されますか？
Context-Lensは、データをプラットフォーム固有のディレクトリに保存します:

macOS: ~/Library/Application Support/context-lens/
Linux: ~/.local/share/context-lens/
Windows: %LOCALAPPDATA%\context-lens\

CONTEXT_LENS_HOME環境変数を設定することで、ベースディレクトリを変更することができます:

{
  "mcpServers": {
    "context-lens": {
      "command": "uvx",
      "args": ["context-lens"],
      "env": {
        "CONTEXT_LENS_HOME": "/path/to/your/data"
      }
    }
  }
}

または、LANCE_DB_PATH（データベース）とEMBEDDING_CACHE_DIR（モデル）で個々のパスを上書きすることもできます。

これをプライベートコードで使用できますか？
はい！すべての処理はローカルで行われます。外部サービスに何も送信されません。

どれくらいのディスク容量を使用しますか？
モデルに約100MB + テキストチャンクごとに約1KB。10MBのコードベースでは、約5 - 10MBのデータベース容量が使用されます。

📖 その他の質問: TROUBLESHOOTING.md

その他のドキュメント

📖 セットアップガイド - すべてのクライアントの詳細なセットアップ、設定オプション
📚 使用ガイド - 例、クエリ、およびベストプラクティス
🎨 パーシングの例 - スマートパーシングの動作方法
🔧 トラブルシューティング - 一般的な問題と解決策
⚙️ 技術的詳細 - アーキテクチャ、スタック、およびパフォーマンス
📋 レジストリ情報 - MCPレジストリの検証とインストール
🤝 コントリビュートガイド - コントリビュートの方法、ロードマップ
📦 公開ガイド - MCPレジストリの公開プロセス（メンテナー向け）

🔧 技術詳細

アーキテクチャ

Context Lens Architecture

動作原理

コンテンツをContext Lensに追加すると、単にテキストをデータベースに投入するだけではありません。実際には以下のようなことが行われます:

スマートな読み取り: Context Lensはファイルタイプを検出し、専用のパーサーを使用します。PythonファイルはASTパーシングで分析され、JSONは構造的にパースされ、Markdownはヘッダーで分割されます。これにより、コンテンツの自然な構造が保持されます。

意味のあるチャンク: 任意の文字制限ではなく、コンテンツはインテリジェントにチャンク化されます - 完全な関数、論理的な段落、完全なセクション。コードは関数の途中で分割されることはありません。

意味ベクトル: 各チャンクは、ローカルの埋め込みモデルを使用して384次元のベクトルに変換されます。これらのベクトルは、単語だけでなく意味を捉えます。「認証」と「ログインシステム」は、共通の単語がなくても、似たベクトルになります。

ローカルストレージ: すべてがLanceDB - ディスク上の単一のファイルであるサーバーレスベクトルデータベースに保存されます。クラウドサービスやAPI呼び出しは必要ありません。完全にプライベートです。

概念検索: 質問すると、それもベクトルに変換されます。Context Lensは、似たベクトル（似た意味）を持つチャンクを見つけ、関連性でランク付けします。キーワードの一致ではなく、概念に基づいた回答が得られます。

技術仕様

プロパティ	詳細
埋め込みモデル	`sentence-transformers/all-MiniLM-L6-v2`
ベクトル次元数	384次元
モデルサイズ	~90MB（初回使用時にダウンロード）
チャンクサイズ	1000文字（デフォルト、設定可能）
チャンクオーバーラップ	200文字（デフォルト、設定可能）
ベクトルデータベース	LanceDB（サーバーレス、ファイルベース）
ストレージ形式	Apache Arrow列形式
検索方法	コサイン類似度
処理	100%ローカル、外部API呼び出しなし