Haiku.rag
Haiku RAGは、LanceDB、Pydantic AI、Doclingを基盤とした高度な検索強化生成システムです。ハイブリッド検索、再ランキング、質問応答エージェント、多エージェント研究プロセスをサポートし、ローカルファーストのドキュメント処理とMCPサーバー統合を提供します。
5ポイント
15.6K

Haiku RAGとは?

Haiku RAGは、ドキュメント検索、ベクトル検索、人工知能による質問応答機能を統合した高度なドキュメント処理システムです。PDFやウェブコンテンツなどの様々なドキュメントをシステムに追加し、自然言語で質問することで、ドキュメント内の情報を取得できます。システムは自動的に関連するコンテンツを見つけ、引用付きの回答を生成します。

Haiku RAGの使い方は?

Haiku RAGの使用は非常に簡単です。まず、ドキュメントをシステムに追加し、キーワードを検索するか、直接質問することで情報を取得できます。システムはコマンドラインツール、Pythonプログラミングインターフェース、Claude DesktopなどのAIアシスタントに統合して使用するなど、複数の使用方法をサポートしています。

適用シーン

Haiku RAGは、以下のシーンに特に適しています。学術研究(論文内の情報を迅速に検索)、企業の知識ベース管理(内部ドキュメントの検索)、法律ドキュメント分析、技術ドキュメントの照会、および大量のドキュメントから迅速に情報を抽出する必要があるすべてのシーンです。

主な機能

ハイブリッド検索
ベクトル検索と全文検索技術を同時に使用し、両方の方法の利点を組み合わせて、より正確な検索結果を提供します。
スマートな質問応答
キーワード検索だけでなく、質問を理解し、引用(ページ番号、章タイトル)付きの完全な回答を生成します。
研究アシスタント
多段階の研究プロセス:計画、検索、評価、統合を行い、複雑な研究問題を解決するのを支援します。
ドキュメント構造認識
ドキュメントの完全な構造(タイトル、段落、表など)を理解し、より正確なコンテキスト情報を提供します。
ビジュアルグラウンディング
見つかったコンテンツを元のページ画像上にハイライト表示し、情報の出所を直感的に示します。
タイムトラベル
任意の過去の時点でのデータベースの状態を照会し、バージョン管理と履歴分析をサポートします。
複数のプロバイダーサポート
OpenAI、Ollama、VoyageAIなどの複数のAIサービスと埋め込みモデルをサポートします。
ローカルファースト
サーバーがなくても動作し、すべてのデータはローカルに保存されます。クラウドストレージオプションもサポートしています。
AIアシスタント統合
Claude DesktopなどのAIアシスタントにツールとして統合し、会話中で直接使用できます。
ファイル監視
ディレクトリの変更を監視し、新しく追加または変更されたドキュメントを自動的にインデックス化します。
利点
即時使用可能:簡単なインストールと設定で、すぐに始められます。
機能が充実:基本的な検索から複雑な研究分析まで、すべてを網羅しています。
柔軟なデプロイ:ローカル実行とクラウドサービスをサポートし、さまざまなニーズに対応します。
スマートで効率的:AIによる検索と質問応答で、手作業による検索時間を節約します。
正確な引用:正確なページ番号と章の引用を提供し、検証を容易にします。
拡張性が高い:複数のドキュメント形式とAIモデルをサポートします。
制限
技術要件:Python 3.12以上が必要です。
ハードウェア要件:大量のドキュメントを処理するか、大規模なモデルを使用する場合は、十分なメモリが必要です。
学習曲線:高度な機能(研究アシスタントなど)を習得するには、ある程度の時間が必要です。
モデル依存性:一部の機能は、外部AIサービスの可用性に依存します。
ドキュメント形式:非標準形式のドキュメントに対するサポートは制限される場合があります。

使い方

Haiku RAGのインストール
uvパッケージマネージャーを使用して、完全版または軽量版をインストールします。完全版にはすべての機能が含まれ、軽量版では必要に応じてコンポーネントをインストールできます。
ドキュメントの追加
PDF、ウェブページ、またはその他のドキュメントをシステムに追加します。システムは自動的にドキュメントの内容を処理し、インデックスを作成します。
コンテンツの検索
キーワードを使用して、ドキュメント内の関連するコンテンツを検索します。システムは最も一致する部分を返します。
質問して回答を取得
直接質問を投げかけると、システムはドキュメント内から関連する情報を検索し、完全な回答を生成します。
研究アシスタントの使用
複雑な問題に対しては、研究アシスタントを使用して多段階の分析と統合を行います。

使用例

学術論文の研究
研究者が長い論文の核心内容と方法の詳細を迅速に把握する必要がある場合。
技術ドキュメントの照会
開発者が複数のAPIドキュメントから特定の機能の使い方を検索する場合。
法律ドキュメントの分析
弁護士が契約条項の異なるバージョン間の変更を比較する必要がある場合。
企業の知識ベース管理
新入社員が会社の政策と手順を迅速に理解する必要がある場合。

よくある質問

Haiku RAGはどのようなタイプのドキュメントをサポートしていますか?
インターネット接続が必要ですか?
Claude Desktopにどのように統合できますか?
大量のドキュメントを処理するにはどれくらいのストレージ容量が必要ですか?
検索と質問応答のAIモデルをカスタマイズできますか?
検索結果の精度をどのように保証しますか?

関連リソース

公式ドキュメント
完全なインストール、設定、使用ガイド
GitHubリポジトリ
ソースコードと問題追跡
サンプルプロジェクト
Dockerデプロイ、研究アシスタントなどの実際のサンプルを含む
Pydantic AI
基盤となるAIフレームワークのドキュメント
LanceDB
ベクトルデータベース技術のドキュメント

インストール

以下のコマンドをクライアントにコピーして設定
{
  "mcpServers": {
    "haiku-rag": {
      "command": "haiku-rag",
      "args": ["serve", "--mcp", "--stdio"]
    }
  }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

A
Airweave
Airweaveは、オープンソースの人工知能エージェントとRAGシステムのコンテキスト検索層です。さまざまなアプリケーション、ツール、データベースのデータを接続して同期し、統一された検索インターフェースを通じてAIエージェントに関連する、リアルタイムの、複数のデータソースからのコンテキスト情報を提供します。
Python
13.7K
5ポイント
V
Vestige
Vestigeは認知科学に基づくAI記憶エンジンで、予測誤差ゲート、FSRS - 6間隔反復、記憶の夢など29の神経科学モジュールを実装することで、AIに長期記憶能力を提供します。3D可視化ダッシュボードと21のMCPツールを備え、完全にローカルで動作し、クラウドは必要ありません。
Rust
6.1K
4.5ポイント
M
Moltbrain
MoltBrainは、OpenClaw、MoltBook、Claude Code用に設計された長期記憶層プラグインで、自動的にプロジェクトのコンテキストを学習し、思い出すことができます。スマートな検索、観察記録、分析統計、永続的なストレージ機能を提供します。
TypeScript
6.2K
4.5ポイント
B
Better Icons
20万以上のアイコンの検索と検索を提供するMCPサーバーとCLIツールで、150以上のアイコンライブラリをサポートし、AIアシスタントと開発者が迅速にアイコンを取得して使用できるように支援します。
TypeScript
7.7K
4.5ポイント
H
Haiku.rag
Haiku RAGは、LanceDB、Pydantic AI、Doclingを基盤とした高度な検索強化生成システムです。ハイブリッド検索、再ランキング、質問応答エージェント、多エージェント研究プロセスをサポートし、ローカルファーストのドキュメント処理とMCPサーバー統合を提供します。
Python
15.6K
5ポイント
C
Claude Context
Claude ContextはMCPプラグインで、セマンティックコード検索によりAIプログラミングアシスタントにコードベース全体の深いコンテキストを提供し、複数の埋め込みモデルとベクトルデータベースをサポートし、効率的なコード検索を実現します。
TypeScript
30.7K
5ポイント
A
Acemcp
Acemcpは、コードライブラリのインデックス化と意味検索を行うMCPサーバーです。自動増分インデックス、複数エンコーディングファイルの処理、.gitignore統合、およびWeb管理インターフェイスをサポートしており、開発者がコードのコンテキストをすばやく検索し、理解するのに役立ちます。
Python
24.1K
5ポイント
M
MCP
Microsoft公式のMCPサーバーで、AIアシスタントに最新のMicrosoft技術ドキュメントの検索と取得機能を提供します。
15.4K
5ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
19.6K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
80.8K
4.7ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
23.8K
4.8ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
36.8K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
23.3K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
30.2K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
20.4K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
31.2K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2026AIBase