Haiku.rag
H

Haiku.rag

Haiku RAG是一個基於LanceDB、Pydantic AI和Docling構建的智能檢索增強生成系統,支持混合搜索、重排序、問答代理、多代理研究流程,並提供本地優先的文檔處理和MCP服務器集成。
5分
4.8K

什麼是Haiku RAG?

Haiku RAG是一個先進的文檔智能處理系統,它結合了文檔檢索、向量搜索和人工智能問答功能。您可以將各種文檔(如PDF、網頁內容)添加到系統中,然後通過自然語言提問來獲取文檔中的信息。系統會自動找到相關的內容片段,並生成帶有引用的答案。

如何使用Haiku RAG?

使用Haiku RAG非常簡單:首先將您的文檔添加到系統中,然後就可以通過搜索關鍵詞或直接提問來獲取信息。系統支持多種使用方式,包括命令行工具、Python編程接口,以及集成到AI助手(如Claude Desktop)中作為工具使用。

適用場景

Haiku RAG特別適合以下場景:學術研究(快速查找論文中的信息)、企業知識庫管理(檢索內部文檔)、法律文檔分析、技術文檔查詢、以及任何需要從大量文檔中快速提取信息的場景。

主要功能

混合搜索
同時使用向量搜索和全文搜索技術,結合兩種方法的優勢,提供更準確的搜索結果。
智能問答
不僅能搜索關鍵詞,還能理解問題並生成帶有引用(頁碼、章節標題)的完整答案。
研究助手
多步驟研究流程:規劃、搜索、評估、綜合,幫助處理複雜的研究問題。
文檔結構感知
理解文檔的完整結構(標題、段落、表格等),提供更準確的上下文信息。
視覺定位
在原始頁面圖像上高亮顯示找到的內容片段,直觀展示信息來源。
時間回溯
查詢數據庫在任意歷史時間點的狀態,支持版本控制和歷史分析。
多服務商支持
支持OpenAI、Ollama、VoyageAI等多種AI服務和嵌入模型。
本地優先
無需服務器即可運行,所有數據存儲在本地。也支持雲存儲選項。
AI助手集成
可作為工具集成到Claude Desktop等AI助手中,直接在對話中使用。
文件監控
監控目錄變化,自動索引新增或修改的文檔。
優勢
開箱即用:安裝簡單,配置友好,快速上手
功能全面:從基礎搜索到複雜研究分析一應俱全
靈活部署:支持本地運行和雲服務,適應不同需求
智能高效:AI驅動的搜索和問答,節省人工查找時間
引用準確:提供精確的頁碼和章節引用,方便驗證
擴展性強:支持多種文檔格式和AI模型
侷限性
技術要求:需要Python 3.12或更新版本
硬件需求:處理大量文檔或使用大型模型時需要足夠內存
學習曲線:高級功能(如研究助手)需要一定時間熟悉
模型依賴:某些功能依賴於外部AI服務的可用性
文檔格式:對非標準格式的文檔支持可能有限

如何使用

安裝Haiku RAG
使用uv包管理器安裝完整版或精簡版。完整版包含所有功能,精簡版可按需安裝組件。
添加文檔
將您的PDF、網頁或其他文檔添加到系統中。系統會自動處理文檔內容並建立索引。
搜索內容
使用關鍵詞搜索文檔中的相關內容。系統會返回最匹配的片段。
提問獲取答案
直接提出問題,系統會從文檔中查找相關信息並生成完整答案。
使用研究助手
對於複雜問題,使用研究助手進行多步驟分析和綜合。

使用案例

學術論文研究
研究人員需要快速瞭解一篇長論文的核心內容和方法細節。
技術文檔查詢
開發人員需要從多個API文檔中查找特定功能的用法。
法律文檔分析
律師需要對比合同條款在不同版本中的變化。
企業知識庫管理
新員工需要快速瞭解公司政策和流程。

常見問題

Haiku RAG支持哪些類型的文檔?
是否需要聯網使用?
如何集成到Claude Desktop中?
處理大量文檔需要多少存儲空間?
是否可以自定義搜索和問答的AI模型?
如何確保搜索結果的準確性?

相關資源

官方文檔
完整的安裝、配置和使用指南
GitHub倉庫
源代碼和問題追蹤
示例項目
包含Docker部署、研究助手等實際示例
Pydantic AI
底層使用的AI框架文檔
LanceDB
向量數據庫技術文檔

安裝

複製以下命令到你的Client進行配置
{
  "mcpServers": {
    "haiku-rag": {
      "command": "haiku-rag",
      "args": ["serve", "--mcp", "--stdio"]
    }
  }
}
注意:您的密鑰屬於敏感信息,請勿與任何人分享。

替代品

M
Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
26.3K
5分
B
Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
33.0K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
90.5K
5分
S
Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
26.5K
4.5分
N
Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
15.0K
4.5分
M
Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
16.9K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
20.2K
4.8分
C
Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
61.9K
4.7分
AIBase
智啟未來,您的人工智慧解決方案智庫
© 2025AIBase