Haiku.rag
H

Haiku.rag

Haiku RAG是一个基于LanceDB、Pydantic AI和Docling构建的智能检索增强生成系统,支持混合搜索、重排序、问答代理、多代理研究流程,并提供本地优先的文档处理和MCP服务器集成。
5分
3.8K

什么是Haiku RAG?

Haiku RAG是一个先进的文档智能处理系统,它结合了文档检索、向量搜索和人工智能问答功能。您可以将各种文档(如PDF、网页内容)添加到系统中,然后通过自然语言提问来获取文档中的信息。系统会自动找到相关的内容片段,并生成带有引用的答案。

如何使用Haiku RAG?

使用Haiku RAG非常简单:首先将您的文档添加到系统中,然后就可以通过搜索关键词或直接提问来获取信息。系统支持多种使用方式,包括命令行工具、Python编程接口,以及集成到AI助手(如Claude Desktop)中作为工具使用。

适用场景

Haiku RAG特别适合以下场景:学术研究(快速查找论文中的信息)、企业知识库管理(检索内部文档)、法律文档分析、技术文档查询、以及任何需要从大量文档中快速提取信息的场景。

主要功能

混合搜索
同时使用向量搜索和全文搜索技术,结合两种方法的优势,提供更准确的搜索结果。
智能问答
不仅能搜索关键词,还能理解问题并生成带有引用(页码、章节标题)的完整答案。
研究助手
多步骤研究流程:规划、搜索、评估、综合,帮助处理复杂的研究问题。
文档结构感知
理解文档的完整结构(标题、段落、表格等),提供更准确的上下文信息。
视觉定位
在原始页面图像上高亮显示找到的内容片段,直观展示信息来源。
时间回溯
查询数据库在任意历史时间点的状态,支持版本控制和历史分析。
多服务商支持
支持OpenAI、Ollama、VoyageAI等多种AI服务和嵌入模型。
本地优先
无需服务器即可运行,所有数据存储在本地。也支持云存储选项。
AI助手集成
可作为工具集成到Claude Desktop等AI助手中,直接在对话中使用。
文件监控
监控目录变化,自动索引新增或修改的文档。
优势
开箱即用:安装简单,配置友好,快速上手
功能全面:从基础搜索到复杂研究分析一应俱全
灵活部署:支持本地运行和云服务,适应不同需求
智能高效:AI驱动的搜索和问答,节省人工查找时间
引用准确:提供精确的页码和章节引用,方便验证
扩展性强:支持多种文档格式和AI模型
局限性
技术要求:需要Python 3.12或更新版本
硬件需求:处理大量文档或使用大型模型时需要足够内存
学习曲线:高级功能(如研究助手)需要一定时间熟悉
模型依赖:某些功能依赖于外部AI服务的可用性
文档格式:对非标准格式的文档支持可能有限

如何使用

安装Haiku RAG
使用uv包管理器安装完整版或精简版。完整版包含所有功能,精简版可按需安装组件。
添加文档
将您的PDF、网页或其他文档添加到系统中。系统会自动处理文档内容并建立索引。
搜索内容
使用关键词搜索文档中的相关内容。系统会返回最匹配的片段。
提问获取答案
直接提出问题,系统会从文档中查找相关信息并生成完整答案。
使用研究助手
对于复杂问题,使用研究助手进行多步骤分析和综合。

使用案例

学术论文研究
研究人员需要快速了解一篇长论文的核心内容和方法细节。
技术文档查询
开发人员需要从多个API文档中查找特定功能的用法。
法律文档分析
律师需要对比合同条款在不同版本中的变化。
企业知识库管理
新员工需要快速了解公司政策和流程。

常见问题

Haiku RAG支持哪些类型的文档?
是否需要联网使用?
如何集成到Claude Desktop中?
处理大量文档需要多少存储空间?
是否可以自定义搜索和问答的AI模型?
如何确保搜索结果的准确性?

相关资源

官方文档
完整的安装、配置和使用指南
GitHub仓库
源代码和问题追踪
示例项目
包含Docker部署、研究助手等实际示例
Pydantic AI
底层使用的AI框架文档
LanceDB
向量数据库技术文档

安装

复制以下命令到你的Client进行配置
{
  "mcpServers": {
    "haiku-rag": {
      "command": "haiku-rag",
      "args": ["serve", "--mcp", "--stdio"]
    }
  }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
70.5K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
122.7K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
63.8K
4.5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
29.4K
4.8分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
53.4K
4.8分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
46.7K
5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
89.5K
4.7分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
43.7K
4.5分
AIBase
智启未来,您的人工智能解决方案智库
© 2025AIBase