Local Wikipedia
L

Local Wikipedia

Local-Wikipedia是一个MCP服务器,通过一次性下载将维基百科离线化,支持全文搜索和离线阅读,专为小型本地LLM设计,提供快速、低内存的搜索体验。
2.5分
8.6K

什么是Local-Wikipedia?

Local-Wikipedia是一个Model Context Protocol (MCP)服务器,它允许您将维基百科完整地下载到本地计算机上。下载完成后,您就可以在没有互联网连接的情况下搜索和阅读维基百科文章。它特别适合与本地运行的小型语言模型(LLM)配合使用,为AI助手提供可靠的离线知识库。

如何使用Local-Wikipedia?

使用非常简单:通过Docker Compose一键启动,服务器会自动下载指定语言的维基百科数据并建立索引。完成后,您的AI助手(如Claude Desktop)就可以通过MCP协议连接到它,使用搜索和随机阅读功能。整个过程无需复杂的配置。

适用场景

1. 离线研究:在没有网络的环境下查找资料 2. 隐私保护:避免向在线API发送敏感查询 3. 高频搜索:不受API速率限制,可反复搜索 4. 小型LLM增强:为本地运行的小模型提供知识支持 5. 教育用途:在课堂或实验室中提供稳定的参考资料

主要功能

智能全文搜索
不仅支持精确标题匹配,还能进行全文内容搜索。即使记不清完整标题,也能找到相关文章。
完全离线使用
数据一次性下载后永久存储在本地,无需网络连接即可访问所有功能。
智能查询修正
自动清理AI助手可能产生的多余或错误查询词,提高搜索准确性。
随机文章阅读
可以从指定语言的维基百科中随机获取一篇文章,用于探索性学习或测试。
多语言支持
支持多种语言的维基百科版本,包括中文、英文、日文等。
高效索引技术
使用PGroonga进行快速全文索引,搜索响应迅速,内存占用低。
优势
🔍 真正的全文搜索能力,不依赖外部API
📶 完全离线工作,下载后无需网络
⚡ 无API速率限制,支持高频次搜索
🤖 专为小型LLM优化,查询简洁高效
🔧 易于扩展新功能,数据完全本地化
🌐 支持多语言维基百科版本
局限性
⏳ 初始下载和索引时间较长(英文版需数小时)
💾 需要足够的磁盘空间存储数据
🔄 数据不是实时更新,需要手动更新数据集
🔒 当前版本不适合直接公开为API服务
⚙️ 需要Docker环境运行

如何使用

环境准备
确保您的计算机已安装Docker和Docker Compose。这是运行Local-Wikipedia的前提条件。
下载项目
从GitHub克隆Local-Wikipedia项目到本地。
配置语言
根据需要修改config.yaml文件中的语言设置(默认为日语)。
启动服务
使用Docker Compose启动服务。首次运行会自动下载和索引维基百科数据。
配置AI助手
在您的AI助手(如Claude Desktop)的MCP配置中添加Local-Wikipedia服务器。

使用案例

学术研究辅助
在撰写论文时,快速查找相关概念的定义和历史发展。
离线学习工具
在没有网络的环境下(如飞机、偏远地区)进行自主学习。
AI助手知识增强
为本地运行的小型语言模型提供准确的事实核查能力。
随机知识探索
通过随机阅读功能发现新知识,激发学习兴趣。

常见问题

下载维基百科数据需要多长时间?
需要多少磁盘空间?
数据会定期更新吗?
支持哪些语言?
可以在生产环境中公开使用吗?
如何更改默认端口?

相关资源

GitHub项目仓库
Local-Wikipedia的源代码和最新版本
MCP协议文档
Model Context Protocol官方规范
维基百科数据集
Local-Wikipedia使用的Markdown格式维基百科数据
Docker安装指南
Docker和Docker Compose的安装教程
PGroonga文档
Local-Wikipedia使用的全文搜索引擎技术
维基百科使用条款
维基百科内容使用的CC BY-SA 4.0许可证

安装

复制以下命令到你的Client进行配置
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

A
Airweave
Airweave是一个开源的人工智能代理和RAG系统的上下文检索层,它连接并同步各种应用程序、工具和数据库的数据,通过统一的搜索接口为AI代理提供相关、实时、多源的上下文信息。
Python
7.1K
5分
V
Vestige
Vestige是一个基于认知科学的AI记忆引擎,通过实现预测误差门控、FSRS-6间隔重复、记忆梦境等29个神经科学模块,为AI提供长期记忆能力。包含3D可视化仪表板和21个MCP工具,完全本地运行,无需云端。
Rust
5.6K
4.5分
M
Moltbrain
MoltBrain是一个为OpenClaw、MoltBook和Claude Code设计的长期记忆层插件,能够自动学习和回忆项目上下文,提供智能搜索、观察记录、分析统计和持久化存储功能。
TypeScript
4.1K
4.5分
B
Better Icons
一个提供超过20万图标搜索和检索的MCP服务器和CLI工具,支持150多个图标库,帮助AI助手和开发者快速获取和使用图标。
TypeScript
5.7K
4.5分
H
Haiku.rag
Haiku RAG是一个基于LanceDB、Pydantic AI和Docling构建的智能检索增强生成系统,支持混合搜索、重排序、问答代理、多代理研究流程,并提供本地优先的文档处理和MCP服务器集成。
Python
10.2K
5分
C
Claude Context
Claude Context是一个MCP插件,通过语义代码搜索为AI编程助手提供整个代码库的深度上下文,支持多种嵌入模型和向量数据库,实现高效代码检索。
TypeScript
16.7K
5分
A
Acemcp
Acemcp是一个代码库索引和语义搜索的MCP服务器,支持自动增量索引、多编码文件处理、.gitignore集成和Web管理界面,帮助开发者快速搜索和理解代码上下文。
Python
18.0K
5分
M
MCP
微软官方MCP服务器,为AI助手提供最新微软技术文档的搜索和获取功能
15.0K
5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
150.8K
5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
86.2K
4.3分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
75.9K
4.5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
32.1K
4.8分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
49.3K
4.5分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
56.7K
5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
106.4K
4.7分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
65.1K
4.8分
AIBase
智启未来,您的人工智能解决方案智库
© 2026AIBase