Local Wikipedia
什麼是Local-Wikipedia?
Local-Wikipedia是一個Model Context Protocol (MCP)服務器,它允許您將維基百科完整地下載到本地計算機上。下載完成後,您就可以在沒有互聯網連接的情況下搜索和閱讀維基百科文章。它特別適合與本地運行的小型語言模型(LLM)配合使用,為AI助手提供可靠的離線知識庫。如何使用Local-Wikipedia?
使用非常簡單:通過Docker Compose一鍵啟動,服務器會自動下載指定語言的維基百科數據並建立索引。完成後,您的AI助手(如Claude Desktop)就可以通過MCP協議連接到它,使用搜索和隨機閱讀功能。整個過程無需複雜的配置。適用場景
1. 離線研究:在沒有網絡的環境下查找資料 2. 隱私保護:避免向在線API發送敏感查詢 3. 高頻搜索:不受API速率限制,可反覆搜索 4. 小型LLM增強:為本地運行的小模型提供知識支持 5. 教育用途:在課堂或實驗室中提供穩定的參考資料主要功能
智能全文搜索
不僅支持精確標題匹配,還能進行全文內容搜索。即使記不清完整標題,也能找到相關文章。
完全離線使用
數據一次性下載後永久存儲在本地,無需網絡連接即可訪問所有功能。
智能查詢修正
自動清理AI助手可能產生的多餘或錯誤查詢詞,提高搜索準確性。
隨機文章閱讀
可以從指定語言的維基百科中隨機獲取一篇文章,用於探索性學習或測試。
多語言支持
支持多種語言的維基百科版本,包括中文、英文、日文等。
高效索引技術
使用PGroonga進行快速全文索引,搜索響應迅速,內存佔用低。
優勢
🔍 真正的全文搜索能力,不依賴外部API
📶 完全離線工作,下載後無需網絡
⚡ 無API速率限制,支持高頻次搜索
🤖 專為小型LLM優化,查詢簡潔高效
🔧 易於擴展新功能,數據完全本地化
🌐 支持多語言維基百科版本
侷限性
⏳ 初始下載和索引時間較長(英文版需數小時)
💾 需要足夠的磁盤空間存儲數據
🔄 數據不是即時更新,需要手動更新數據集
🔒 當前版本不適合直接公開為API服務
⚙️ 需要Docker環境運行
如何使用
環境準備
確保您的計算機已安裝Docker和Docker Compose。這是運行Local-Wikipedia的前提條件。
下載項目
從GitHub克隆Local-Wikipedia項目到本地。
配置語言
根據需要修改config.yaml文件中的語言設置(默認為日語)。
啟動服務
使用Docker Compose啟動服務。首次運行會自動下載和索引維基百科數據。
配置AI助手
在您的AI助手(如Claude Desktop)的MCP配置中添加Local-Wikipedia服務器。
使用案例
學術研究輔助
在撰寫論文時,快速查找相關概念的定義和歷史發展。
離線學習工具
在沒有網絡的環境下(如飛機、偏遠地區)進行自主學習。
AI助手知識增強
為本地運行的小型語言模型提供準確的事實核查能力。
隨機知識探索
通過隨機閱讀功能發現新知識,激發學習興趣。
常見問題
下載維基百科數據需要多長時間?
需要多少磁盤空間?
數據會定期更新嗎?
支持哪些語言?
可以在生產環境中公開使用嗎?
如何更改默認端口?
相關資源
GitHub項目倉庫
Local-Wikipedia的源代碼和最新版本
MCP協議文檔
Model Context Protocol官方規範
維基百科數據集
Local-Wikipedia使用的Markdown格式維基百科數據
Docker安裝指南
Docker和Docker Compose的安裝教程
PGroonga文檔
Local-Wikipedia使用的全文搜索引擎技術
維基百科使用條款
維基百科內容使用的CC BY-SA 4.0許可證

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
23.6K
5分

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
31.2K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
85.7K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
25.1K
4.5分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
14.1K
4.5分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
16.2K
5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
18.9K
4.8分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
57.1K
4.7分





