Local Wikipedia
什麼是Local-Wikipedia?
Local-Wikipedia是一個Model Context Protocol (MCP)服務器,它允許您將維基百科完整地下載到本地計算機上。下載完成後,您就可以在沒有互聯網連接的情況下搜索和閱讀維基百科文章。它特別適合與本地運行的小型語言模型(LLM)配合使用,為AI助手提供可靠的離線知識庫。如何使用Local-Wikipedia?
使用非常簡單:通過Docker Compose一鍵啟動,服務器會自動下載指定語言的維基百科數據並建立索引。完成後,您的AI助手(如Claude Desktop)就可以通過MCP協議連接到它,使用搜索和隨機閱讀功能。整個過程無需複雜的配置。適用場景
1. 離線研究:在沒有網絡的環境下查找資料 2. 隱私保護:避免向在線API發送敏感查詢 3. 高頻搜索:不受API速率限制,可反覆搜索 4. 小型LLM增強:為本地運行的小模型提供知識支持 5. 教育用途:在課堂或實驗室中提供穩定的參考資料主要功能
智能全文搜索
不僅支持精確標題匹配,還能進行全文內容搜索。即使記不清完整標題,也能找到相關文章。
完全離線使用
數據一次性下載後永久存儲在本地,無需網絡連接即可訪問所有功能。
智能查詢修正
自動清理AI助手可能產生的多餘或錯誤查詢詞,提高搜索準確性。
隨機文章閱讀
可以從指定語言的維基百科中隨機獲取一篇文章,用於探索性學習或測試。
多語言支持
支持多種語言的維基百科版本,包括中文、英文、日文等。
高效索引技術
使用PGroonga進行快速全文索引,搜索響應迅速,內存佔用低。
優勢
🔍 真正的全文搜索能力,不依賴外部API
📶 完全離線工作,下載後無需網絡
⚡ 無API速率限制,支持高頻次搜索
🤖 專為小型LLM優化,查詢簡潔高效
🔧 易於擴展新功能,數據完全本地化
🌐 支持多語言維基百科版本
侷限性
⏳ 初始下載和索引時間較長(英文版需數小時)
💾 需要足夠的磁盤空間存儲數據
🔄 數據不是即時更新,需要手動更新數據集
🔒 當前版本不適合直接公開為API服務
⚙️ 需要Docker環境運行
如何使用
環境準備
確保您的計算機已安裝Docker和Docker Compose。這是運行Local-Wikipedia的前提條件。
下載項目
從GitHub克隆Local-Wikipedia項目到本地。
配置語言
根據需要修改config.yaml文件中的語言設置(默認為日語)。
啟動服務
使用Docker Compose啟動服務。首次運行會自動下載和索引維基百科數據。
配置AI助手
在您的AI助手(如Claude Desktop)的MCP配置中添加Local-Wikipedia服務器。
使用案例
學術研究輔助
在撰寫論文時,快速查找相關概念的定義和歷史發展。
離線學習工具
在沒有網絡的環境下(如飛機、偏遠地區)進行自主學習。
AI助手知識增強
為本地運行的小型語言模型提供準確的事實核查能力。
隨機知識探索
通過隨機閱讀功能發現新知識,激發學習興趣。
常見問題
下載維基百科數據需要多長時間?
需要多少磁盤空間?
數據會定期更新嗎?
支持哪些語言?
可以在生產環境中公開使用嗎?
如何更改默認端口?
相關資源
GitHub項目倉庫
Local-Wikipedia的源代碼和最新版本
MCP協議文檔
Model Context Protocol官方規範
維基百科數據集
Local-Wikipedia使用的Markdown格式維基百科數據
Docker安裝指南
Docker和Docker Compose的安裝教程
PGroonga文檔
Local-Wikipedia使用的全文搜索引擎技術
維基百科使用條款
維基百科內容使用的CC BY-SA 4.0許可證

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
27.4K
5分

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
35.2K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
102.3K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
27.8K
4.5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
20.4K
4.8分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
14.7K
4.5分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
67.7K
4.7分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
18.4K
5分




