Local Wikipedia
L

Local Wikipedia

2.5ポイント
0

インストール

以下のコマンドをクライアントにコピーして設定
注意:あなたのキーは機密情報です。誰とも共有しないでください。

🚀 Local-Wikipedia

Local-Wikipediaは、Wikipediaをオフラインで利用できるようにするMCPサーバーです。一度ダウンロードすれば、記事を検索して読むことができます。

これが重要な理由は以下の通りです。

  1. Wikipedia全体の全文検索
    • ほとんどのMCPサーバーは、正確なタイトル一致と基本的なリダイレクト処理のみをサポートしています。
    • Local-Wikipediaは全文をローカルに保存するため、本当の全文検索を実行できます。
  2. 一度ダウンロードすれば、インターネットがなくても利用可能
    • データがローカルに保存されているため、オフラインでもWikipediaの記事を検索して読むことができます。
  3. 高い検索頻度に対応
    • Web APIのレート制限がないため、好きなだけ検索を繰り返して改良することができます。
    • クエリを柔軟に解釈し、繰り返し検索を行うユースケースに最適です。
  4. 全文がローカルにあるため、拡張が容易
    • コーパス全体が手元にあるため、他のMCPサーバーでは難しい機能をここでは簡単に実装できます。
      • 他のMCPサーバーは依存するWeb APIに制約される可能性がありますが、Local-Wikipediaはそのような制約を受けません。
    • 例えば、「ランダムな記事を取得する」機能を追加するのは簡単です。

このMCPサーバーは、小規模なローカルLLMとうまく組み合わせるように設計されています。大規模なLLMが利用できない環境でも、柔軟にWikipediaを検索して情報を取得することができます。我々は、Gemma 3n E4Bというコンパクトなモバイル向けモデルで検証しており、CPUのみの環境でも高速に動作します。

小規模LLMにやさしいように、いくつかの配慮がなされています。

  1. 引数が最小限の2つのツールのみを提供するため、LLMが確実に呼び出すことができます。
  2. ヒューリスティックなクエリ修正機能により、LLMからの過剰指定またはノイズの多い入力をクリーンアップします。
  3. コンテキストウィンドウが短く、計算資源が限られている場合でも高速に動作するように、簡潔で状況に応じた出力を提供します。
  4. 高速な検索と低メモリ使用のための高度なDBインデックスを使用しています。初期セットアップには少し時間がかかりますが、一度完了すれば高速に動作します。

🚀 クイックスタート

✨ 主な機能

このMCPサーバーは以下の2つのツールを提供します。

search_article

指定されたタイトルで記事を柔軟に検索し、適切な結果を返します。複数の検索戦略が1つのツールに統合されているため、LLMがツールを簡単に使用できます。

検索方法には以下のものがあります。

  1. 正確なタイトル一致
  2. 正確なリダイレクト一致
  3. 部分的なタイトル一致
  4. 部分的なリダイレクト一致
  5. 本文の全文検索

1と2の場合は、記事の冒頭部分(要約)が返されます。3、4、5の場合は、最大20件の結果が返されます。

また、LLMが誤って余分なまたは関係のない詳細をツールに渡した場合に備えて、ヒューリスティックなクエリ修正機能もあります。

read_random_article

指定された言語版のWikipediaからランダムな記事を取得します。

📦 インストール

すべてをDocker Composeでセットアップします。以下の手順に従ってください。

DockerとDocker Composeがインストールされていることを確認してください。

git clone https://github.com/soukouki/local-wikipedia.git
cd local-wikipedia
docker-compose up

初回実行時には、config.yamlで指定された言語のWikipediaデータがダウンロードされ、インデックスが作成されます。これには時間がかかることがあります。日本語の場合は約数十分、英語の場合は数時間かかることがあります。ダウンロードには安定した光回線を使用することをお勧めします。

セットアップが完了すると、MCPサーバーが起動します。デフォルトでは、ポート29423で待機します。以下のように接続します。

{
  "servers": {
    "local-wikipedia": {
      "url": "http://localhost:29423"
    }
  }
}

🔧 技術詳細

Local-Wikipediaは、公式のWikipediaダンプデータ(ページとリダイレクト)と、HuggingFaceFW/finewiki · Datasets at Hugging Faceで公開されているMarkdown形式の全文データセットを使用しています。

全文検索には、PGroongaを使用しており、日本語と英語の両方で高速かつメモリ効率の良い検索を提供します。

📄 ライセンス

  • 現在のLocal-Wikipediaの実装は、パブリックAPIアクセス用に設計されていません。APIを外部に公開する場合は、セキュリティ上の理由から適切なコード修正を行うことをお勧めします。
  • Wikipediaのコンテンツは、Creative Commons Attribution-ShareAlike 4.0 International License (CC BY-SA 4.0) とGNU Free Documentation License (GFDL) の両方のライセンスの下で提供されています。

代替品

C
Claude Context
Claude ContextはMCPプラグインで、セマンティックコード検索によりAIプログラミングアシスタントにコードベース全体の深いコンテキストを提供し、複数の埋め込みモデルとベクトルデータベースをサポートし、効率的なコード検索を実現します。
TypeScript
5.7K
5ポイント
A
Acemcp
Acemcpは、コードライブラリのインデックス化と意味検索を行うMCPサーバーです。自動増分インデックス、複数エンコーディングファイルの処理、.gitignore統合、およびWeb管理インターフェイスをサポートしており、開発者がコードのコンテキストをすばやく検索し、理解するのに役立ちます。
Python
9.8K
5ポイント
M
MCP
Microsoft公式のMCPサーバーで、AIアシスタントに最新のMicrosoft技術ドキュメントの検索と取得機能を提供します。
13.0K
5ポイント
C
Cipher
Cipherは、プログラミングAIエージェント向けに設計されたオープンソースのメモリ層フレームワークです。MCPプロトコルを通じてさまざまなIDEとAIコーディングアシスタントと統合し、自動記憶生成、チーム記憶共有、デュアルシステム記憶管理などの核心機能を提供します。
TypeScript
0
5ポイント
A
Annas MCP
Anna's ArchiveのMCPサーバーとCLIツールは、このプラットフォームのドキュメントを検索およびダウンロードするためのもので、APIキーを使用したアクセスをサポートしています。
Go
6.2K
4.5ポイント
S
Search1api
Search1API MCPサーバーは、Model Context Protocol (MCP)に基づくサーバーで、検索とクローリング機能を提供し、複数の検索サービスとツールをサポートします。
TypeScript
12.8K
4ポイント
D
Duckduckgo MCP Server
認証済み
DuckDuckGo検索MCPサーバーは、ClaudeなどのLLMにウェブ検索とコンテンツ取得サービスを提供します。
Python
50.0K
4.3ポイント
B
Bing Search MCP
Microsoft Bing検索APIを統合するためのMCPサーバーで、ウェブページ、ニュース、画像の検索機能をサポートし、AIアシスタントにウェブ検索機能を提供します。
Python
14.8K
4ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
17.6K
4.8ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
14.6K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
57.6K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
29.2K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
14.9K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
18.9K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
16.3K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
25.6K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2025AIBase