doc2mdはMCPサーバーで、PDF、DOCX、PPTXファイルをきれいなMarkdownファイルに変換し、LLMツールチェーン、RAGパイプライン、その他のMCPサーバーでリソースとして使用できます。
2ポイント
5.2K

doc2mdとは?

doc2mdは、AIワークフロー用に設計されたドキュメント変換ツールです。一般的なオフィスドキュメント形式(PDF、Word、PowerPoint)を自動的に識別し、純粋なテキストのMarkdown形式に変換します。変換後のファイルは、元のドキュメントの構造(タイトル、リスト、テーブルなど)を保持し、ファイルシステムに直接保存され、他のMCPサーバーやAIツールが直接読み取って使用できます。

doc2mdの使い方は?

doc2mdは、いくつかの方法で使用できます。独立したコマンドラインツールとして、Claude DesktopやCursorなどのAIアシスタントに統合するか、Dockerコンテナで実行することができます。基本的な流れは、1) MCPクライアントをdoc2mdサーバーに接続するように設定すること、2) AIアシスタントを通じて変換命令を送信するか、直接ツールを呼び出すこと、3) 指定された出力ディレクトリで変換されたMarkdownファイルを取得することです。

適用シーン

doc2mdは、大量の履歴ドキュメントを処理する必要があるチームや個人に最適です。たとえば、会社が長年にわたって蓄積したPDFレポート、Wordプロポーザル、PowerPointプレゼンテーションを一括でテキストに変換し、企業の知識ベースを構築するか、RAG(検索強化生成)システムに接続して、AIがこれらのドキュメント内容に基づいて質問と分析を行えるようにします。

主要機能

多形式サポート
PDF、DOCX (Microsoft Word)、PPTX (Microsoft PowerPoint) の3つの主流のドキュメント形式の変換をサポートします。
構造保持
ドキュメントの元の構造(タイトル階層、段落、リスト、テーブル、ハイパーリンクなど)をスマートに識別して保持し、組織的なMarkdownを生成します。
MCPネイティブ統合
標準的なMCPサーバーとして、Claude Desktop、Cursor、Claude CodeなどのMCPをサポートするAI開発環境にシームレスに統合できます。
一括変換
一括変換ツールを提供し、複数のファイルを一度に処理し、変換結果をまとめることができ、大量のドキュメントを処理するのに適しています。
柔軟な入力方法
ファイルパスを直接指定することも、Base64エンコードでファイル内容を渡すこともでき、サンドボックス環境やネットワーク伝送シナリオに対応しています。
Dockerサポート
公式のDockerイメージを提供し、コンテナ化環境でのデプロイと実行を容易にし、環境の一貫性を保証します。
利点
即座に使用可能:インストールと設定が簡単で、主流のAIアシスタントとの統合が容易です。
標準化された出力:統一されたMarkdown形式を生成し、後続のドキュメント処理と分析のプロセスを大幅に簡素化します。
生産性の向上:退屈なドキュメント形式変換作業を自動化し、チームが内容自体に集中できるようにします。
技術スタックに友好的:純粋なテキストのMarkdownファイルは、バージョン管理システム(Gitなど)で管理しやすく、さまざまなテキスト処理ツールで操作するのも容易です。
制限
形式の損失:複雑なレイアウト、特定のフォント、正確な位置などのリッチな形式情報は、変換中に失われ、内容と基本構造に焦点を当てます。
画像処理の制限:画像の存在を検出できますが、画像内の文字を抽出または変換することはできません(OCR)。
環境依存:Dockerまたはサンドボックス環境で実行する場合、ファイルパスのマッピングとアクセス権限の問題に注意する必要があります。

使い方

doc2mdをインストールする
doc2mdをインストールする適切な方法を選択してください。最も推奨されるのは、pipまたはuvを使用してインストールすることです。
MCPクライアントを設定する
使用しているAIアシスタント(Claude Desktopなど)の設定ファイルに、doc2mdをMCPサーバーとして追加してください。以下はClaude Desktopの設定例です。
起動して使用する
AIアシスタントを再起動してください。その後、自然言語の命令(「このPDFファイルを変換して」など)でdoc2mdの機能を直接呼び出すことができ、変換後のファイルは指定された場所に保存されます。

使用例

例1:プロジェクトの知識ベースを構築する
プロジェクトマネージャーは、大量の履歴プロジェクトドキュメント(PDFレポート、Wordプロポーザル、PPT振り返り)を持っています。彼はdoc2mdを使用してこれらのすべてのドキュメントをMarkdownに一括変換し、出力フォルダを別の「ファイル検索」MCPサーバーのリソースとして提供します。これで、彼はAIアシスタントに任意の履歴プロジェクトに関する質問を直接することができます。
例2:Claude Desktopでドキュメントを即時に閲覧する
アナリストは、新しいPDF形式の市場調査レポートを受け取りました。彼女はPDFリーダーを開きたくなく、Claude Desktop内で直接AIにレポートを要約させます。彼女はまずClaudeにdoc2mdを呼び出してPDFを変換するように指示し、生成されたMarkdownファイルに基づいて質問を行います。
例3:ネットワークからのドキュメントを処理する
開発者はサンドボックス環境で作業しており、ホストのファイルシステムに直接アクセスできません。彼はDOCXファイルをダウンロードし、そのBase64エンコードを取得しました。彼はdoc2mdのBase64入力機能を使用して、エンコードされた内容を直接渡して変換します。

よくある質問

変換後のMarkdownファイルはどこに保存されますか?
Dockerで実行するときにファイルが見つからない場合はどうすればいいですか?
画像内の文字を変換することはできますか?
Excel (.xlsx) ファイルを変換できますか?
変換中にエラーが発生すると、他のファイルに影響しますか?

関連リソース

GitHubリポジトリ
doc2mdのソースコードにアクセスし、問題を報告したり、貢献したりします。
PyPIプロジェクトページ
Pythonパッケージインデックスでプロジェクトの詳細とリリース履歴を確認します。
Docker Hubイメージ
公式のDockerイメージを取得し、使用方法を確認します。
Model Context Protocol (MCP) 公式サイト
MCPプロトコルの公式ドキュメントと仕様を確認し、doc2mdの動作の基礎を理解します。

インストール

以下のコマンドをクライアントにコピーして設定
{
  "mcpServers": {
    "doc2md": {
      "command": "python",
      "args": ["-m", "doc2md"],
      "env": {
        "TRANSPORT": "stdio"
      }
    }
  }
}

{
  "mcpServers": {
    "doc2md": {
      "command": "docker",
      "args": [
        "run", "--rm", "-i",
        "-v", "/path/to/your/files:/data",
        "benguy1000/doc2md"
      ]
    }
  }
}

{
  "mcpServers": {
    "doc2md": {
      "command": "python",
      "args": ["-m", "doc2md"]
    }
  }
}

{
  "mcpServers": {
    "doc2md": {
      "command": "python",
      "args": ["-m", "doc2md"],
      "transport": "stdio"
    }
  }
}

{
  "mcpServers": {
    "doc2md": {
      "url": "http://localhost:3000/sse",
      "transport": "sse"
    }
  }
}
注意:あなたのキーは機密情報です。誰とも共有しないでください。

代替品

A
Airweave
Airweaveは、オープンソースの人工知能エージェントとRAGシステムのコンテキスト検索層です。さまざまなアプリケーション、ツール、データベースのデータを接続して同期し、統一された検索インターフェースを通じてAIエージェントに関連する、リアルタイムの、複数のデータソースからのコンテキスト情報を提供します。
Python
7.1K
5ポイント
V
Vestige
Vestigeは認知科学に基づくAI記憶エンジンで、予測誤差ゲート、FSRS - 6間隔反復、記憶の夢など29の神経科学モジュールを実装することで、AIに長期記憶能力を提供します。3D可視化ダッシュボードと21のMCPツールを備え、完全にローカルで動作し、クラウドは必要ありません。
Rust
4.8K
4.5ポイント
M
Moltbrain
MoltBrainは、OpenClaw、MoltBook、Claude Code用に設計された長期記憶層プラグインで、自動的にプロジェクトのコンテキストを学習し、思い出すことができます。スマートな検索、観察記録、分析統計、永続的なストレージ機能を提供します。
TypeScript
4.3K
4.5ポイント
B
Bm.md
機能豊富なMarkdown排版ツールで、様々なスタイルテーマとプラットフォーム対応をサポートし、リアルタイム編集プレビュー、画像エクスポート、API統合機能を提供します
TypeScript
4.9K
5ポイント
S
Security Detections MCP
Security Detections MCPは、Model Context Protocolに基づくサーバーで、LLMがSigma、Splunk ESCU、Elastic、KQL形式を含む統一されたセキュリティ検出ルールデータベースをクエリできます。最新のバージョン3.0は自律型検出エンジニアリングプラットフォームにアップグレードされ、自動的に脅威インテリジェンスからTTPを抽出し、カバレッジのギャップを分析し、SIEMネイティブ形式の検出ルールを生成し、テストを実行して検証できます。プロジェクトには71以上のツール、11の事前構築されたワークフロープロンプト、および知識グラフシステムが含まれ、複数のSIEMプラットフォームをサポートしています。
TypeScript
6.2K
4ポイント
P
Paperbanana
Python
6.3K
5ポイント
B
Better Icons
20万以上のアイコンの検索と検索を提供するMCPサーバーとCLIツールで、150以上のアイコンライブラリをサポートし、AIアシスタントと開発者が迅速にアイコンを取得して使用できるように支援します。
TypeScript
6.0K
4.5ポイント
A
Assistant Ui
assistant-uiは、生産レベルのAIチャットインターフェイスを迅速に構築するためのオープンソースのTypeScript/Reactライブラリで、組み合わせ可能なUIコンポーネント、ストリーミング応答、アクセシビリティなどの機能を提供し、複数のAIバックエンドとモデルをサポートしています。
TypeScript
6.7K
5ポイント
E
Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
24.9K
4.8ポイント
G
Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
18.5K
4.5ポイント
C
Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
77.5K
4.7ポイント
B
Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
36.0K
4.5ポイント
G
Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
22.1K
4.3ポイント
U
Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
28.0K
5ポイント
M
Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
19.5K
5ポイント
S
Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
30.8K
4.5ポイント
AIBase
智啓未来、あなたの人工知能ソリューションシンクタンク
© 2026AIBase