Doc2md
doc2mdとは?
doc2mdは、AIワークフロー用に設計されたドキュメント変換ツールです。一般的なオフィスドキュメント形式(PDF、Word、PowerPoint)を自動的に識別し、純粋なテキストのMarkdown形式に変換します。変換後のファイルは、元のドキュメントの構造(タイトル、リスト、テーブルなど)を保持し、ファイルシステムに直接保存され、他のMCPサーバーやAIツールが直接読み取って使用できます。doc2mdの使い方は?
doc2mdは、いくつかの方法で使用できます。独立したコマンドラインツールとして、Claude DesktopやCursorなどのAIアシスタントに統合するか、Dockerコンテナで実行することができます。基本的な流れは、1) MCPクライアントをdoc2mdサーバーに接続するように設定すること、2) AIアシスタントを通じて変換命令を送信するか、直接ツールを呼び出すこと、3) 指定された出力ディレクトリで変換されたMarkdownファイルを取得することです。適用シーン
doc2mdは、大量の履歴ドキュメントを処理する必要があるチームや個人に最適です。たとえば、会社が長年にわたって蓄積したPDFレポート、Wordプロポーザル、PowerPointプレゼンテーションを一括でテキストに変換し、企業の知識ベースを構築するか、RAG(検索強化生成)システムに接続して、AIがこれらのドキュメント内容に基づいて質問と分析を行えるようにします。主要機能
多形式サポート
PDF、DOCX (Microsoft Word)、PPTX (Microsoft PowerPoint) の3つの主流のドキュメント形式の変換をサポートします。
構造保持
ドキュメントの元の構造(タイトル階層、段落、リスト、テーブル、ハイパーリンクなど)をスマートに識別して保持し、組織的なMarkdownを生成します。
MCPネイティブ統合
標準的なMCPサーバーとして、Claude Desktop、Cursor、Claude CodeなどのMCPをサポートするAI開発環境にシームレスに統合できます。
一括変換
一括変換ツールを提供し、複数のファイルを一度に処理し、変換結果をまとめることができ、大量のドキュメントを処理するのに適しています。
柔軟な入力方法
ファイルパスを直接指定することも、Base64エンコードでファイル内容を渡すこともでき、サンドボックス環境やネットワーク伝送シナリオに対応しています。
Dockerサポート
公式のDockerイメージを提供し、コンテナ化環境でのデプロイと実行を容易にし、環境の一貫性を保証します。
利点
即座に使用可能:インストールと設定が簡単で、主流のAIアシスタントとの統合が容易です。
標準化された出力:統一されたMarkdown形式を生成し、後続のドキュメント処理と分析のプロセスを大幅に簡素化します。
生産性の向上:退屈なドキュメント形式変換作業を自動化し、チームが内容自体に集中できるようにします。
技術スタックに友好的:純粋なテキストのMarkdownファイルは、バージョン管理システム(Gitなど)で管理しやすく、さまざまなテキスト処理ツールで操作するのも容易です。
制限
形式の損失:複雑なレイアウト、特定のフォント、正確な位置などのリッチな形式情報は、変換中に失われ、内容と基本構造に焦点を当てます。
画像処理の制限:画像の存在を検出できますが、画像内の文字を抽出または変換することはできません(OCR)。
環境依存:Dockerまたはサンドボックス環境で実行する場合、ファイルパスのマッピングとアクセス権限の問題に注意する必要があります。
使い方
doc2mdをインストールする
doc2mdをインストールする適切な方法を選択してください。最も推奨されるのは、pipまたはuvを使用してインストールすることです。
MCPクライアントを設定する
使用しているAIアシスタント(Claude Desktopなど)の設定ファイルに、doc2mdをMCPサーバーとして追加してください。以下はClaude Desktopの設定例です。
起動して使用する
AIアシスタントを再起動してください。その後、自然言語の命令(「このPDFファイルを変換して」など)でdoc2mdの機能を直接呼び出すことができ、変換後のファイルは指定された場所に保存されます。
使用例
例1:プロジェクトの知識ベースを構築する
プロジェクトマネージャーは、大量の履歴プロジェクトドキュメント(PDFレポート、Wordプロポーザル、PPT振り返り)を持っています。彼はdoc2mdを使用してこれらのすべてのドキュメントをMarkdownに一括変換し、出力フォルダを別の「ファイル検索」MCPサーバーのリソースとして提供します。これで、彼はAIアシスタントに任意の履歴プロジェクトに関する質問を直接することができます。
例2:Claude Desktopでドキュメントを即時に閲覧する
アナリストは、新しいPDF形式の市場調査レポートを受け取りました。彼女はPDFリーダーを開きたくなく、Claude Desktop内で直接AIにレポートを要約させます。彼女はまずClaudeにdoc2mdを呼び出してPDFを変換するように指示し、生成されたMarkdownファイルに基づいて質問を行います。
例3:ネットワークからのドキュメントを処理する
開発者はサンドボックス環境で作業しており、ホストのファイルシステムに直接アクセスできません。彼はDOCXファイルをダウンロードし、そのBase64エンコードを取得しました。彼はdoc2mdのBase64入力機能を使用して、エンコードされた内容を直接渡して変換します。
よくある質問
変換後のMarkdownファイルはどこに保存されますか?
Dockerで実行するときにファイルが見つからない場合はどうすればいいですか?
画像内の文字を変換することはできますか?
Excel (.xlsx) ファイルを変換できますか?
変換中にエラーが発生すると、他のファイルに影響しますか?
関連リソース
GitHubリポジトリ
doc2mdのソースコードにアクセスし、問題を報告したり、貢献したりします。
PyPIプロジェクトページ
Pythonパッケージインデックスでプロジェクトの詳細とリリース履歴を確認します。
Docker Hubイメージ
公式のDockerイメージを取得し、使用方法を確認します。
Model Context Protocol (MCP) 公式サイト
MCPプロトコルの公式ドキュメントと仕様を確認し、doc2mdの動作の基礎を理解します。

Edgeone Pages MCP Server
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
TypeScript
24.9K
4.8ポイント

Gmail MCP Server
Claude Desktop用に設計されたGmail自動認証MCPサーバーで、自然言語でのやり取りによるGmailの管理をサポートし、メール送信、ラベル管理、一括操作などの完全な機能を備えています。
TypeScript
18.5K
4.5ポイント

Context7
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
TypeScript
77.5K
4.7ポイント

Baidu Map
認証済み
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Python
36.0K
4.5ポイント

Gitlab MCP Server
認証済み
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
TypeScript
22.1K
4.3ポイント

Unity
認証済み
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
C#
28.0K
5ポイント

Magic MCP
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JavaScript
19.5K
5ポイント

Sequential Thinking MCP Server
MCPプロトコルに基づく構造化思考サーバーで、思考段階を定義することで複雑な問題を分解し要約を生成するのに役立ちます。
Python
30.8K
4.5ポイント






