Doc2md
什麼是 doc2md?
doc2md 是一個文檔轉換工具,專門為 AI 工作流設計。它能自動識別並轉換常見的辦公文檔格式(PDF、Word、PowerPoint)為純文本的 Markdown 格式。轉換後的文件保留了原始文檔的結構(如標題、列表、表格),並直接保存在您的文件系統中,方便其他 MCP 服務器或 AI 工具直接讀取和使用。如何使用 doc2md?
您可以通過多種方式使用 doc2md:作為獨立的命令行工具、集成到 Claude Desktop 或 Cursor 等 AI 助手中,或者通過 Docker 容器運行。基本流程是:1) 配置 MCP 客戶端連接 doc2md 服務器;2) 通過 AI 助手發送轉換指令或直接調用工具;3) 在指定輸出目錄獲取轉換好的 Markdown 文件。適用場景
doc2md 非常適合需要處理大量歷史文檔的團隊和個人。例如:將公司歷年積累的 PDF 報告、Word 方案書、PowerPoint 演示稿批量轉換為文本,然後構建企業知識庫或接入 RAG(檢索增強生成)系統,讓 AI 能夠基於這些文檔內容進行問答和分析。主要功能
多格式支持
支持 PDF、DOCX (Microsoft Word) 和 PPTX (Microsoft PowerPoint) 三種主流文檔格式的轉換。
結構保留
智能識別並保留文檔的原始結構,如標題層級、段落、列表、表格、超鏈接等,生成組織良好的 Markdown。
MCP 原生集成
作為標準的 MCP 服務器,可以無縫集成到 Claude Desktop、Cursor、Claude Code 等支持 MCP 的 AI 開發環境中。
批量轉換
提供批量轉換工具,可以一次性處理多個文件,並彙總轉換結果,適合處理大量文檔。
靈活的輸入方式
既支持直接提供文件路徑,也支持通過 Base64 編碼傳遞文件內容,適應沙盒環境或網絡傳輸場景。
Docker 支持
提供官方 Docker 鏡像,方便在容器化環境中部署和運行,保證環境一致性。
優勢
開箱即用:安裝配置簡單,與主流 AI 助手集成方便。
標準化輸出:生成統一的 Markdown 格式,極大簡化了後續文檔處理和分析的流程。
解放生產力:自動化處理枯燥的文檔格式轉換工作,讓團隊更專注於內容本身。
技術棧友好:純文本的 Markdown 文件易於被版本控制系統(如 Git)管理,也便於各種文本處理工具操作。
侷限性
格式損失:複雜排版、特定字體、精確位置等富格式信息在轉換過程中會丟失,專注於內容和基礎結構。
圖像處理有限:雖然能檢測到圖像的存在,但不會提取或轉換圖像中的文字(OCR)。
環境依賴:在 Docker 或沙盒環境中運行時,需要注意文件路徑的映射和訪問權限問題。
如何使用
安裝 doc2md
選擇適合您的方式安裝 doc2md。最推薦使用 pip 或 uv 進行安裝。
配置 MCP 客戶端
在您使用的 AI 助手(如 Claude Desktop)配置文件中,添加 doc2md 作為 MCP 服務器。以下是 Claude Desktop 的配置示例。
啟動並使用
重啟您的 AI 助手。之後,您就可以直接通過自然語言指令(如“轉換這個PDF文件”)來調用 doc2md 的功能,轉換後的文件將保存在指定位置。
使用案例
案例一:構建項目知識庫
項目經理擁有大量歷史項目文檔(PDF報告、Word方案、PPT覆盤)。他使用 doc2md 批量轉換所有這些文檔為 Markdown,然後將輸出文件夾作為資源提供給另一個“文件檢索”MCP服務器。現在,他可以直接向 AI 助手提問關於任何歷史項目的問題。
案例二:在 Claude Desktop 中即時查閱文檔
一位分析師收到一份新的 PDF 格式的市場研究報告。她不想打開 PDF 閱讀器,而是直接在 Claude Desktop 中讓 AI 總結報告。她先指令 Claude 調用 doc2md 轉換該 PDF,然後基於生成的 Markdown 文件進行提問。
案例三:處理來自網絡的文檔
開發者在沙盒環境中工作,無法直接訪問主機文件系統。他下載了一個 DOCX 文件並獲得了其 Base64 編碼。他使用 doc2md 的 Base64 輸入功能,直接傳遞編碼內容進行轉換。
常見問題
轉換後的 Markdown 文件保存在哪裡?
Docker 運行時找不到我的文件怎麼辦?
支持轉換圖片中的文字嗎?
能轉換 Excel (.xlsx) 文件嗎?
轉換時出現錯誤會影響其他文件嗎?
相關資源
GitHub 倉庫
訪問 doc2md 的源代碼,報告問題或參與貢獻。
PyPI 項目頁
在 Python 包索引查看項目詳情和發佈歷史。
Docker Hub 鏡像
獲取官方 Docker 鏡像並查看使用說明。
Model Context Protocol (MCP) 官網
瞭解 MCP 協議的官方文檔和規範,理解 doc2md 的運行基礎。

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
35.8K
5分

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
42.1K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
143.8K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
34.8K
4.5分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
22.9K
5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
26.5K
4.8分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
89.8K
4.7分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
21.1K
4.5分






