Doc2md
什麼是 doc2md?
doc2md 是一個文檔轉換工具,專門為 AI 工作流設計。它能自動識別並轉換常見的辦公文檔格式(PDF、Word、PowerPoint)為純文本的 Markdown 格式。轉換後的文件保留了原始文檔的結構(如標題、列表、表格),並直接保存在您的文件系統中,方便其他 MCP 服務器或 AI 工具直接讀取和使用。如何使用 doc2md?
您可以通過多種方式使用 doc2md:作為獨立的命令行工具、集成到 Claude Desktop 或 Cursor 等 AI 助手中,或者通過 Docker 容器運行。基本流程是:1) 配置 MCP 客戶端連接 doc2md 服務器;2) 通過 AI 助手發送轉換指令或直接調用工具;3) 在指定輸出目錄獲取轉換好的 Markdown 文件。適用場景
doc2md 非常適合需要處理大量歷史文檔的團隊和個人。例如:將公司歷年積累的 PDF 報告、Word 方案書、PowerPoint 演示稿批量轉換為文本,然後構建企業知識庫或接入 RAG(檢索增強生成)系統,讓 AI 能夠基於這些文檔內容進行問答和分析。主要功能
多格式支持
支持 PDF、DOCX (Microsoft Word) 和 PPTX (Microsoft PowerPoint) 三種主流文檔格式的轉換。
結構保留
智能識別並保留文檔的原始結構,如標題層級、段落、列表、表格、超鏈接等,生成組織良好的 Markdown。
MCP 原生集成
作為標準的 MCP 服務器,可以無縫集成到 Claude Desktop、Cursor、Claude Code 等支持 MCP 的 AI 開發環境中。
批量轉換
提供批量轉換工具,可以一次性處理多個文件,並彙總轉換結果,適合處理大量文檔。
靈活的輸入方式
既支持直接提供文件路徑,也支持通過 Base64 編碼傳遞文件內容,適應沙盒環境或網絡傳輸場景。
Docker 支持
提供官方 Docker 鏡像,方便在容器化環境中部署和運行,保證環境一致性。
優勢
開箱即用:安裝配置簡單,與主流 AI 助手集成方便。
標準化輸出:生成統一的 Markdown 格式,極大簡化了後續文檔處理和分析的流程。
解放生產力:自動化處理枯燥的文檔格式轉換工作,讓團隊更專注於內容本身。
技術棧友好:純文本的 Markdown 文件易於被版本控制系統(如 Git)管理,也便於各種文本處理工具操作。
侷限性
格式損失:複雜排版、特定字體、精確位置等富格式信息在轉換過程中會丟失,專注於內容和基礎結構。
圖像處理有限:雖然能檢測到圖像的存在,但不會提取或轉換圖像中的文字(OCR)。
環境依賴:在 Docker 或沙盒環境中運行時,需要注意文件路徑的映射和訪問權限問題。
如何使用
安裝 doc2md
選擇適合您的方式安裝 doc2md。最推薦使用 pip 或 uv 進行安裝。
配置 MCP 客戶端
在您使用的 AI 助手(如 Claude Desktop)配置文件中,添加 doc2md 作為 MCP 服務器。以下是 Claude Desktop 的配置示例。
啟動並使用
重啟您的 AI 助手。之後,您就可以直接通過自然語言指令(如“轉換這個PDF文件”)來調用 doc2md 的功能,轉換後的文件將保存在指定位置。
使用案例
案例一:構建項目知識庫
項目經理擁有大量歷史項目文檔(PDF報告、Word方案、PPT覆盤)。他使用 doc2md 批量轉換所有這些文檔為 Markdown,然後將輸出文件夾作為資源提供給另一個“文件檢索”MCP服務器。現在,他可以直接向 AI 助手提問關於任何歷史項目的問題。
案例二:在 Claude Desktop 中即時查閱文檔
一位分析師收到一份新的 PDF 格式的市場研究報告。她不想打開 PDF 閱讀器,而是直接在 Claude Desktop 中讓 AI 總結報告。她先指令 Claude 調用 doc2md 轉換該 PDF,然後基於生成的 Markdown 文件進行提問。
案例三:處理來自網絡的文檔
開發者在沙盒環境中工作,無法直接訪問主機文件系統。他下載了一個 DOCX 文件並獲得了其 Base64 編碼。他使用 doc2md 的 Base64 輸入功能,直接傳遞編碼內容進行轉換。
常見問題
轉換後的 Markdown 文件保存在哪裡?
Docker 運行時找不到我的文件怎麼辦?
支持轉換圖片中的文字嗎?
能轉換 Excel (.xlsx) 文件嗎?
轉換時出現錯誤會影響其他文件嗎?
相關資源
GitHub 倉庫
訪問 doc2md 的源代碼,報告問題或參與貢獻。
PyPI 項目頁
在 Python 包索引查看項目詳情和發佈歷史。
Docker Hub 鏡像
獲取官方 Docker 鏡像並查看使用說明。
Model Context Protocol (MCP) 官網
瞭解 MCP 協議的官方文檔和規範,理解 doc2md 的運行基礎。

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
36.6K
5分

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
44.1K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
144.5K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
35.4K
4.5分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
20.6K
4.5分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
22.4K
5分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
92.2K
4.7分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
27.9K
4.8分






