Doc2md
doc2md是一個MCP服務器,可將PDF、DOCX和PPTX文件轉換為乾淨的Markdown文件,便於在LLM工具鏈、RAG管道和其他MCP服務器中作為資源使用。
2分
6.7K

什麼是 doc2md?

doc2md 是一個文檔轉換工具,專門為 AI 工作流設計。它能自動識別並轉換常見的辦公文檔格式(PDF、Word、PowerPoint)為純文本的 Markdown 格式。轉換後的文件保留了原始文檔的結構(如標題、列表、表格),並直接保存在您的文件系統中,方便其他 MCP 服務器或 AI 工具直接讀取和使用。

如何使用 doc2md?

您可以通過多種方式使用 doc2md:作為獨立的命令行工具、集成到 Claude Desktop 或 Cursor 等 AI 助手中,或者通過 Docker 容器運行。基本流程是:1) 配置 MCP 客戶端連接 doc2md 服務器;2) 通過 AI 助手發送轉換指令或直接調用工具;3) 在指定輸出目錄獲取轉換好的 Markdown 文件。

適用場景

doc2md 非常適合需要處理大量歷史文檔的團隊和個人。例如:將公司歷年積累的 PDF 報告、Word 方案書、PowerPoint 演示稿批量轉換為文本,然後構建企業知識庫或接入 RAG(檢索增強生成)系統,讓 AI 能夠基於這些文檔內容進行問答和分析。

主要功能

多格式支持
支持 PDF、DOCX (Microsoft Word) 和 PPTX (Microsoft PowerPoint) 三種主流文檔格式的轉換。
結構保留
智能識別並保留文檔的原始結構,如標題層級、段落、列表、表格、超鏈接等,生成組織良好的 Markdown。
MCP 原生集成
作為標準的 MCP 服務器,可以無縫集成到 Claude Desktop、Cursor、Claude Code 等支持 MCP 的 AI 開發環境中。
批量轉換
提供批量轉換工具,可以一次性處理多個文件,並彙總轉換結果,適合處理大量文檔。
靈活的輸入方式
既支持直接提供文件路徑,也支持通過 Base64 編碼傳遞文件內容,適應沙盒環境或網絡傳輸場景。
Docker 支持
提供官方 Docker 鏡像,方便在容器化環境中部署和運行,保證環境一致性。
優勢
開箱即用:安裝配置簡單,與主流 AI 助手集成方便。
標準化輸出:生成統一的 Markdown 格式,極大簡化了後續文檔處理和分析的流程。
解放生產力:自動化處理枯燥的文檔格式轉換工作,讓團隊更專注於內容本身。
技術棧友好:純文本的 Markdown 文件易於被版本控制系統(如 Git)管理,也便於各種文本處理工具操作。
侷限性
格式損失:複雜排版、特定字體、精確位置等富格式信息在轉換過程中會丟失,專注於內容和基礎結構。
圖像處理有限:雖然能檢測到圖像的存在,但不會提取或轉換圖像中的文字(OCR)。
環境依賴:在 Docker 或沙盒環境中運行時,需要注意文件路徑的映射和訪問權限問題。

如何使用

安裝 doc2md
選擇適合您的方式安裝 doc2md。最推薦使用 pip 或 uv 進行安裝。
配置 MCP 客戶端
在您使用的 AI 助手(如 Claude Desktop)配置文件中,添加 doc2md 作為 MCP 服務器。以下是 Claude Desktop 的配置示例。
啟動並使用
重啟您的 AI 助手。之後,您就可以直接通過自然語言指令(如“轉換這個PDF文件”)來調用 doc2md 的功能,轉換後的文件將保存在指定位置。

使用案例

案例一:構建項目知識庫
項目經理擁有大量歷史項目文檔(PDF報告、Word方案、PPT覆盤)。他使用 doc2md 批量轉換所有這些文檔為 Markdown,然後將輸出文件夾作為資源提供給另一個“文件檢索”MCP服務器。現在,他可以直接向 AI 助手提問關於任何歷史項目的問題。
案例二:在 Claude Desktop 中即時查閱文檔
一位分析師收到一份新的 PDF 格式的市場研究報告。她不想打開 PDF 閱讀器,而是直接在 Claude Desktop 中讓 AI 總結報告。她先指令 Claude 調用 doc2md 轉換該 PDF,然後基於生成的 Markdown 文件進行提問。
案例三:處理來自網絡的文檔
開發者在沙盒環境中工作,無法直接訪問主機文件系統。他下載了一個 DOCX 文件並獲得了其 Base64 編碼。他使用 doc2md 的 Base64 輸入功能,直接傳遞編碼內容進行轉換。

常見問題

轉換後的 Markdown 文件保存在哪裡?
Docker 運行時找不到我的文件怎麼辦?
支持轉換圖片中的文字嗎?
能轉換 Excel (.xlsx) 文件嗎?
轉換時出現錯誤會影響其他文件嗎?

相關資源

GitHub 倉庫
訪問 doc2md 的源代碼,報告問題或參與貢獻。
PyPI 項目頁
在 Python 包索引查看項目詳情和發佈歷史。
Docker Hub 鏡像
獲取官方 Docker 鏡像並查看使用說明。
Model Context Protocol (MCP) 官網
瞭解 MCP 協議的官方文檔和規範,理解 doc2md 的運行基礎。

安裝

複製以下命令到你的Client進行配置
{
  "mcpServers": {
    "doc2md": {
      "command": "python",
      "args": ["-m", "doc2md"],
      "env": {
        "TRANSPORT": "stdio"
      }
    }
  }
}

{
  "mcpServers": {
    "doc2md": {
      "command": "docker",
      "args": [
        "run", "--rm", "-i",
        "-v", "/path/to/your/files:/data",
        "benguy1000/doc2md"
      ]
    }
  }
}

{
  "mcpServers": {
    "doc2md": {
      "command": "python",
      "args": ["-m", "doc2md"]
    }
  }
}

{
  "mcpServers": {
    "doc2md": {
      "command": "python",
      "args": ["-m", "doc2md"],
      "transport": "stdio"
    }
  }
}

{
  "mcpServers": {
    "doc2md": {
      "url": "http://localhost:3000/sse",
      "transport": "sse"
    }
  }
}
注意:您的密鑰屬於敏感信息,請勿與任何人分享。

替代品

A
Airweave
Airweave是一個開源的人工智能代理和RAG系統的上下文檢索層,它連接並同步各種應用程序、工具和數據庫的數據,通過統一的搜索接口為AI代理提供相關、即時、多源的上下文信息。
Python
16.4K
5分
V
Vestige
Vestige是一個基於認知科學的AI記憶引擎,通過實現預測誤差門控、FSRS-6間隔重複、記憶夢境等29個神經科學模塊,為AI提供長期記憶能力。包含3D可視化儀表板和21個MCP工具,完全本地運行,無需雲端。
Rust
8.7K
4.5分
M
Moltbrain
MoltBrain是一個為OpenClaw、MoltBook和Claude Code設計的長期記憶層插件,能夠自動學習和回憶項目上下文,提供智能搜索、觀察記錄、分析統計和持久化存儲功能。
TypeScript
9.4K
4.5分
B
Bm.md
一個功能豐富的Markdown排版工具,支持多種樣式主題和平臺適配,提供即時編輯預覽、圖片導出和API集成能力
TypeScript
15.2K
5分
S
Security Detections MCP
Security Detections MCP 是一個基於Model Context Protocol的服務器,允許LLM查詢統一的安全檢測規則數據庫,涵蓋Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升級為自主檢測工程平臺,可自動從威脅情報中提取TTPs、分析覆蓋差距、生成SIEM原生格式檢測規則、運行測試並驗證。項目包含71+工具、11個預構建工作流提示和知識圖譜系統,支持多SIEM平臺。
TypeScript
9.1K
4分
P
Paperbanana
PaperBanana是一個自動化生成學術圖表和統計圖的智能框架,支持從文本描述生成高質量的論文插圖,採用多智能體管道和迭代優化,提供CLI、Python API和MCP服務器等多種使用方式。
Python
9.2K
5分
B
Better Icons
一個提供超過20萬圖標搜索和檢索的MCP服務器和CLI工具,支持150多個圖標庫,幫助AI助手和開發者快速獲取和使用圖標。
TypeScript
8.9K
4.5分
A
Assistant Ui
assistant-ui是一個開源TypeScript/React庫,用於快速構建生產級AI聊天界面,提供可組合的UI組件、流式響應、無障礙訪問等功能,支持多種AI後端和模型。
TypeScript
10.3K
5分
M
Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
35.8K
5分
B
Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
42.1K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
143.8K
5分
S
Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
34.8K
4.5分
M
Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
22.9K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
26.5K
4.8分
C
Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
89.8K
4.7分
N
Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
21.1K
4.5分
AIBase
智啟未來,您的人工智慧解決方案智庫
© 2026AIBase