Doc2md
什么是 doc2md?
doc2md 是一个文档转换工具,专门为 AI 工作流设计。它能自动识别并转换常见的办公文档格式(PDF、Word、PowerPoint)为纯文本的 Markdown 格式。转换后的文件保留了原始文档的结构(如标题、列表、表格),并直接保存在您的文件系统中,方便其他 MCP 服务器或 AI 工具直接读取和使用。如何使用 doc2md?
您可以通过多种方式使用 doc2md:作为独立的命令行工具、集成到 Claude Desktop 或 Cursor 等 AI 助手中,或者通过 Docker 容器运行。基本流程是:1) 配置 MCP 客户端连接 doc2md 服务器;2) 通过 AI 助手发送转换指令或直接调用工具;3) 在指定输出目录获取转换好的 Markdown 文件。适用场景
doc2md 非常适合需要处理大量历史文档的团队和个人。例如:将公司历年积累的 PDF 报告、Word 方案书、PowerPoint 演示稿批量转换为文本,然后构建企业知识库或接入 RAG(检索增强生成)系统,让 AI 能够基于这些文档内容进行问答和分析。主要功能
多格式支持
支持 PDF、DOCX (Microsoft Word) 和 PPTX (Microsoft PowerPoint) 三种主流文档格式的转换。
结构保留
智能识别并保留文档的原始结构,如标题层级、段落、列表、表格、超链接等,生成组织良好的 Markdown。
MCP 原生集成
作为标准的 MCP 服务器,可以无缝集成到 Claude Desktop、Cursor、Claude Code 等支持 MCP 的 AI 开发环境中。
批量转换
提供批量转换工具,可以一次性处理多个文件,并汇总转换结果,适合处理大量文档。
灵活的输入方式
既支持直接提供文件路径,也支持通过 Base64 编码传递文件内容,适应沙盒环境或网络传输场景。
Docker 支持
提供官方 Docker 镜像,方便在容器化环境中部署和运行,保证环境一致性。
优势
开箱即用:安装配置简单,与主流 AI 助手集成方便。
标准化输出:生成统一的 Markdown 格式,极大简化了后续文档处理和分析的流程。
解放生产力:自动化处理枯燥的文档格式转换工作,让团队更专注于内容本身。
技术栈友好:纯文本的 Markdown 文件易于被版本控制系统(如 Git)管理,也便于各种文本处理工具操作。
局限性
格式损失:复杂排版、特定字体、精确位置等富格式信息在转换过程中会丢失,专注于内容和基础结构。
图像处理有限:虽然能检测到图像的存在,但不会提取或转换图像中的文字(OCR)。
环境依赖:在 Docker 或沙盒环境中运行时,需要注意文件路径的映射和访问权限问题。
如何使用
安装 doc2md
选择适合您的方式安装 doc2md。最推荐使用 pip 或 uv 进行安装。
配置 MCP 客户端
在您使用的 AI 助手(如 Claude Desktop)配置文件中,添加 doc2md 作为 MCP 服务器。以下是 Claude Desktop 的配置示例。
启动并使用
重启您的 AI 助手。之后,您就可以直接通过自然语言指令(如“转换这个PDF文件”)来调用 doc2md 的功能,转换后的文件将保存在指定位置。
使用案例
案例一:构建项目知识库
项目经理拥有大量历史项目文档(PDF报告、Word方案、PPT复盘)。他使用 doc2md 批量转换所有这些文档为 Markdown,然后将输出文件夹作为资源提供给另一个“文件检索”MCP服务器。现在,他可以直接向 AI 助手提问关于任何历史项目的问题。
案例二:在 Claude Desktop 中即时查阅文档
一位分析师收到一份新的 PDF 格式的市场研究报告。她不想打开 PDF 阅读器,而是直接在 Claude Desktop 中让 AI 总结报告。她先指令 Claude 调用 doc2md 转换该 PDF,然后基于生成的 Markdown 文件进行提问。
案例三:处理来自网络的文档
开发者在沙盒环境中工作,无法直接访问主机文件系统。他下载了一个 DOCX 文件并获得了其 Base64 编码。他使用 doc2md 的 Base64 输入功能,直接传递编码内容进行转换。
常见问题
转换后的 Markdown 文件保存在哪里?
Docker 运行时找不到我的文件怎么办?
支持转换图片中的文字吗?
能转换 Excel (.xlsx) 文件吗?
转换时出现错误会影响其他文件吗?
相关资源
GitHub 仓库
访问 doc2md 的源代码,报告问题或参与贡献。
PyPI 项目页
在 Python 包索引查看项目详情和发布历史。
Docker Hub 镜像
获取官方 Docker 镜像并查看使用说明。
Model Context Protocol (MCP) 官网
了解 MCP 协议的官方文档和规范,理解 doc2md 的运行基础。

Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
74.4K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
151.3K
5分

Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
84.3K
4.3分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
33.0K
4.8分

Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
50.1K
4.5分

Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
57.2K
5分

Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
64.6K
4.8分

Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
106.7K
4.7分






