Huoshui Pdf Converter
H

Huoshui Pdf Converter

活水PDF转换器是一个高质量、跨平台的PDF与Markdown双向转换工具,支持Unicode/CJK字符,可作为MCP服务器使用。
2分
3.3K

什么是活水 PDF 转换器?

活水 PDF 转换器是一个专门用于PDF和Markdown格式之间双向转换的工具。它不仅能将PDF文档转换为可编辑的Markdown格式,还能将Markdown文档生成为美观的PDF文件。特别优化了对中文、日文、韩文等Unicode字符的支持,确保多语言文档的准确转换。

如何使用活水 PDF 转换器?

您可以通过三种方式使用:1) 作为MCP服务器与Claude Desktop等AI助手集成,2) 通过命令行工具直接转换文件,3) 作为Python库在代码中调用。安装简单,无需复杂的系统依赖。

适用场景

适用于学术研究、文档处理、内容创作等场景。例如:将扫描的PDF论文转换为可编辑的Markdown进行笔记整理;将Markdown格式的技术文档生成为PDF分享给同事;在多语言环境中处理包含中文、日文、韩文的文档。

主要功能

双向格式转换
支持PDF到Markdown和Markdown到PDF的双向转换,保持文档结构和格式
多语言支持
完整支持中文、日文、韩文等Unicode字符,自动检测并使用系统字体
跨平台兼容
支持Windows、macOS、Linux系统,纯Python实现无需外部依赖
MCP服务器集成
可作为Model Context Protocol服务器与Claude等AI助手无缝集成
智能引擎选择
根据文档内容自动选择最佳转换引擎,确保最佳转换效果
图像提取支持
从PDF中提取图像并嵌入到Markdown文档中
优势
完全免费开源,基于MIT许可证
纯Python实现,安装简单无需复杂配置
优秀的Unicode和多语言支持,特别适合中文用户
多种使用方式:命令行、Python库、MCP服务器
智能字体检测,自动使用系统最佳字体
良好的错误处理和日志记录
局限性
复杂排版和表格的转换可能不够完美
需要Python环境支持
大型PDF文件转换可能需要较多内存
某些特殊PDF格式可能支持有限

如何使用

安装转换器
通过pip或uv安装Python包,或配置为MCP服务器
配置MCP服务器(可选)
如果您使用Claude Desktop,可以将其配置为MCP服务器
使用命令行转换
通过简单的命令行工具进行文件转换
在Python代码中使用
作为Python库集成到您的应用程序中

使用案例

学术论文转换
将PDF格式的学术论文转换为Markdown,便于提取关键信息和做笔记
技术文档生成
将Markdown格式的技术文档生成为PDF,便于分享和打印
多语言文档处理
处理包含中文、日文、英文混合内容的文档

常见问题

转换后中文显示为乱码怎么办?
支持多大的PDF文件?
如何与Claude Desktop集成?
转换速度如何?
支持哪些Markdown扩展?

相关资源

GitHub仓库
项目源代码和最新版本
PyPI页面
Python包安装页面
MCP协议文档
Model Context Protocol官方规范
问题反馈
报告问题和功能建议

安装

复制以下命令到你的Client进行配置
{
  "mcpServers": {
    "huoshui-pdf-converter": {
      "command": "uvx",
      "args": ["huoshui-pdf-converter"],
      "env": {}
    }
  }
}

{
  "mcpServers": {
    "huoshui-pdf-converter": {
      "command": "python",
      "args": ["-m", "huoshui_pdf_converter.server"],
      "env": {}
    }
  }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

V
Vestige
Vestige是一个基于认知科学的AI记忆引擎,通过实现预测误差门控、FSRS-6间隔重复、记忆梦境等29个神经科学模块,为AI提供长期记忆能力。包含3D可视化仪表板和21个MCP工具,完全本地运行,无需云端。
Rust
4.8K
4.5分
M
Moltbrain
MoltBrain是一个为OpenClaw、MoltBook和Claude Code设计的长期记忆层插件,能够自动学习和回忆项目上下文,提供智能搜索、观察记录、分析统计和持久化存储功能。
TypeScript
4.3K
4.5分
B
Bm.md
一个功能丰富的Markdown排版工具,支持多种样式主题和平台适配,提供实时编辑预览、图片导出和API集成能力
TypeScript
4.9K
5分
S
Security Detections MCP
Security Detections MCP 是一个基于Model Context Protocol的服务器,允许LLM查询统一的安全检测规则数据库,涵盖Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升级为自主检测工程平台,可自动从威胁情报中提取TTPs、分析覆盖差距、生成SIEM原生格式检测规则、运行测试并验证。项目包含71+工具、11个预构建工作流提示和知识图谱系统,支持多SIEM平台。
TypeScript
6.2K
4分
P
Paperbanana
PaperBanana是一个自动化生成学术图表和统计图的智能框架,支持从文本描述生成高质量的论文插图,采用多智能体管道和迭代优化,提供CLI、Python API和MCP服务器等多种使用方式。
Python
6.3K
5分
B
Better Icons
一个提供超过20万图标搜索和检索的MCP服务器和CLI工具,支持150多个图标库,帮助AI助手和开发者快速获取和使用图标。
TypeScript
6.0K
4.5分
A
Assistant Ui
assistant-ui是一个开源TypeScript/React库,用于快速构建生产级AI聊天界面,提供可组合的UI组件、流式响应、无障碍访问等功能,支持多种AI后端和模型。
TypeScript
6.7K
5分
A
Apify MCP Server
Apify MCP服务器是一个基于模型上下文协议(MCP)的工具,允许AI助手通过数千个现成的爬虫、抓取器和自动化工具(Apify Actor)从社交媒体、搜索引擎、电商等网站提取数据。它支持OAuth和Skyfire代理支付,可通过HTTPS端点或本地stdio方式集成到Claude、VS Code等MCP客户端中。
TypeScript
7.7K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
74.7K
4.5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
86.5K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
152.0K
5分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
49.5K
4.5分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
64.5K
4.8分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
56.9K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
32.2K
4.8分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
106.7K
4.7分
AIBase
智启未来,您的人工智能解决方案智库
© 2026AIBase