Html2md MCP
什么是HTML转Markdown MCP服务器?
这是一个专门为Claude AI设计的工具服务器,能够自动将任何网页的HTML内容转换为干净、易读的Markdown格式。它像是一个智能的网页内容提取器,去除广告、导航栏、脚本等无关元素,只保留核心的文章内容、表格和图片,大大减少文件体积,让AI更容易理解和处理网页信息。如何使用HTML转Markdown服务?
使用非常简单:在Claude对话中直接输入网页链接,或者使用专门的工具命令。服务器会自动抓取网页、清理内容、转换为Markdown,然后将结果返回给Claude。你还可以选择是否包含图片、表格,甚至处理需要JavaScript加载的动态网页。适用场景
非常适合研究论文、技术文档、新闻文章、产品说明等内容的整理和分析。当你需要让AI阅读和理解网页内容时,这个工具能提供最干净、最相关的文本信息,避免AI被无关的网页元素干扰。主要功能
智能内容提取
自动识别并保留网页的核心内容(文章正文、表格、图片),去除广告、导航栏、页脚等无关元素
高效压缩
将HTML文件大小减少90-95%,生成简洁的Markdown格式,大幅节省AI处理时的token使用量
浏览器模式
支持使用真实浏览器(Chromium/Firefox/WebKit)抓取JavaScript动态加载的网页,完美处理React、Vue等现代网站
认证页面访问
可以使用你的浏览器个人资料和cookies,访问需要登录的私有页面(如公司内网、社交媒体等)
灵活配置
可自定义是否包含图片、表格、链接,设置超时时间、文件大小限制,满足不同使用需求
缓存加速
可选启用缓存功能,重复访问同一网页时直接从缓存读取,大幅提升处理速度
优势
大幅减少AI处理网页内容时的token消耗(节省90-95%)
提供干净、结构化的内容,提高AI理解准确性
支持JavaScript动态网页和需要认证的页面
配置灵活,可根据需求调整输出内容
处理速度快,通常2-10秒完成转换
Docker一键部署,安装简单方便
局限性
某些极其复杂的网页布局可能无法完美提取
浏览器模式需要额外安装Playwright和浏览器
处理非常大的网页(超过50MB)可能需要调整配置
需要网络连接来抓取网页内容
某些反爬虫机制严格的网站可能无法访问
如何使用
安装服务器
选择适合你的安装方式:使用Docker(最简单)、uv包管理器或pip安装。如果要用浏览器模式,还需要安装Playwright。
配置Claude Desktop
编辑Claude Desktop的配置文件,添加MCP服务器配置。根据你的操作系统选择正确的配置文件路径。
重启Claude Desktop
完全关闭并重新启动Claude Desktop应用程序,让配置生效。
开始使用
在Claude对话中直接输入网页链接,或使用html_to_markdown工具命令来转换网页内容。
使用案例
研究论文整理
将学术论文网页转换为干净的Markdown,便于AI总结核心观点和研究方法
技术文档学习
将复杂的技术文档页面转换为易读格式,帮助AI理解API用法或技术概念
新闻文章分析
去除新闻网站的广告和侧边栏,只保留文章正文进行内容分析
私有页面访问
访问需要登录的公司内网或社交媒体页面,提取私有内容
常见问题
为什么转换后的内容有时不完整?
如何访问需要登录的网站?
转换过程太慢怎么办?
支持多大的网页文件?
安装时遇到Playwright错误怎么办?
Claude Desktop中看不到这个工具?
相关资源
官方MCP文档
Model Context Protocol官方文档和规范
GitHub仓库
项目源代码和最新更新
trafilatura库
使用的网页内容提取库文档
Playwright文档
浏览器自动化工具文档
Docker安装指南
Docker安装和基本使用教程

Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
71.8K
4.3分

Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
122.5K
5分

Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
64.0K
4.5分

Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
45.0K
4.5分

Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
48.0K
5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
28.7K
4.8分

Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
89.2K
4.7分

Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
53.9K
4.8分
