Markdown MCP
M

Markdown MCP

一个基于Playwright的MCP服务器,能够从网页中智能提取纯净的Markdown内容,自动过滤导航栏、页脚等非核心元素,支持图片和链接保留,适用于文档、博客和技术文章等内容抓取。
2分
0

什么是Markdown MCP服务器?

Markdown MCP服务器是一个智能工具,专门用于从网页中提取核心内容并转换为易于阅读的Markdown格式。它能够智能识别网页的主要文章区域,自动移除导航菜单、侧边栏、页脚、广告等干扰元素,只保留您真正关心的内容。

如何使用Markdown MCP服务器?

您可以通过Claude Desktop或Gemini CLI等AI助手使用这个工具。只需告诉AI助手您想要提取的网页链接,工具就会自动获取网页内容并转换为干净的Markdown格式。您还可以选择是否包含图片和链接,以适应不同的使用需求。

适用场景

这个工具特别适合需要收集和整理网页信息的场景,比如:研究资料收集、技术文档整理、新闻文章保存、学习笔记制作、内容分析等。无论是技术文档、博客文章、新闻报导还是产品页面,都能获得干净的内容提取。

主要功能

智能内容提取
自动识别网页的主要内容区域,智能过滤导航栏、页脚、侧边栏、广告等非核心内容
干净的Markdown输出
生成结构清晰的Markdown文档,保留标题、段落、列表、代码块、表格等格式
图片和链接支持
可选择是否包含图片引用和超链接,适应不同的使用场景
动态内容处理
能够处理JavaScript生成的动态内容,支持现代网页框架
多客户端支持
支持Claude Desktop和Gemini CLI等多种AI助手,提供优化的配置文件
强大的错误处理
内置多种容错机制,当主要提取方法失败时自动尝试备用方案
优势
🎯 智能识别核心内容,自动过滤干扰元素
⚡ 处理速度快,通常5-15秒完成提取
🔄 支持动态内容和JavaScript网站
🎨 输出格式美观,保留原文结构
🔧 配置灵活,可定制图片和链接包含选项
🛡️ 安全可靠,每次请求使用独立浏览器环境
局限性
需要Node.js环境支持
首次使用需要安装浏览器组件
某些特殊网站可能需要手动配置选择器
无法处理需要登录的私有内容
内存占用相对较高(约50-100MB)

如何使用

环境准备
确保您的计算机已安装Node.js(版本18或更高)。如果没有安装,请先访问Node.js官网下载安装。
下载和安装
获取Markdown MCP服务器文件,安装必要的依赖包和浏览器组件。
配置AI助手
根据您使用的AI助手(Claude Desktop或Gemini CLI),添加MCP服务器配置。
开始使用
重启AI助手,现在您可以通过自然语言指令让助手提取网页内容了。

使用案例

技术文档整理
将Confluent Flink技术文档转换为干净的Markdown格式,便于离线阅读和学习。
新闻文章收集
从新闻网站提取文章内容,保存为干净的文本格式用于研究分析。
博客内容备份
将喜欢的博客文章转换为Markdown格式,建立个人知识库。
产品页面分析
提取竞品网站的产品特性描述,用于市场分析。

常见问题

这个工具是免费的吗?
需要编程知识才能使用吗?
支持哪些网站?
提取的内容准确吗?
会保存我的浏览历史或数据吗?
遇到网站无法提取怎么办?
可以批量提取多个网页吗?
支持中文网站吗?

相关资源

Node.js官方网站
下载和安装Node.js运行环境
Playwright文档
了解底层浏览器自动化技术
Model Context Protocol规范
MCP协议官方文档
Claude Desktop
下载Claude Desktop客户端
Gemini CLI
Google Gemini命令行工具
GitHub仓库
获取最新代码和提交问题

安装

复制以下命令到你的Client进行配置
{
  "mcpServers": {
    "markdown-mcp": {
      "command": "node",
      "args": ["/Users/yourusername/path/to/markdown-mcp/markdown-mcp.js"],
      "env": {}
    }
  }
}

{
  "mcpServers": {
    "markdown-mcp": {
      "command": "node",
      "args": ["C:\\Users\\YourUsername\\path\\to\\markdown-mcp\\markdown-mcp.js"],
      "env": {}
    }
  }
}

{
  "mcpServers": {
    "markdown-mcp": {
      "command": "node",
      "args": ["/home/yourusername/path/to/markdown-mcp/markdown-mcp.js"],
      "env": {}
    }
  }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

C
Claude Context
Claude Context是一个MCP插件,通过语义代码搜索为AI编程助手提供整个代码库的深度上下文,支持多种嵌入模型和向量数据库,实现高效代码检索。
TypeScript
4.4K
5分
M
Maverick MCP
MaverickMCP是一个基于FastMCP 2.0的个人股票分析服务器,为Claude Desktop等MCP客户端提供专业级的金融数据分析、技术指标计算和投资组合优化工具。它预置了520只标普500股票数据,支持多种技术分析策略和并行处理,无需复杂认证即可本地运行。
Python
5.8K
4分
A
Acemcp
Acemcp是一个代码库索引和语义搜索的MCP服务器,支持自动增量索引、多编码文件处理、.gitignore集成和Web管理界面,帮助开发者快速搜索和理解代码上下文。
Python
9.8K
5分
B
Blueprint MCP
Blueprint MCP是一个基于Arcade生态的图表生成工具,利用Nano Banana Pro等技术,通过分析代码库和系统架构自动生成架构图、流程图等可视化图表,帮助开发者理解复杂系统。
Python
8.2K
4分
M
MCP Agent Mail
MCP Agent Mail是一个为AI编程代理设计的邮件式协调层,提供身份管理、消息收发、文件预留和搜索功能,支持多代理异步协作和冲突避免。
Python
8.4K
5分
K
Klavis
Klavis AI是一个开源项目,提供在Slack、Discord和Web平台上简单易用的MCP(模型上下文协议)服务,包括报告生成、YouTube工具、文档转换等多种功能,支持非技术用户和开发者使用AI工作流。
TypeScript
14.0K
5分
M
MCP
微软官方MCP服务器,为AI助手提供最新微软技术文档的搜索和获取功能
13.0K
5分
A
Aderyn
Aderyn是一个开源的Solidity智能合约静态分析工具,由Rust编写,帮助开发者和安全研究人员发现Solidity代码中的漏洞。它支持Foundry和Hardhat项目,可生成多种格式报告,并提供VSCode扩展。
Rust
10.7K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
61.6K
4.5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
68.7K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
117.5K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
27.0K
4.8分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
45.1K
5分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
42.7K
4.5分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
52.8K
4.8分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
84.3K
4.7分
AIBase
智启未来,您的人工智能解决方案智库
© 2025AIBase