Site Cloner
什么是站点克隆MCP服务器?
站点克隆MCP服务器是一款专门设计用于帮助语言模型(如Claude)克隆网站的工具。它能够抓取网页内容、提取所需资源(如CSS、JavaScript文件、图片等),并提供页面结构分析功能。如何使用站点克隆MCP服务器?
只需输入目标网站的URL,服务器会自动完成抓取、解析和下载任务。您也可以手动执行特定操作,例如单独提取某个文件或生成网站地图。适用场景
适合需要快速获取完整网站内容的研究人员、开发者以及希望备份个人网站的用户。主要功能
抓取网页内容从任意URL抓取HTML页面内容。
提取网页资源从HTML内容中提取CSS、JS、图像和其他相关资源。
下载单个资源将单个资源文件保存到本地目录。
解析CSS中的资源从CSS文件中提取引用的字体、图片等内容。
生成网站地图基于给定URL生成整个网站的结构图。
分析页面结构解析HTML页面并提取关键组件。
优势与局限性
优势
支持多种资源类型的自动抓取与下载。
提供详尽的页面结构分析能力。
易于集成至现有工作流中。
免费开源且跨平台可用。
局限性
可能无法处理高度动态或加密保护的网站。
对网络环境有一定依赖性,较差连接可能导致失败。
某些复杂页面可能需要手动调整配置。
如何使用
安装Docker
确保您的计算机已安装Docker,这是运行服务器的基础。
构建镜像
在项目根目录下运行以下命令构建Docker镜像:
```bash
docker build -t site-cloner-mcp .
```
启动服务器
启动容器后即可开始使用服务器提供的各项功能:
```bash
docker run -i --rm site-cloner-mcp
```
使用案例
克隆一个简单网站通过输入目标URL,让服务器自动生成完整的网站副本。
提取CSS中的字体资源针对特定CSS文件提取其引用的所有字体。
常见问题
为什么我的服务器未出现在Cursor中?
如何解决'模块未找到'错误?
能否克隆受版权保护的网站?
相关资源
官方文档
详细的使用指南和技术文档。
GitHub代码仓库
查看源码并参与贡献。
视频教程
快速上手演示。
精选MCP服务推荐

Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
1.2K
4.3分

Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
7.0K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
4.5K
5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
457
4.8分

Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
1.1K
4.5分

Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
1.1K
4.8分

Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
5.7K
4.7分

Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
2.1K
5分