Huoshui Fetch
H

Huoshui Fetch

一个专用于网页内容抓取和转换的MCP服务器,提供从网页获取、转换和提取数据的工具集
2分
4.8K

什么是huoshui-fetch?

huoshui-fetch是一个专门用于网页内容获取和处理的工具服务器。它能够帮助您从任何网页中提取有用的信息,并将这些信息转换为易于阅读和使用的格式。无论您需要获取新闻文章、提取网页数据、转换HTML内容,还是分析网页结构,这个工具都能为您提供强大的支持。

如何使用huoshui-fetch?

huoshui-fetch主要通过Claude Desktop等AI助手应用程序使用。您只需要在配置文件中添加相应的设置,就可以在对话中直接调用各种网页处理功能。无需编写代码,通过简单的自然语言指令就能完成复杂的网页内容处理任务。

适用场景

huoshui-fetch特别适合以下场景: 1. 研究和学习时快速获取网页内容 2. 将网页文章保存为干净的Markdown格式 3. 批量提取网页中的链接和图片 4. 分析网页结构和元数据 5. 将JSON数据转换为易读的文档格式 6. 获取需要登录才能访问的网页内容

主要功能

网页获取工具
支持从URL获取网页内容,可自定义超时时间、重定向处理和用户代理设置。特别提供带自定义请求头的获取功能,方便访问需要认证的网页。
HTML转换工具
将HTML内容转换为干净的Markdown格式,或提取纯文本内容。支持HTML清理功能,自动移除脚本、样式等无关元素。
文章内容提取
智能提取网页中的主要文章内容,自动过滤导航栏、广告、侧边栏等无关信息,专注于核心内容。
元数据提取
提取网页的标题、描述、Open Graph标签等元数据信息,帮助快速了解网页概况。
链接提取
提取网页中的所有链接,支持按域名、类型等进行过滤,方便批量处理。
图片提取
提取网页中的图片信息,支持按尺寸过滤,获取图片URL、alt文本等详细信息。
结构化数据提取
提取网页中的JSON-LD和微数据等结构化信息,特别适合处理产品信息、文章数据等。
JSON转Markdown
将JSON数据转换为易读的Markdown格式,方便查看和分析结构化数据。
优势
无需编程知识,通过自然语言即可使用
支持多种网页内容处理功能,一站式解决方案
智能提取文章核心内容,过滤无关信息
支持自定义请求头,可访问需要认证的网页
输出格式多样,满足不同使用需求
与Claude Desktop等AI助手无缝集成
局限性
需要Python 3.11+运行环境
部分复杂网页可能需要手动调整提取参数
无法处理需要JavaScript渲染的动态内容
需要网络连接才能获取网页内容
某些网站可能有反爬虫机制限制

如何使用

安装Python环境
确保您的计算机上安装了Python 3.11或更高版本。可以从Python官网下载安装。
安装uv工具(推荐)
uv是一个快速的Python包管理器和安装器,可以简化安装过程。
配置Claude Desktop
在Claude Desktop的配置文件中添加huoshui-fetch服务器配置。
重启Claude Desktop
保存配置文件后,重启Claude Desktop应用程序使配置生效。
开始使用
在Claude对话中,您现在可以直接使用各种网页处理功能了。

使用案例

获取新闻文章并保存
当您在网上看到一篇有价值的新闻文章,想要保存下来以便后续阅读或整理时,可以使用huoshui-fetch快速获取并转换为干净的格式。
研究资料收集
在进行学术研究或项目调研时,需要从多个网页收集相关资料,整理成统一的格式。
网页数据分析
需要分析某个网站的结构、链接关系或图片资源时,可以使用提取工具快速获取相关信息。
技术文档转换
将API文档或技术规范的JSON数据转换为易读的Markdown格式,方便团队成员查阅。

常见问题

huoshui-fetch是免费的吗?
我需要编程知识才能使用吗?
它能处理需要登录的网站吗?
提取的内容准确度如何?
支持中文网页吗?
如何处理动态加载的内容?
有使用限制或配额吗?
如何获取技术支持?

相关资源

GitHub仓库
获取源代码、提交问题和参与开发
MCP协议文档
了解Model Context Protocol的技术细节
Claude Desktop
下载和安装Claude Desktop应用程序
Python官方网站
下载Python编程语言
uv工具文档
了解uv包管理器的使用方法
发布指南
详细的发布和部署说明

安装

复制以下命令到你的Client进行配置
{
  "mcpServers": {
    "huoshui-fetch": {
      "command": "uvx",
      "args": ["--no-cache", "--from", ".", "huoshui-fetch"],
      "cwd": "/path/to/huoshui-fetch"
    }
  }
}

{
  "mcpServers": {
    "huoshui-fetch": {
      "command": "uvx",
      "args": [
        "--from",
        "git+https://github.com/yourusername/huoshui-fetch.git",
        "huoshui-fetch"
      ]
    }
  }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

R
Rsdoctor
Rsdoctor 是一款专为 Rspack 生态系统打造的构建分析工具,全面兼容 webpack,提供可视化构建分析、多维度性能诊断及智能优化建议,帮助开发者提升构建效率与工程质量。
TypeScript
7.9K
5分
N
Next Devtools MCP
Next.js开发工具MCP服务器,为Claude、Cursor等AI编程助手提供Next.js开发工具和实用程序,包括运行时诊断、开发自动化和文档访问功能。
TypeScript
8.4K
5分
T
Testkube
Testkube是一个面向云原生应用的测试编排与执行框架,提供统一平台来定义、运行和分析测试,支持现有测试工具和Kubernetes基础设施。
Go
6.2K
5分
M
MCP Windbg
一个MCP服务器,将AI模型与WinDbg/CDB集成,用于分析Windows崩溃转储文件和进行远程调试,支持自然语言交互执行调试命令。
Python
8.7K
5分
R
Runno
Runno是一个JavaScript工具包集合,用于在浏览器和Node.js等环境中安全地运行多种编程语言的代码,通过WebAssembly和WASI实现沙盒化执行,支持Python、Ruby、JavaScript、SQLite、C/C++等语言,并提供Web组件、MCP服务器等集成方式。
TypeScript
6.6K
5分
P
Praisonai
PraisonAI是一个生产就绪的多AI智能体框架,具有自反思功能,旨在创建AI智能体来自动化解决从简单任务到复杂挑战的各种问题。它通过将PraisonAI智能体、AG2和CrewAI集成到一个低代码解决方案中,简化了多智能体LLM系统的构建和管理,强调简单性、定制化和有效的人机协作。
Python
7.3K
5分
N
Netdata
Netdata是一个开源实时基础设施监控平台,提供每秒级指标收集、可视化、机器学习驱动的异常检测和自动化告警,无需复杂配置即可实现全栈监控。
Go
9.7K
5分
M
MCP Server
Mapbox MCP服务器是一个Node.js实现的模型上下文协议服务器,为AI应用提供Mapbox地理空间API的访问能力,包括地理编码、兴趣点搜索、路线规划、等时线分析和静态地图生成等功能。
TypeScript
8.8K
4分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
68.4K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
134.5K
5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
76.5K
4.3分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
30.5K
4.8分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
51.7K
5分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
58.8K
4.8分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
46.5K
4.5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
95.0K
4.7分
AIBase
智启未来,您的人工智能解决方案智库
© 2026AIBase