Huoshui Fetch
什么是huoshui-fetch?
huoshui-fetch是一个专门用于网页内容获取和处理的工具服务器。它能够帮助您从任何网页中提取有用的信息,并将这些信息转换为易于阅读和使用的格式。无论您需要获取新闻文章、提取网页数据、转换HTML内容,还是分析网页结构,这个工具都能为您提供强大的支持。如何使用huoshui-fetch?
huoshui-fetch主要通过Claude Desktop等AI助手应用程序使用。您只需要在配置文件中添加相应的设置,就可以在对话中直接调用各种网页处理功能。无需编写代码,通过简单的自然语言指令就能完成复杂的网页内容处理任务。适用场景
huoshui-fetch特别适合以下场景: 1. 研究和学习时快速获取网页内容 2. 将网页文章保存为干净的Markdown格式 3. 批量提取网页中的链接和图片 4. 分析网页结构和元数据 5. 将JSON数据转换为易读的文档格式 6. 获取需要登录才能访问的网页内容主要功能
网页获取工具
支持从URL获取网页内容,可自定义超时时间、重定向处理和用户代理设置。特别提供带自定义请求头的获取功能,方便访问需要认证的网页。
HTML转换工具
将HTML内容转换为干净的Markdown格式,或提取纯文本内容。支持HTML清理功能,自动移除脚本、样式等无关元素。
文章内容提取
智能提取网页中的主要文章内容,自动过滤导航栏、广告、侧边栏等无关信息,专注于核心内容。
元数据提取
提取网页的标题、描述、Open Graph标签等元数据信息,帮助快速了解网页概况。
链接提取
提取网页中的所有链接,支持按域名、类型等进行过滤,方便批量处理。
图片提取
提取网页中的图片信息,支持按尺寸过滤,获取图片URL、alt文本等详细信息。
结构化数据提取
提取网页中的JSON-LD和微数据等结构化信息,特别适合处理产品信息、文章数据等。
JSON转Markdown
将JSON数据转换为易读的Markdown格式,方便查看和分析结构化数据。
优势
无需编程知识,通过自然语言即可使用
支持多种网页内容处理功能,一站式解决方案
智能提取文章核心内容,过滤无关信息
支持自定义请求头,可访问需要认证的网页
输出格式多样,满足不同使用需求
与Claude Desktop等AI助手无缝集成
局限性
需要Python 3.11+运行环境
部分复杂网页可能需要手动调整提取参数
无法处理需要JavaScript渲染的动态内容
需要网络连接才能获取网页内容
某些网站可能有反爬虫机制限制
如何使用
安装Python环境
确保您的计算机上安装了Python 3.11或更高版本。可以从Python官网下载安装。
安装uv工具(推荐)
uv是一个快速的Python包管理器和安装器,可以简化安装过程。
配置Claude Desktop
在Claude Desktop的配置文件中添加huoshui-fetch服务器配置。
重启Claude Desktop
保存配置文件后,重启Claude Desktop应用程序使配置生效。
开始使用
在Claude对话中,您现在可以直接使用各种网页处理功能了。
使用案例
获取新闻文章并保存
当您在网上看到一篇有价值的新闻文章,想要保存下来以便后续阅读或整理时,可以使用huoshui-fetch快速获取并转换为干净的格式。
研究资料收集
在进行学术研究或项目调研时,需要从多个网页收集相关资料,整理成统一的格式。
网页数据分析
需要分析某个网站的结构、链接关系或图片资源时,可以使用提取工具快速获取相关信息。
技术文档转换
将API文档或技术规范的JSON数据转换为易读的Markdown格式,方便团队成员查阅。
常见问题
huoshui-fetch是免费的吗?
我需要编程知识才能使用吗?
它能处理需要登录的网站吗?
提取的内容准确度如何?
支持中文网页吗?
如何处理动态加载的内容?
有使用限制或配额吗?
如何获取技术支持?
相关资源
GitHub仓库
获取源代码、提交问题和参与开发
MCP协议文档
了解Model Context Protocol的技术细节
Claude Desktop
下载和安装Claude Desktop应用程序
Python官方网站
下载Python编程语言
uv工具文档
了解uv包管理器的使用方法
发布指南
详细的发布和部署说明

Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
68.4K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
134.5K
5分

Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
76.5K
4.3分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
30.5K
4.8分

Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
51.7K
5分

Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
58.8K
4.8分

Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
46.5K
4.5分

Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
95.0K
4.7分
