Huoshui Fetch
什麼是huoshui-fetch?
huoshui-fetch是一個專門用於網頁內容獲取和處理的工具服務器。它能夠幫助您從任何網頁中提取有用的信息,並將這些信息轉換為易於閱讀和使用的格式。無論您需要獲取新聞文章、提取網頁數據、轉換HTML內容,還是分析網頁結構,這個工具都能為您提供強大的支持。如何使用huoshui-fetch?
huoshui-fetch主要通過Claude Desktop等AI助手應用程序使用。您只需要在配置文件中添加相應的設置,就可以在對話中直接調用各種網頁處理功能。無需編寫代碼,通過簡單的自然語言指令就能完成複雜的網頁內容處理任務。適用場景
huoshui-fetch特別適合以下場景: 1. 研究和學習時快速獲取網頁內容 2. 將網頁文章保存為乾淨的Markdown格式 3. 批量提取網頁中的鏈接和圖片 4. 分析網頁結構和元數據 5. 將JSON數據轉換為易讀的文檔格式 6. 獲取需要登錄才能訪問的網頁內容主要功能
網頁獲取工具
支持從URL獲取網頁內容,可自定義超時時間、重定向處理和用戶代理設置。特別提供帶自定義請求頭的獲取功能,方便訪問需要認證的網頁。
HTML轉換工具
將HTML內容轉換為乾淨的Markdown格式,或提取純文本內容。支持HTML清理功能,自動移除腳本、樣式等無關元素。
文章內容提取
智能提取網頁中的主要文章內容,自動過濾導航欄、廣告、側邊欄等無關信息,專注於核心內容。
元數據提取
提取網頁的標題、描述、Open Graph標籤等元數據信息,幫助快速瞭解網頁概況。
鏈接提取
提取網頁中的所有鏈接,支持按域名、類型等進行過濾,方便批量處理。
圖片提取
提取網頁中的圖片信息,支持按尺寸過濾,獲取圖片URL、alt文本等詳細信息。
結構化數據提取
提取網頁中的JSON-LD和微數據等結構化信息,特別適合處理產品信息、文章數據等。
JSON轉Markdown
將JSON數據轉換為易讀的Markdown格式,方便查看和分析結構化數據。
優勢
無需編程知識,通過自然語言即可使用
支持多種網頁內容處理功能,一站式解決方案
智能提取文章核心內容,過濾無關信息
支持自定義請求頭,可訪問需要認證的網頁
輸出格式多樣,滿足不同使用需求
與Claude Desktop等AI助手無縫集成
侷限性
需要Python 3.11+運行環境
部分複雜網頁可能需要手動調整提取參數
無法處理需要JavaScript渲染的動態內容
需要網絡連接才能獲取網頁內容
某些網站可能有反爬蟲機制限制
如何使用
安裝Python環境
確保您的計算機上安裝了Python 3.11或更高版本。可以從Python官網下載安裝。
安裝uv工具(推薦)
uv是一個快速的Python包管理器和安裝器,可以簡化安裝過程。
配置Claude Desktop
在Claude Desktop的配置文件中添加huoshui-fetch服務器配置。
重啟Claude Desktop
保存配置文件後,重啟Claude Desktop應用程序使配置生效。
開始使用
在Claude對話中,您現在可以直接使用各種網頁處理功能了。
使用案例
獲取新聞文章並保存
當您在網上看到一篇有價值的新聞文章,想要保存下來以便後續閱讀或整理時,可以使用huoshui-fetch快速獲取並轉換為乾淨的格式。
研究資料收集
在進行學術研究或項目調研時,需要從多個網頁收集相關資料,整理成統一的格式。
網頁數據分析
需要分析某個網站的結構、鏈接關係或圖片資源時,可以使用提取工具快速獲取相關信息。
技術文檔轉換
將API文檔或技術規範的JSON數據轉換為易讀的Markdown格式,方便團隊成員查閱。
常見問題
huoshui-fetch是免費的嗎?
我需要編程知識才能使用嗎?
它能處理需要登錄的網站嗎?
提取的內容準確度如何?
支持中文網頁嗎?
如何處理動態加載的內容?
有使用限制或配額嗎?
如何獲取技術支持?
相關資源
GitHub倉庫
獲取源代碼、提交問題和參與開發
MCP協議文檔
瞭解Model Context Protocol的技術細節
Claude Desktop
下載和安裝Claude Desktop應用程序
Python官方網站
下載Python編程語言
uv工具文檔
瞭解uv包管理器的使用方法
發佈指南
詳細的發佈和部署說明

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
27.2K
5分

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
34.8K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
101.0K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
27.7K
4.5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
21.4K
4.8分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
15.6K
4.5分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
68.1K
4.7分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
19.3K
5分
