Html2md MCP
什麼是HTML轉Markdown MCP服務器?
這是一個專門為Claude AI設計的工具服務器,能夠自動將任何網頁的HTML內容轉換為乾淨、易讀的Markdown格式。它像是一個智能的網頁內容提取器,去除廣告、導航欄、腳本等無關元素,只保留核心的文章內容、表格和圖片,大大減少文件體積,讓AI更容易理解和處理網頁信息。如何使用HTML轉Markdown服務?
使用非常簡單:在Claude對話中直接輸入網頁鏈接,或者使用專門的工具命令。服務器會自動抓取網頁、清理內容、轉換為Markdown,然後將結果返回給Claude。你還可以選擇是否包含圖片、表格,甚至處理需要JavaScript加載的動態網頁。適用場景
非常適合研究論文、技術文檔、新聞文章、產品說明等內容的整理和分析。當你需要讓AI閱讀和理解網頁內容時,這個工具能提供最乾淨、最相關的文本信息,避免AI被無關的網頁元素干擾。主要功能
智能內容提取
自動識別並保留網頁的核心內容(文章正文、表格、圖片),去除廣告、導航欄、頁腳等無關元素
高效壓縮
將HTML文件大小減少90-95%,生成簡潔的Markdown格式,大幅節省AI處理時的token使用量
瀏覽器模式
支持使用真實瀏覽器(Chromium/Firefox/WebKit)抓取JavaScript動態加載的網頁,完美處理React、Vue等現代網站
認證頁面訪問
可以使用你的瀏覽器個人資料和cookies,訪問需要登錄的私有頁面(如公司內網、社交媒體等)
靈活配置
可自定義是否包含圖片、表格、鏈接,設置超時時間、文件大小限制,滿足不同使用需求
緩存加速
可選啟用緩存功能,重複訪問同一網頁時直接從緩存讀取,大幅提升處理速度
優勢
大幅減少AI處理網頁內容時的token消耗(節省90-95%)
提供乾淨、結構化的內容,提高AI理解準確性
支持JavaScript動態網頁和需要認證的頁面
配置靈活,可根據需求調整輸出內容
處理速度快,通常2-10秒完成轉換
Docker一鍵部署,安裝簡單方便
侷限性
某些極其複雜的網頁佈局可能無法完美提取
瀏覽器模式需要額外安裝Playwright和瀏覽器
處理非常大的網頁(超過50MB)可能需要調整配置
需要網絡連接來抓取網頁內容
某些反爬蟲機制嚴格的網站可能無法訪問
如何使用
安裝服務器
選擇適合你的安裝方式:使用Docker(最簡單)、uv包管理器或pip安裝。如果要用瀏覽器模式,還需要安裝Playwright。
配置Claude Desktop
編輯Claude Desktop的配置文件,添加MCP服務器配置。根據你的操作系統選擇正確的配置文件路徑。
重啟Claude Desktop
完全關閉並重新啟動Claude Desktop應用程序,讓配置生效。
開始使用
在Claude對話中直接輸入網頁鏈接,或使用html_to_markdown工具命令來轉換網頁內容。
使用案例
研究論文整理
將學術論文網頁轉換為乾淨的Markdown,便於AI總結核心觀點和研究方法
技術文檔學習
將複雜的技術文檔頁面轉換為易讀格式,幫助AI理解API用法或技術概念
新聞文章分析
去除新聞網站的廣告和側邊欄,只保留文章正文進行內容分析
私有頁面訪問
訪問需要登錄的公司內網或社交媒體頁面,提取私有內容
常見問題
為什麼轉換後的內容有時不完整?
如何訪問需要登錄的網站?
轉換過程太慢怎麼辦?
支持多大的網頁文件?
安裝時遇到Playwright錯誤怎麼辦?
Claude Desktop中看不到這個工具?
相關資源
官方MCP文檔
Model Context Protocol官方文檔和規範
GitHub倉庫
項目源代碼和最新更新
trafilatura庫
使用的網頁內容提取庫文檔
Playwright文檔
瀏覽器自動化工具文檔
Docker安裝指南
Docker安裝和基本使用教程

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
32.2K
4.5分

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
25.5K
5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
94.0K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
27.3K
4.5分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
14.7K
4.5分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
18.5K
5分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
63.5K
4.7分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
21.2K
4.8分
