Html2md MCP
H

Html2md MCP

HTML轉Markdown的MCP服務器,可將網頁HTML轉換為簡潔的Markdown格式,保留表格、圖片等核心內容,壓縮率達90-95%,支持瀏覽器模式處理JavaScript網站和認證頁面。
2分
5.9K

什麼是HTML轉Markdown MCP服務器?

這是一個專門為Claude AI設計的工具服務器,能夠自動將任何網頁的HTML內容轉換為乾淨、易讀的Markdown格式。它像是一個智能的網頁內容提取器,去除廣告、導航欄、腳本等無關元素,只保留核心的文章內容、表格和圖片,大大減少文件體積,讓AI更容易理解和處理網頁信息。

如何使用HTML轉Markdown服務?

使用非常簡單:在Claude對話中直接輸入網頁鏈接,或者使用專門的工具命令。服務器會自動抓取網頁、清理內容、轉換為Markdown,然後將結果返回給Claude。你還可以選擇是否包含圖片、表格,甚至處理需要JavaScript加載的動態網頁。

適用場景

非常適合研究論文、技術文檔、新聞文章、產品說明等內容的整理和分析。當你需要讓AI閱讀和理解網頁內容時,這個工具能提供最乾淨、最相關的文本信息,避免AI被無關的網頁元素干擾。

主要功能

智能內容提取
自動識別並保留網頁的核心內容(文章正文、表格、圖片),去除廣告、導航欄、頁腳等無關元素
高效壓縮
將HTML文件大小減少90-95%,生成簡潔的Markdown格式,大幅節省AI處理時的token使用量
瀏覽器模式
支持使用真實瀏覽器(Chromium/Firefox/WebKit)抓取JavaScript動態加載的網頁,完美處理React、Vue等現代網站
認證頁面訪問
可以使用你的瀏覽器個人資料和cookies,訪問需要登錄的私有頁面(如公司內網、社交媒體等)
靈活配置
可自定義是否包含圖片、表格、鏈接,設置超時時間、文件大小限制,滿足不同使用需求
緩存加速
可選啟用緩存功能,重複訪問同一網頁時直接從緩存讀取,大幅提升處理速度
優勢
大幅減少AI處理網頁內容時的token消耗(節省90-95%)
提供乾淨、結構化的內容,提高AI理解準確性
支持JavaScript動態網頁和需要認證的頁面
配置靈活,可根據需求調整輸出內容
處理速度快,通常2-10秒完成轉換
Docker一鍵部署,安裝簡單方便
侷限性
某些極其複雜的網頁佈局可能無法完美提取
瀏覽器模式需要額外安裝Playwright和瀏覽器
處理非常大的網頁(超過50MB)可能需要調整配置
需要網絡連接來抓取網頁內容
某些反爬蟲機制嚴格的網站可能無法訪問

如何使用

安裝服務器
選擇適合你的安裝方式:使用Docker(最簡單)、uv包管理器或pip安裝。如果要用瀏覽器模式,還需要安裝Playwright。
配置Claude Desktop
編輯Claude Desktop的配置文件,添加MCP服務器配置。根據你的操作系統選擇正確的配置文件路徑。
重啟Claude Desktop
完全關閉並重新啟動Claude Desktop應用程序,讓配置生效。
開始使用
在Claude對話中直接輸入網頁鏈接,或使用html_to_markdown工具命令來轉換網頁內容。

使用案例

研究論文整理
將學術論文網頁轉換為乾淨的Markdown,便於AI總結核心觀點和研究方法
技術文檔學習
將複雜的技術文檔頁面轉換為易讀格式,幫助AI理解API用法或技術概念
新聞文章分析
去除新聞網站的廣告和側邊欄,只保留文章正文進行內容分析
私有頁面訪問
訪問需要登錄的公司內網或社交媒體頁面,提取私有內容

常見問題

為什麼轉換後的內容有時不完整?
如何訪問需要登錄的網站?
轉換過程太慢怎麼辦?
支持多大的網頁文件?
安裝時遇到Playwright錯誤怎麼辦?
Claude Desktop中看不到這個工具?

相關資源

官方MCP文檔
Model Context Protocol官方文檔和規範
GitHub倉庫
項目源代碼和最新更新
trafilatura庫
使用的網頁內容提取庫文檔
Playwright文檔
瀏覽器自動化工具文檔
Docker安裝指南
Docker安裝和基本使用教程

安裝

複製以下命令到你的Client進行配置
{
  "mcpServers": {
    "html2md": {
      "command": "docker",
      "args": [
        "run",
        "-i",
        "--rm",
        "html2md"
      ]
    }
  }
}

{
  "mcpServers": {
    "html2md": {
      "command": "uv",
      "args": [
        "--directory",
        "/absolute/path/to/html2md",
        "run",
        "html2md"
      ]
    }
  }
}

{
  "mcpServers": {
    "html2md": {
      "command": "uv",
      "args": [
        "--directory",
        "C:\\absolute\\path\\to\\html2md",
        "run",
        "html2md"
      ]
    }
  }
}
注意:您的密鑰屬於敏感信息,請勿與任何人分享。

替代品

N
Next Devtools MCP
Next.js開發工具MCP服務器,為Claude、Cursor等AI編程助手提供Next.js開發工具和實用程序,包括運行時診斷、開發自動化和文檔訪問功能。
TypeScript
8.2K
5分
P
Praisonai
PraisonAI是一個生產就緒的多AI智能體框架,具有自反思功能,旨在創建AI智能體來自動化解決從簡單任務到複雜挑戰的各種問題。它通過將PraisonAI智能體、AG2和CrewAI集成到一個低代碼解決方案中,簡化了多智能體LLM系統的構建和管理,強調簡單性、定製化和有效的人機協作。
Python
6.2K
5分
M
Maverick MCP
MaverickMCP是一個基於FastMCP 2.0的個人股票分析服務器,為Claude Desktop等MCP客戶端提供專業級的金融數據分析、技術指標計算和投資組合優化工具。它預置了520只標普500股票數據,支持多種技術分析策略和並行處理,無需複雜認證即可本地運行。
Python
8.4K
4分
B
Blueprint MCP
Blueprint MCP是一個基於Arcade生態的圖表生成工具,利用Nano Banana Pro等技術,通過分析代碼庫和系統架構自動生成架構圖、流程圖等可視化圖表,幫助開發者理解複雜系統。
Python
9.5K
4分
K
Klavis
Klavis AI是一個開源項目,提供在Slack、Discord和Web平臺上簡單易用的MCP(模型上下文協議)服務,包括報告生成、YouTube工具、文檔轉換等多種功能,支持非技術用戶和開發者使用AI工作流。
TypeScript
15.5K
5分
D
Devtools Debugger MCP
Node.js調試器MCP服務器,提供基於Chrome DevTools協議的完整調試功能,包括斷點設置、單步執行、變量檢查和表達式評估等
TypeScript
10.4K
4分
S
Scrapling
Scrapling是一個自適應網頁抓取庫,能自動學習網站變化並重新定位元素,支持多種抓取方式和AI集成,提供高性能解析和開發者友好體驗。
Python
13.2K
5分
M
Mcpjungle
MCPJungle是一個自託管的MCP網關,用於集中管理和代理多個MCP服務器,為AI代理提供統一的工具訪問接口。
Go
0
4.5分
B
Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
32.2K
4.5分
M
Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
25.5K
5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
94.0K
5分
S
Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
27.3K
4.5分
N
Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
14.7K
4.5分
M
Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
18.5K
5分
C
Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
63.5K
4.7分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
21.2K
4.8分
AIBase
智啟未來,您的人工智慧解決方案智庫
© 2026AIBase