Mcpserver
M

Mcpserver

基於MCP協議的TypeScript網頁爬取服務器,支持多種導出格式、無頭瀏覽器和自定義規則集,適用於各類網頁內容抓取需求。
2分
6.4K

什麼是Web Scraper MCP Server?

這是一個基於Model Context Protocol (MCP)的網頁內容抓取服務器,可以幫助用戶從各種網站提取結構化內容。它特別適合需要批量獲取網頁信息的非技術人員使用。

如何使用Web Scraper MCP Server?

您只需要提供目標網址和簡單的配置參數,服務器就會自動抓取並返回格式化後的內容。無需編寫代碼即可完成複雜的網頁抓取任務。

適用場景

適用於內容採集、市場調研、競品分析、新聞聚合、數據存檔等多種業務場景。特別適合需要定期獲取特定網站更新的用戶。

主要功能

多格式導出
支持將抓取內容導出為Markdown、純文本、HTML和JSON格式,滿足不同使用需求
無頭瀏覽器支持
可處理JavaScript渲染的動態頁面,解決單頁應用(SPA)內容抓取問題
智能規則引擎
內置多種預定義規則集,可智能識別和提取網頁主要內容區域
批量抓取
支持同時抓取多個URL,提高數據採集效率
自定義請求頭
可設置特定域名的請求頭,繞過網站登錄和反爬限制
優勢
簡單易用,無需編程知識即可完成複雜抓取任務
內置智能內容識別,自動過濾廣告和無關內容
支持處理現代Web應用(SPA)的動態內容
靈活的導出格式選擇,滿足不同場景需求
可擴展的規則系統,支持自定義內容提取規則
侷限性
對高度動態或需要複雜交互的頁面支持有限
大規模抓取時可能需要配置代理IP
部分網站可能有反爬機制導致抓取失敗
無頭瀏覽器模式會消耗較多系統資源

如何使用

安裝服務器
克隆項目並安裝所需依賴
啟動服務
運行啟動命令啟動MCP服務器
發送請求
通過HTTP請求調用服務器提供的各種工具

使用案例

抓取新聞文章
從新聞網站獲取文章正文並保存為Markdown格式
批量獲取產品信息
從電商網站抓取多個產品頁面的關鍵信息
抓取需要登錄的內容
設置認證信息抓取需要登錄才能訪問的頁面

常見問題

為什麼有些網站抓取不到內容?
如何處理動態加載的內容?
可以抓取需要登錄的網站嗎?
如何提高抓取速度?
抓取的內容不準確怎麼辦?

相關資源

MCP協議文檔
Model Context Protocol官方文檔
示例規則集配置
常用網站的內容提取規則示例
Puppeteer使用指南
無頭瀏覽器Puppeteer官方文檔
Web抓取最佳實踐
網頁抓取的倫理和法律指南

安裝

複製以下命令到你的Client進行配置
注意:您的密鑰屬於敏感信息,請勿與任何人分享。

替代品

V
Vestige
Vestige是一個基於認知科學的AI記憶引擎,通過實現預測誤差門控、FSRS-6間隔重複、記憶夢境等29個神經科學模塊,為AI提供長期記憶能力。包含3D可視化儀表板和21個MCP工具,完全本地運行,無需雲端。
Rust
6.2K
4.5分
M
Moltbrain
MoltBrain是一個為OpenClaw、MoltBook和Claude Code設計的長期記憶層插件,能夠自動學習和回憶項目上下文,提供智能搜索、觀察記錄、分析統計和持久化存儲功能。
TypeScript
5.7K
4.5分
B
Bm.md
一個功能豐富的Markdown排版工具,支持多種樣式主題和平臺適配,提供即時編輯預覽、圖片導出和API集成能力
TypeScript
5.1K
5分
S
Security Detections MCP
Security Detections MCP 是一個基於Model Context Protocol的服務器,允許LLM查詢統一的安全檢測規則數據庫,涵蓋Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升級為自主檢測工程平臺,可自動從威脅情報中提取TTPs、分析覆蓋差距、生成SIEM原生格式檢測規則、運行測試並驗證。項目包含71+工具、11個預構建工作流提示和知識圖譜系統,支持多SIEM平臺。
TypeScript
6.4K
4分
P
Paperbanana
PaperBanana是一個自動化生成學術圖表和統計圖的智能框架,支持從文本描述生成高質量的論文插圖,採用多智能體管道和迭代優化,提供CLI、Python API和MCP服務器等多種使用方式。
Python
7.5K
5分
F
Finlab Ai
FinLab AI是一個金融量化分析平臺,通過AI技術幫助用戶發現投資策略中的超額收益(alpha)。它提供豐富的數據集、回測框架和策略示例,支持自動化安裝與集成到主流AI編程助手。
6.1K
4分
B
Better Icons
一個提供超過20萬圖標搜索和檢索的MCP服務器和CLI工具,支持150多個圖標庫,幫助AI助手和開發者快速獲取和使用圖標。
TypeScript
7.4K
4.5分
A
Assistant Ui
assistant-ui是一個開源TypeScript/React庫,用於快速構建生產級AI聊天界面,提供可組合的UI組件、流式響應、無障礙訪問等功能,支持多種AI後端和模型。
TypeScript
6.6K
5分
B
Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
39.2K
4.5分
M
Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
30.7K
5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
120.9K
5分
S
Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
31.4K
4.5分
M
Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
19.4K
5分
N
Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
19.2K
4.5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
24.2K
4.8分
C
Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
80.7K
4.7分
AIBase
智啟未來,您的人工智慧解決方案智庫
© 2026AIBase