MCP Server Spider
什麼是mcp-server-spider?
mcp-server-spider是一個基於Model Context Protocol的服務器,專門設計用於網頁爬取和內容抓取。它可以幫助用戶自動化地從網頁中提取鏈接和內容,適用於數據收集和分析等場景。如何使用mcp-server-spider?
通過簡單的API調用,您可以啟動爬蟲任務,指定目標URL和爬取深度等參數。服務器會返回爬取到的鏈接或頁面內容。適用場景
適用於市場調研、競爭分析、內容聚合、SEO分析等需要從多個網頁收集數據的場景。主要功能
網頁爬取從指定URL開始,按照設定的深度爬取網頁並返回所有發現的鏈接
內容抓取抓取網頁內容並返回結構化數據,包括URL、鏈接和頁面內容
URL過濾支持通過黑白名單正則表達式過濾URL
優勢與侷限性
優勢
簡單易用的API接口
支持靈活的URL過濾
可配置的爬取深度
支持robots.txt協議
侷限性
目前處於早期開發階段,可能存在bug
性能可能受目標網站響應速度影響
不支持JavaScript渲染的頁面
如何使用
安裝
使用pip或uv安裝mcp-server-spider
啟動服務器
安裝完成後運行服務器
發送請求
使用API工具向服務器發送爬取或抓取請求
使用案例
收集網站所有鏈接獲取一個網站的所有內部鏈接,用於分析網站結構
抓取新聞內容從新聞網站抓取文章標題和內容
常見問題
mcp-server-spider是免費的嗎?
如何處理網站的反爬機制?
支持的最大爬取深度是多少?
相關資源
uv文檔
uv安裝工具文檔
GitHub倉庫
項目源代碼
精選MCP服務推薦

Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
1.7K
5分

Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
717
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
3.9K
5分

Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
285
4.5分

Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
1.7K
5分

Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
5.2K
4.7分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
260
4.8分

Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
130
4.5分