数据提取

# 数据提取

H
Hyperbrowser
Hyperbrowser的MCP服务器提供网页抓取、结构化数据提取和浏览器代理工具。
TypeScript
11.5K
3.5分
M
MCP Server Firecrawl
Firecrawl MCP Server是一个基于Firecrawl API的网络爬虫和数据提取服务,提供网页抓取、内容搜索、站点爬取和结构化数据提取功能。
TypeScript
9.3K
2.5分
M
Msparihar MCP Server Firecrawl
Firecrawl MCP服务器是一个基于Firecrawl API的网络爬虫服务,提供网页抓取、内容搜索、站点爬取和结构化数据提取功能,支持多种配置选项和输出格式。
TypeScript
8.7K
2分
M
Mcphackathon
该项目通过Unstructured API构建了一个MCP服务器,用于处理研究论文数据,提取关键信息并转换为结构化JSON格式,帮助研究人员快速获取文献信息,减少文献综述时间。
Python
9.6K
2.5分
S
Scrapi
ScrAPI MCP服务器是一个基于ScrAPI服务的网页抓取工具,提供HTML和Markdown两种格式的网页内容提取功能。
TypeScript
14.8K
2.5分
T
Tavily MCP
Tavily MCP是一个开源项目,通过Model Context Protocol(MCP)标准使AI系统能够无缝连接Tavily的搜索和数据提取工具,为Claude等AI助手提供实时网络信息访问能力。项目提供搜索、提取、映射和爬取工具,支持多种客户端配置。
TypeScript
12.1K
2分
M
MCP Ethical Hacking
该项目是一个用于教育目的的MCP工具包,展示社交平台内容分析技术及其安全风险,包含Reddit和LinkedIn的数据提取与分析工具。
Python
8.9K
2.5分
M
MCP Searxng 1g0
mcp-searxng是一个为AI代理设计的MCP服务器示例,通过SearXNG开源元搜索引擎实现外部信息搜索功能。项目展示了如何集成SearXNG和微软的markdownify工具,将网页内容转换为Markdown格式文本,并通过SSE协议与MCP客户端通信。
Python
11.3K
2.5分
C
Crawl4ai MCP
Crawl4AI是一个基于MCP架构的智能网络爬虫服务器,结合Claude AI模型提供网站内容分析与处理功能,支持可定制的爬取深度和AI处理任务,适用于研究、内容创作、数据分析等多种场景。
JavaScript
12.1K
2.5分
E
Excelreadmcp
ExcelReadMCP是一个专门用于读取Excel文件的MCP协议服务器,提供读取、搜索和获取工作簿信息等功能,支持在Cursor和GitHub Copilot等客户端中使用
Python
10.9K
2分
A
Amazon Order History Csv Download MCP
亚马逊订单历史CSV下载MCP服务器,支持跨16个地区站点自动化导出订单、商品、物流和交易数据,适用于AI助手集成和数据分析
TypeScript
5.9K
2分
M
Mcpdatafetchserver
MCP数据获取服务器是一个安全、沙盒化的服务器,通过模型控制协议(MCP)获取网页内容并提取数据,不执行JavaScript。
Python
7.2K
2.5分
L
Linkedin Spider
LinkedIn数据爬虫工具,支持个人资料、公司信息、帖子搜索等多种数据提取,提供Python库、命令行和MCP服务器三种使用方式,内置反检测机制。
Python
5.4K
2.5分
B
Browserbase MCP Server Browserbase
Browserbase MCP Server是一个基于Model Context Protocol(MCP)的开源项目,提供云浏览器自动化能力,支持网页交互、数据提取、截图和JavaScript执行等功能,帮助LLM应用与外部数据源和工具无缝集成。
TypeScript
7.9K
2.5分
W
Webscraping Ai MCP Server
WebScraping.AI MCP服务器是一个集成网络数据提取功能的协议服务实现,提供多种网页内容处理工具。
JavaScript
9.7K
2.5分
S
Scrapi MCP
ScrAPI MCP服务器是一个基于ScrAPI技术的网页抓取服务,提供HTML和Markdown两种格式的网页内容提取功能,支持本地部署和云端访问。
TypeScript
7.0K
2.5分
C
Cryo MCP
Cryo MCP是一个基于Cryo区块链数据提取工具的模型完成协议服务器,提供API访问区块链数据的能力,支持SQL查询和多种数据格式输出。
Python
9.7K
3分
F
Firecrawl
一个基于Firecrawl API的网站数据抓取和结构化提取服务
JavaScript
9.3K
2分
C
Custom Context MCP
提供基于JSON模板的文本结构化提取服务
TypeScript
9.5K
2.5分
L
Linkedin Browser MCP Server
一个基于FastMCP的LinkedIn自动化服务器,提供安全认证、个人资料操作和帖子互动功能,支持浏览器自动化数据提取。
Python
8.5K
2.5分
S
Scrapezy
Scrapezy MCP服务器是一个用于从网站提取结构化数据的AI模型服务,支持通过Claude等工具进行数据抓取。
TypeScript
10.9K
2.5分
O
Orion Vision (Azure Form Recognizer)
Orion Vision MCP服务器是一个基于Model Context Protocol(MCP)的开源项目,提供与Azure文档智能服务的无缝集成,支持多种文档类型的分析和数据提取功能。
TypeScript
8.1K
2.5分
E
Excel Search MCP
一个用于搜索和读取本地Excel文件的MCP服务器,支持文件搜索、数据提取和文本搜索功能
Python
6.7K
2.5分
B
Browserbase
Browserbase MCP Server是一个基于Model Context Protocol(MCP)的开源项目,提供云浏览器自动化服务,支持网页交互、数据提取和JavaScript执行等功能。
TypeScript
12.5K
0分
S
Scraper.is
Scraper.is MCP是一个基于模型上下文协议(MCP)的网页抓取工具集成包,允许AI助手通过MCP协议抓取网页内容,支持多种格式输出和实时进度更新。
TypeScript
9.2K
2分
S
Scrapegraph MCP
ScrapeGraph MCP服务器是一个生产就绪的模型上下文协议服务器,提供与ScrapeGraph AI API的无缝集成,使语言模型能够利用先进的AI驱动的网页抓取功能。
Python
9.0K
2.5分
S
Search MCP Server
一个强大的MCP服务器,提供网页搜索和相似内容查找功能,支持Claude Desktop集成
Python
8.4K
2.5分
B
Browser Automation Server
一个基于MCP协议的浏览器自动化服务,提供网页导航、截图、元素交互、表单填写和数据提取等功能。
TypeScript
9.5K
2分
F
Firecrawl
Firecrawl是一个API服务,能够将任何网站爬取并转换为干净的Markdown或结构化数据,支持高级爬取、数据提取和LLM-ready格式转换。
TypeScript
8.4K
2分
D
Data MCP Server
Data MCP Server是一个提供网页抓取、结构化数据提取和爬取功能的工具集,同时支持多种浏览器代理工具如OpenAI CUA和Claude Computer Use。
TypeScript
5.2K
2分

精选MCP服务推荐

D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
75.1K
4.3分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
68.9K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
132.7K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
29.4K
4.8分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
57.4K
4.8分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
95.3K
4.7分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
50.5K
5分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
45.2K
4.5分
AIBase
智启未来,您的人工智能解决方案智库
© 2026AIBase