OpticMCP

探索

Opticmcp

OpticMCP是一个为AI助手提供摄像头和视觉工具的MCP服务器，支持USB摄像头、IP网络摄像头、屏幕捕捉、图像分析、二维码解码等多种功能，实现通用摄像头接口。

图像与视频处理开发者工具 #摄像头工具 #视觉分析 #图像处理 #AI助手 .Python

评分 : 2.5分

下载量 : 8.1K

更新时间 : 2025-12-29

打开站点

什么是OpticMCP?

OpticMCP 是一个视觉工具服务器，专门为AI助手（如Claude、OpenCode等）提供摄像头访问和图像处理功能。通过这个服务器，AI助手可以： • 连接并控制USB摄像头 • 访问网络摄像头（RTSP、HLS、MJPEG流） • 捕获屏幕截图 • 从网页下载图像 • 解码QR码和条形码 • 分析图像内容（颜色、亮度、对比度等） • 比较图像相似度 • 检测人脸、物体和运动简单来说，它让AI助手拥有了“眼睛”，能够获取视觉信息并进行分析。

如何使用OpticMCP?

使用OpticMCP需要三个基本步骤： 1. **安装服务器**：通过pip或uv安装OpticMCP包 2. **配置AI助手**：在Claude Desktop或OpenCode的配置文件中添加OpticMCP服务器 3. **开始使用**：AI助手就可以通过自然语言命令控制摄像头和进行图像处理了例如，你可以告诉AI助手：“请用摄像头拍一张照片”或“检查这个QR码的内容”。

适用场景

OpticMCP适用于多种需要视觉功能的场景： • **智能监控**：让AI助手查看摄像头画面并报告异常 • **文档处理**：扫描和识别QR码、条形码 • **视觉辅助**：帮助用户了解周围环境（如描述房间布局） • **图像分析**：分析照片的色彩、亮度等属性 • **自动化测试**：验证UI界面或产品外观 • **教育演示**：展示计算机视觉的基本概念

主要功能

USB摄像头支持

连接和控制标准的USB摄像头，支持自动检测可用摄像头、实时拍照和视频流传输。

网络摄像头支持

支持多种网络摄像头协议：RTSP（实时流协议）、HLS（HTTP直播流）、MJPEG（动态JPEG流），兼容大多数IP摄像头和智能摄像头。

屏幕捕获

捕获整个屏幕或指定区域的截图，支持多显示器配置，可以指定要捕获的显示器。

QR码/条形码解码

识别和解码QR码和各种条形码（EAN、UPC、Code128等），支持在图像中标注识别结果。

图像分析

分析图像的元数据（尺寸、格式、EXIF信息）、计算亮度、对比度、锐度，生成颜色直方图，提取主色调。

图像比较

使用多种算法比较图像相似度：结构相似性指数（SSIM）、均方误差（MSE）、感知哈希，生成视觉差异图。

物体检测

检测图像中的人脸、常见物体（使用MobileNet SSD模型），支持运动检测和边缘检测。

多摄像头仪表板

实时查看多个摄像头的画面，支持动态添加/移除摄像头流，自动调整布局。

HTTP图像下载

从任何URL下载图像文件，支持验证图像有效性和获取图像信息。

优势

支持多种摄像头类型：从USB摄像头到网络摄像头全覆盖

丰富的图像处理功能：从基础拍照到高级分析一应俱全

易于集成：通过标准MCP协议与各种AI助手兼容

实时流媒体：支持低延迟的摄像头直播

跨平台：支持macOS、Windows、Linux系统

开源免费：MIT许可证，可自由使用和修改

局限性

需要Python环境：用户需要安装Python 3.10+

部分功能依赖系统库：如QR码解码需要libzbar

RTSP功能未充分测试：可能需要针对特定摄像头调整

物体检测需要额外模型文件：首次使用可能需要下载

高级功能需要技术知识：如摄像头配置和流媒体设置

如何使用

安装OpticMCP

通过Python包管理器安装OpticMCP服务器。

配置AI助手

在AI助手的配置文件中添加OpticMCP服务器。以Claude Desktop为例，编辑配置文件并添加服务器配置。

重启AI助手

重启AI助手以加载新的MCP服务器配置。

开始使用

现在你可以通过自然语言命令使用摄像头功能了。

使用案例

监控工作区域

用户想要AI助手帮忙监控工作区域，当检测到有人进入时发出提醒。

扫描文档QR码

用户有一份带有QR码的文档，想要快速获取其中的链接信息。

比较产品图片

用户有两张产品图片，想要知道它们是否显示的是同一产品。

分析房间照明

用户想要优化房间的照明设置，需要分析当前的光线条件。

常见问题

OpticMCP支持哪些类型的摄像头？

我需要安装额外的软件吗？

如何查看摄像头直播？

可以同时使用多个摄像头吗？

图像数据会发送到云端吗？

支持哪些AI助手？

🚀 OpticMCP

OpticMCP是一个模型上下文协议（MCP）服务器，为AI助手提供相机/视觉工具。它可以连接相机并捕获图像，供大语言模型（LLMs）使用。

🚀 快速开始

运行要求

Python 3.10 及以上版本
系统连接有USB相机

运行方式

从 PyPI 安装（推荐）

pip install optic-mcp

或者使用 uv：

uv pip install optic-mcp

安装完成后，若从 PyPI 安装，可使用以下命令启动 MCP 服务器：

optic-mcp

或者使用 uvx（无需安装）：

uvx optic-mcp

从源代码运行

# 克隆仓库
git clone https://github.com/Timorleiderman/OpticMCP.git
cd OpticMCP

# 使用 uv 安装依赖
uv sync

# 运行服务
uv run optic-mcp

✨ 主要特性

OpticMCP旨在成为AI助手的通用相机接口，支持以下类型的相机：

USB 相机 ✅
IP/网络相机 ✅ - 支持 RTSP、HLS、MJPEG 流
屏幕捕获 ✅ - 支持桌面/显示器捕获
HTTP 图像 ✅ - 从 URL 下载图像
QR/条形码解码 ✅ - 解码 QR 码和条形码
图像分析 ✅ - 支持提取元数据、统计信息、生成直方图、提取主色调
图像比较 ✅ - 支持使用 SSIM、MSE、感知哈希、可视化差异等方法
检测 ✅ - 支持人脸检测、运动检测、边缘检测
树莓派相机（计划中） - CSI 相机模块
移动相机（计划中） - 手机相机集成

具体功能

USB 相机

list_cameras - 扫描并列出所有可用的 USB 相机
save_image - 捕获一帧并直接保存到文件

相机流

start_stream - 开始将相机流传输到本地 HTTP 服务器（MJPEG 格式）
stop_stream - 停止相机流传输
list_streams - 列出所有活动的相机流

多相机仪表盘

start_dashboard - 启动一个动态仪表盘，以响应式网格布局显示所有活动的相机流
stop_dashboard - 停止仪表盘服务器

RTSP 流

rtsp_save_image - 从 RTSP 流中捕获并保存一帧
rtsp_check_stream - 验证 RTSP 流并获取其属性

HLS 流（HTTP 实时流）

hls_save_image - 从 HLS 流中捕获并保存一帧
hls_check_stream - 验证 HLS 流并获取其属性

MJPEG 流

mjpeg_save_image - 从 MJPEG 流（常见于 IP 相机、ESP32 - CAM）中捕获一帧
mjpeg_check_stream - 验证 MJPEG 流的可用性

屏幕捕获

screen_list_monitors - 列出所有可用的显示器
screen_save_image - 捕获显示器的全屏截图
screen_save_region - 捕获屏幕的特定区域

HTTP 图像

http_save_image - 从任何 URL 下载并保存图像
http_check_image - 检查 URL 是否指向有效的图像

QR/条形码解码（需要 libzbar）

decode_qr - 从图像中解码 QR 码
decode_barcode - 解码条形码（EAN、UPC、Code128 等）
decode_all - 从图像中解码所有 QR 码和条形码
decode_and_annotate - 解码并保存带有边界框的注释图像

图像分析

image_get_metadata - 提取图像元数据，包括 EXIF 数据
image_get_stats - 计算图像的亮度、对比度、清晰度
image_get_histogram - 生成颜色直方图，可选择可视化
image_get_dominant_colors - 使用 K - means 聚类提取主色调

图像比较

image_compare_ssim - 使用结构相似性指数（SSIM）比较图像
image_compare_mse - 使用均方误差（MSE）比较图像
image_compare_hash - 使用感知哈希（phash、dhash、ahash）比较图像
image_get_hash - 为图像生成感知哈希
image_diff - 创建可视化差异，突出显示两幅图像的不同之处
image_compare_histograms - 通过颜色直方图比较图像

检测

detect_faces - 使用 Haar 级联或深度神经网络（DNN）检测人脸
detect_faces_save - 检测人脸并保存带有边界框的注释图像
detect_motion - 比较两帧图像以检测运动
detect_edges - 使用 Canny、Sobel 或 Laplacian 方法检测图像边缘
detect_objects - 使用 MobileNet SSD 检测常见物体

📦 安装指南

从 PyPI 安装（推荐）

pip install optic-mcp

或者使用 uv：

uv pip install optic-mcp

从源代码安装

# 克隆仓库
git clone https://github.com/Timorleiderman/OpticMCP.git
cd OpticMCP

# 使用 uv 安装依赖
uv sync

💻 使用示例

运行 MCP 服务器

从 PyPI 安装后运行

optic-mcp

使用 `uvx` 运行（无需安装）

uvx optic-mcp

从源代码运行

uv run optic-mcp

MCP 配置

Claude Desktop

将以下内容添加到你的 Claude Desktop 配置文件中： macOS：~/Library/Application Support/Claude/claude_desktop_config.json Windows：%APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "optic-mcp": {
      "command": "uvx",
      "args": ["optic-mcp"]
    }
  }
}

OpenCode

将以下内容添加到你的 opencode.json 文件中（在项目目录的 .opencode/ 或全局的 ~/.opencode/ 中）：

{
  "mcp": {
    "optic-mcp": {
      "type": "local",
      "command": ["uvx", "optic-mcp"]
    }
  }
}

其他 MCP 客户端

使用 uvx（推荐 - 无需安装）：

{
  "mcpServers": {
    "optic-mcp": {
      "command": "uvx",
      "args": ["optic-mcp"]
    }
  }
}

使用 pip 安装：

{
  "mcpServers": {
    "optic-mcp": {
      "command": "optic-mcp"
    }
  }
}

从源代码运行：

{
  "mcpServers": {
    "optic-mcp": {
      "command": "uv",
      "args": ["run", "--directory", "/path/to/OpticMCP", "optic-mcp"]
    }
  }
}

📚 详细文档

工具使用说明

list_cameras

扫描可用的 USB 相机（索引 0 - 9）并返回其状态。

[
  {
    "index": 0,
    "status": "available",
    "backend": "AVFOUNDATION",
    "description": "Camera 0 (AVFOUNDATION)"
  }
]

save_image

捕获一帧并保存到磁盘。 参数：

file_path (str) - 图像保存路径
camera_index (int, 默认值: 0) - 要捕获图像的相机索引

返回值： 包含文件路径的成功消息

流工具

将相机流传输到本地 HTTP 服务器，以便在任何浏览器中实时查看。

start_stream

开始将相机流传输到本地 HTTP 服务器。流使用广泛支持的 MJPEG 格式。 参数：

camera_index (int, 默认值: 0) - 要流传输的相机索引
port (int, 默认值: 8080) - 流服务的端口

返回值： 包含流 URL 和状态的字典

{
  "status": "started",
  "camera_index": 0,
  "port": 8080,
  "url": "http://localhost:8080",
  "stream_url": "http://localhost:8080/stream"
}

使用方法：

在浏览器中打开 http://localhost:8080 以使用简单 UI 查看流
使用 http://localhost:8080/stream 获取原始 MJPEG 流（可嵌入其他应用程序）

stop_stream

停止相机流传输。 参数：

camera_index (int, 默认值: 0) - 要停止流传输的相机索引

返回值： 包含状态的字典

list_streams

列出所有活动的相机流。 返回值： 包含活动流信息（包括 URL 和端口）的列表

仪表盘工具

start_dashboard

启动一个动态的多相机仪表盘服务器。仪表盘会自动检测所有活动的相机流，并以响应式网格布局显示它们。 参数：

port (int, 默认值: 9000) - 仪表盘服务的端口

返回值： 包含仪表盘 URL 和状态的字典

{
  "status": "started",
  "port": 9000,
  "url": "http://localhost:9000"
}

使用方法：

使用 start_stream 启动一个或多个相机流。
使用 start_dashboard 启动仪表盘。
在浏览器中打开 http://localhost:9000。
仪表盘每 3 秒自动更新一次，以检测新的/已移除的流。

stop_dashboard

停止仪表盘服务器。 返回值： 包含状态的字典

RTSP 工具

注意： RTSP 功能尚未在真实的 RTSP 硬件/流上进行测试。虽然已实现，但可能需要针对特定相机供应商进行调整。

rtsp_save_image

从 RTSP 流中捕获一帧并保存到磁盘。 参数：

rtsp_url (str) - RTSP 流 URL（例如，rtsp://ip:554/stream）
file_path (str) - 图像保存路径
timeout_seconds (int, 默认值: 10) - 连接超时时间

返回值： 包含文件路径的成功消息

rtsp_check_stream

验证 RTSP 流并返回流信息。 参数：

rtsp_url (str) - 要验证的 RTSP 流 URL
timeout_seconds (int, 默认值: 10) - 连接超时时间

返回值： 包含流状态和属性（宽度、高度、帧率、编解码器）的字典

HLS 工具

hls_save_image

从 HLS 流中捕获一帧并保存到磁盘。 参数：

hls_url (str) - HLS 流 URL（通常以 .m3u8 结尾）
file_path (str) - 图像保存路径
timeout_seconds (int, 默认值: 30) - 连接超时时间

返回值： 包含文件路径的成功消息

hls_check_stream

验证 HLS 流并返回流信息。 参数：

hls_url (str) - 要验证的 HLS 流 URL
timeout_seconds (int, 默认值: 30) - 连接超时时间

返回值： 包含流状态和属性（宽度、高度、帧率、编解码器）的字典

MJPEG 工具

mjpeg_save_image

从 MJPEG 流（常见于 IP 相机、ESP32 - CAM、Arduino 相机）中捕获一帧。 参数：

mjpeg_url (str) - MJPEG 流 URL（例如，http://camera/video.mjpg）
file_path (str) - 图像保存路径
timeout_seconds (int, 默认值: 10) - 连接超时时间

返回值： 包含状态、文件路径和字节大小的字典

mjpeg_check_stream

验证 MJPEG 流 URL。 参数：

mjpeg_url (str) - 要验证的 MJPEG 流 URL
timeout_seconds (int, 默认值: 10) - 连接超时时间

返回值： 包含状态、URL 和内容类型的字典

屏幕捕获工具

screen_list_monitors

列出所有可用的显示器。 返回值： 包含显示器 ID、尺寸和位置的列表

screen_save_image

捕获显示器的全屏截图。 参数：

file_path (str) - 图像保存路径
monitor (int, 默认值: 0) - 显示器索引（0 表示所有显示器组合）

返回值： 包含状态、文件路径和尺寸的字典

screen_save_region

捕获屏幕的特定区域。 参数：

file_path (str) - 图像保存路径
x (int) - 左上角的 X 坐标
y (int) - 左上角的 Y 坐标
width (int) - 宽度（像素）
height (int) - 高度（像素）

返回值： 包含状态、文件路径和区域详细信息的字典

HTTP 图像工具

http_save_image

从 URL 下载图像并保存到磁盘。 参数：

url (str) - 图像 URL（http:// 或 https://）
file_path (str) - 图像保存路径
timeout_seconds (int, 默认值: 30) - 连接超时时间

返回值： 包含状态、文件路径、字节大小和内容类型的字典

http_check_image

使用 HEAD 请求验证图像 URL。 参数：

url (str) - 要验证的图像 URL
timeout_seconds (int, 默认值: 10) - 连接超时时间

返回值： 包含状态、内容类型和字节大小的字典

QR/条形码工具

注意： 这些工具需要 libzbar 系统库。在 macOS 上使用 brew install zbar 安装，在 Linux 上使用 apt install libzbar0 安装。

decode_qr

从图像文件中解码 QR 码。 参数：

file_path (str) - 图像文件路径

返回值： 包含是否找到、数量和代码列表的字典

decode_barcode

从图像文件中解码条形码（EAN、UPC、Code128 等）。 参数：

file_path (str) - 图像文件路径

返回值： 包含是否找到、数量和代码列表的字典

decode_all

从图像文件中解码所有 QR 码和条形码。 参数：

file_path (str) - 图像文件路径

返回值： 包含是否找到、数量和代码列表的字典

decode_and_annotate

解码代码并保存带有边界框的注释图像。 参数：

file_path (str) - 输入图像路径
output_path (str) - 注释输出图像路径

返回值： 包含是否找到、数量、输出路径和代码列表的字典

图像分析工具

image_get_metadata

从图像文件中提取元数据，包括尺寸、格式和 EXIF 数据。 参数：

file_path (str) - 图像文件路径

返回值： 包含宽度、高度、格式、模式、文件大小字节和 EXIF 字典的字典

{
  "width": 1920,
  "height": 1080,
  "format": "JPEG",
  "mode": "RGB",
  "file_size_bytes": 245678,
  "exif": {"Make": "Canon", "Model": "EOS R5", ...}
}

image_get_stats

计算图像的基本统计信息，包括亮度、对比度和清晰度。 参数：

file_path (str) - 图像文件路径

返回值： 包含亮度（0 - 1）、对比度（0 - 1）、清晰度和是否为灰度图像的字典

{
  "brightness": 0.65,
  "contrast": 0.42,
  "sharpness": 2.35,
  "is_grayscale": false
}

image_get_histogram

计算每个通道（R、G、B）的颜色直方图，可选择可视化。 参数：

file_path (str) - 图像文件路径
output_path (str, 可选) - 保存直方图可视化的路径

返回值： 包含通道（r、g、b 数组，每个数组 256 个值）和输出路径（如果提供）的字典

image_get_dominant_colors

使用 K - means 聚类提取主色调。 参数：

file_path (str) - 图像文件路径
num_colors (int, 默认值: 5) - 要提取的颜色数量（1 - 20）

返回值： 包含颜色的 RGB 值、十六进制代码和百分比的列表

{
  "colors": [
    {"rgb": [64, 128, 192], "hex": "#4080C0", "percentage": 35.2},
    {"rgb": [255, 255, 255], "hex": "#FFFFFF", "percentage": 28.1}
  ]
}

图像比较工具

image_compare_ssim

使用结构相似性指数（SSIM）比较两幅图像。 参数：

file_path_1 (str) - 第一幅图像的路径
file_path_2 (str) - 第二幅图像的路径
threshold (float, 默认值: 0.95) - 相似度阈值

返回值： 包含 SSIM 分数（-1 到 1）、是否相似和阈值的字典

{
  "ssim_score": 0.9823,
  "is_similar": true,
  "threshold": 0.95
}

image_compare_mse

使用均方误差（MSE）比较两幅图像。 参数：

file_path_1 (str) - 第一幅图像的路径
file_path_2 (str) - 第二幅图像的路径

返回值： 包含 MSE、是否相同和归一化 MSE（0 - 1）的字典

image_compare_hash

使用感知哈希比较两幅图像。 参数：

file_path_1 (str) - 第一幅图像的路径
file_path_2 (str) - 第二幅图像的路径
hash_type (str, 默认值: "phash") - 哈希类型："phash"、"dhash" 或 "ahash"

返回值： 包含哈希 1、哈希 2、距离、是否相似和哈希类型的字典

{
  "hash_1": "8f0f0f0f0f0f0f0f",
  "hash_2": "8f0f0f0f0f0f0f0f",
  "distance": 0,
  "is_similar": true,
  "hash_type": "phash"
}

image_get_hash

为单幅图像生成感知哈希。 参数：

file_path (str) - 图像文件路径
hash_type (str, 默认值: "phash") - 哈希类型："phash"、"dhash" 或 "ahash"

返回值： 包含哈希（十六进制字符串）和哈希类型的字典

image_diff

创建可视化差异，突出显示两幅图像的不同之处。 参数：

file_path_1 (str) - 参考图像的路径
file_path_2 (str) - 比较图像的路径
output_path (str) - 保存差异可视化的路径
threshold (int, 默认值: 30) - 像素差异阈值（0 - 255）

返回值： 包含状态、输出路径、差异百分比和差异像素数的字典

{
  "status": "success",
  "output_path": "/path/to/diff.png",
  "diff_percentage": 12.5,
  "diff_pixels": 25600
}

image_compare_histograms

通过颜色直方图比较两幅图像。 参数：

file_path_1 (str) - 第一幅图像的路径
file_path_2 (str) - 第二幅图像的路径
method (str, 默认值: "correlation") - 方法："correlation"、"chi_square"、"intersection"、"bhattacharyya"

返回值： 包含分数、方法和是否相似的字典

检测工具

detect_faces

使用 Haar 级联或深度神经网络（DNN）检测图像中的人脸。 参数：

file_path (str) - 图像文件路径
method (str, 默认值: "haar") - 检测方法："haar"（快速）或 "dnn"（准确）

返回值： 包含是否找到、数量和人脸列表（包含 x、y、宽度、高度和置信度（仅 DNN））的字典

{
  "found": true,
  "count": 2,
  "faces": [
    {"x": 120, "y": 80, "width": 150, "height": 150},
    {"x": 400, "y": 100, "width": 140, "height": 140, "confidence": 0.95}
  ]
}

detect_faces_save

检测人脸并保存带有边界框的注释图像。 参数：

file_path (str) - 输入图像路径
output_path (str) - 保存注释图像的路径
method (str, 默认值: "haar") - 检测方法："haar" 或 "dnn"

返回值： 包含是否找到、数量、输出路径和人脸列表的字典

detect_motion

比较两帧图像以检测它们之间的运动。 参数：

file_path_1 (str) - 第一幅（较早）图像的路径
file_path_2 (str) - 第二幅（较晚）图像的路径
threshold (float, 默认值: 25.0) - 像素差异阈值（0 - 255）

返回值： 包含是否检测到运动、运动百分比、运动区域列表和变化像素数的字典

{
  "motion_detected": true,
  "motion_percentage": 15.3,
  "motion_regions": [
    {"x": 200, "y": 150, "width": 80, "height": 120}
  ],
  "changed_pixels": 31250
}

detect_edges

使用各种方法检测图像中的边缘。 参数：

file_path (str) - 输入图像路径
output_path (str) - 保存边缘检测输出的路径
method (str, 默认值: "canny") - 方法："canny"、"sobel" 或 "laplacian"

返回值： 包含状态、输出路径和方法的字典

{
  "status": "success",
  "output_path": "/path/to/edges.png",
  "method": "canny"
}

detect_objects

使用 MobileNet SSD 检测常见物体。 参数：

file_path (str) - 图像文件路径
confidence_threshold (float, 默认值: 0.5) - 最小置信度（0 - 1）

返回值： 包含是否找到、数量和物体列表的字典

注意： 需要预训练的 MobileNet SSD 模型文件。如果模型不可用，将返回空结果。

{
  "found": true,
  "count": 3,
  "objects": [
    {"class": "person", "confidence": 0.92, "x": 50, "y": 100, "width": 200, "height": 400},
    {"class": "car", "confidence": 0.87, "x": 300, "y": 250, "width": 180, "height": 120}
  ]
}

🔧 技术细节

OpenCV + MCP 兼容性

OpenCV 会将调试消息打印到标准错误输出（stderr），这会破坏 MCP 的标准输入输出（stdio）通信。此服务器在导入 cv2 之前在文件描述符级别抑制了标准错误输出，以防止此问题。

📄 许可证

本项目采用 MIT 许可证。

贡献说明

欢迎贡献代码！请参阅 CONTRIBUTING.md 获取指南。

路线图

[x] v0.1.0 - 通过 OpenCV 支持 USB 相机
[x] v0.2.0 - 支持 IP 相机（RTSP 和 HLS 流）
[x] v0.3.0 - 具有实时流的多相机仪表盘
[x] v0.4.0 - 屏幕捕获、MJPEG 流、HTTP 图像、QR/条形码解码
[x] v0.5.0 - 图像分析和比较工具（元数据、统计信息、SSIM、哈希、差异）
[x] v0.6.0 - 检测工具（人脸检测、运动检测、边缘检测）
[ ] v0.7.0 - 相机配置（分辨率、格式等）
[ ] v0.8.0 - 视频录制功能

list_cameras

扫描系统中可用的USB摄像头

save_image

从指定摄像头捕获一帧图像并保存到给定文件路径

参数

file_path : str*

描述

图像保存路径

参数

camera_index : int*

描述

摄像头索引，默认为0

rtsp_save_image

从RTSP流捕获一帧图像并保存到给定文件路径

参数

rtsp_url : str*

描述

RTSP流URL

参数

file_path : str*

描述

图像保存路径

参数

timeout_seconds : int*

描述

连接超时时间（秒），默认为10

rtsp_check_stream

验证RTSP流URL并返回流信息

参数

rtsp_url : str*

描述

RTSP流URL

参数

timeout_seconds : int*

描述

连接超时时间（秒），默认为10

hls_save_image

从HLS流捕获一帧图像并保存到给定文件路径

参数

hls_url : str*

描述

HLS流URL

参数

file_path : str*

描述

图像保存路径

参数

timeout_seconds : int*

描述

连接超时时间（秒），默认为30

hls_check_stream

验证HLS流URL并返回流信息

参数

hls_url : str*

描述

HLS流URL

参数

timeout_seconds : int*

描述

连接超时时间（秒），默认为30

start_stream

启动摄像头流到本地HTTP服务器

参数

camera_index : int*

描述

摄像头索引，默认为0

参数

port : int*

描述

服务端口，默认为8080

stop_stream

停止摄像头流

参数

camera_index : int*

描述

摄像头索引

list_streams

列出所有活动的摄像头流

start_dashboard

启动多摄像头仪表板服务器

参数

port : int*

描述

服务端口，默认为9000

stop_dashboard

停止多摄像头仪表板服务器

mjpeg_save_image

从MJPEG流捕获一帧图像并保存到给定文件路径

参数

mjpeg_url : str*

描述

MJPEG流URL

参数

file_path : str*

描述

图像保存路径

参数

timeout_seconds : int*

描述

连接超时时间（秒），默认为10

mjpeg_check_stream

验证MJPEG流URL并返回流信息

参数

mjpeg_url : str*

描述

MJPEG流URL

参数

timeout_seconds : int*

描述

连接超时时间（秒），默认为10

screen_list_monitors

列出系统中所有可用的显示器

screen_save_image

捕获指定显示器的完整截图并保存到文件

参数

file_path : str*

描述

图像保存路径

参数

monitor : int*

描述

显示器索引（0=所有显示器，1+=特定显示器）

screen_save_region

捕获屏幕特定区域并保存到文件

参数

file_path : str*

描述

图像保存路径

参数

x : int*

描述

区域左上角X坐标

参数

y : int*

描述

区域左上角Y坐标

参数

width : int*

描述

区域宽度（像素）

参数

height : int*

描述

区域高度（像素）

http_save_image

从URL下载图像并保存到给定文件路径

参数

url : str*

描述

图像URL

参数

file_path : str*

描述

图像保存路径

参数

timeout_seconds : int*

描述

连接超时时间（秒），默认为30

http_check_image

使用HEAD请求验证HTTP图像URL

参数

url : str*

描述

图像URL

参数

timeout_seconds : int*

描述

连接超时时间（秒），默认为10

decode_qr

从图像文件中解码QR码

参数

file_path : str*

描述

图像文件路径

decode_barcode

从图像文件中解码条形码

参数

file_path : str*

描述

图像文件路径

decode_all

从图像文件中解码所有支持的码类型

参数

file_path : str*

描述

图像文件路径

decode_and_annotate

解码图像中的所有码并保存带边界框的注释图像

参数

file_path : str*

描述

输入图像文件路径

参数

output_path : str*

描述

注释图像保存路径

image_get_metadata

从图像文件中提取元数据

参数

file_path : str*

描述

图像文件路径

image_get_stats

计算基本图像统计信息

参数

file_path : str*

描述

图像文件路径

image_get_histogram

计算图像的颜色直方图

参数

file_path : str*

描述

图像文件路径

参数

output_path : str*

描述

直方图可视化图像保存路径（可选）

image_get_dominant_colors

使用K-means聚类提取图像中的主色

参数

file_path : str*

描述

图像文件路径

参数

num_colors : int*

描述

要提取的主色数量（1-20，默认为5）

image_compare_ssim

使用结构相似性指数（SSIM）比较两幅图像

参数

file_path_1 : str*

描述

第一幅图像路径

参数

file_path_2 : str*

描述

第二幅图像路径

参数

threshold : float*

描述

SSIM阈值，高于此值认为图像相似（默认为0.95）

image_compare_mse

使用均方误差（MSE）比较两幅图像

参数

file_path_1 : str*

描述

第一幅图像路径

参数

file_path_2 : str*

描述

第二幅图像路径

image_compare_hash

使用感知哈希比较两幅图像

参数

file_path_1 : str*

描述

第一幅图像路径

参数

file_path_2 : str*

描述

第二幅图像路径

参数

hash_type : str*

描述

哈希类型（'phash'、'dhash'、'ahash'）

image_get_hash

计算单幅图像的感知哈希

参数

file_path : str*

描述

图像文件路径

参数

hash_type : str*

描述

哈希类型（'phash'、'dhash'、'ahash'）

image_diff

创建可视化差异图，突出显示两幅图像之间的差异

参数

file_path_1 : str*

描述

第一幅（参考）图像路径

参数

file_path_2 : str*

描述

第二幅（比较）图像路径

参数

output_path : str*

描述

差异可视化图像保存路径

参数

threshold : int*

描述

像素差异阈值（0-255，默认为30）

image_compare_histograms

通过颜色直方图比较两幅图像

参数

file_path_1 : str*

描述

第一幅图像路径

参数

file_path_2 : str*

描述

第二幅图像路径

参数

method : str*

描述

比较方法

detect_faces

使用Haar级联或DNN检测图像中的人脸

参数

file_path : str*

描述

图像文件路径

参数

method : str*

描述

检测方法 - 'haar'（快速）或 'dnn'（准确）

detect_faces_save

检测人脸并保存带边界框的图像

参数

file_path : str*

描述

输入图像文件路径

参数

output_path : str*

描述

注释输出图像保存路径

参数

method : str*

描述

检测方法 - 'haar'（快速）或 'dnn'（准确）

detect_motion

比较两帧图像以检测它们之间的运动

参数

file_path_1 : str*

描述

第一幅（较早）图像路径

参数

file_path_2 : str*

描述

第二幅（较晚）图像路径

参数

threshold : float*

描述

像素差异阈值（0-255，默认为25）

detect_edges

使用各种方法检测图像中的边缘

参数

file_path : str*

描述

输入图像文件路径

参数

output_path : str*

描述

边缘检测输出图像保存路径

参数

method : str*

描述

检测方法 - 'canny'、'sobel'或'laplacian'

detect_objects

使用OpenCV的DNN模块检测图像中的常见对象

参数

file_path : str*

描述

图像文件路径

参数

confidence_threshold : float*

描述

检测的最小置信度（0-1，默认为0.5）

Figma Context MCP

Framelink Figma MCP Server是一个为AI编程工具（如Cursor）提供Figma设计数据访问的服务器，通过简化Figma API响应，帮助AI更准确地实现设计到代码的一键转换。

TypeScript

71.9K

4.5分

Duckduckgo MCP Server

已认证

DuckDuckGo搜索MCP服务器，为Claude等LLM提供网页搜索和内容抓取服务

Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器，提供丰富的网页抓取、搜索和内容提取功能。

百度地图MCP Server是国内首个兼容MCP协议的地图服务，提供地理编码、路线规划等10个标准化API接口，支持Python和Typescript快速接入，赋能智能体实现地图相关功能。

Python

47.3K

4.5分

Edgeone Pages MCP Server

EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务

MiniMax Model Context Protocol (MCP) 是一个官方服务器，支持与强大的文本转语音、视频/图像生成API交互，适用于多种客户端工具如Claude Desktop、Cursor等。

Exa MCP Server是一个为AI助手（如Claude）提供网络搜索功能的服务器，通过Exa AI搜索API实现实时、安全的网络信息获取。

Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务，通过Model Context Protocol直接集成到提示中，解决LLM使用过时信息的问题。

智启未来，您的人工智能解决方案智库

概述

安装

工具列表

内容详情

替代品

什么是OpticMCP?

如何使用OpticMCP?

适用场景

主要功能

如何使用

使用案例

常见问题

相关资源

安装

🚀 OpticMCP

🚀 快速开始

运行要求

运行方式

从 PyPI 安装（推荐）

从源代码运行

✨ 主要特性

具体功能

USB 相机

相机流

多相机仪表盘

RTSP 流

HLS 流（HTTP 实时流）

MJPEG 流

屏幕捕获

HTTP 图像

QR/条形码解码（需要 libzbar）

图像分析

图像比较

检测

📦 安装指南

从 PyPI 安装（推荐）

从源代码安装

💻 使用示例

运行 MCP 服务器

从 PyPI 安装后运行

使用 uvx 运行（无需安装）

从源代码运行

MCP 配置

Claude Desktop

OpenCode

其他 MCP 客户端

📚 详细文档

工具使用说明

list_cameras

save_image

流工具

start_stream

stop_stream

list_streams

仪表盘工具

start_dashboard

stop_dashboard

RTSP 工具

rtsp_save_image

rtsp_check_stream

HLS 工具

hls_save_image

hls_check_stream

MJPEG 工具

mjpeg_save_image

mjpeg_check_stream

屏幕捕获工具

screen_list_monitors

screen_save_image

screen_save_region

HTTP 图像工具

http_save_image

http_check_image

QR/条形码工具

decode_qr

decode_barcode

decode_all

decode_and_annotate

图像分析工具

使用 `uvx` 运行（无需安装）