Xiaozhi Autoglm MCP
X

Xiaozhi Autoglm MCP

基于Open-AutoGLM构建的安卓设备自动化MCP服务,通过ADB连接手机并调用视觉模型,可接入小智AI实现智能控制。
2.5分
7.3K

什么是小智AutoGLM MCP服务?

小智AutoGLM MCP服务是一个智能安卓设备自动化工具,它允许你通过自然语言指令控制安卓手机或平板电脑。该服务基于先进的视觉语言模型,能够理解屏幕内容并执行相应的操作,如点击、滑动、输入文字等。

如何使用小智AutoGLM MCP服务?

使用本服务需要准备一台安卓设备(手机或模拟器),通过USB连接到电脑,并完成ADB和ADB Keyboard的配置。配置完成后,启动MCP服务,即可通过小智AI或私有化部署的小智服务器发送指令来控制设备。

适用场景

本服务特别适合需要自动化操作安卓设备的场景,例如:自动化测试、批量执行重复任务、远程设备控制、为视力障碍用户提供辅助操作等。

主要功能

安卓设备自动化控制
通过ADB连接,实现对安卓设备的点击、滑动、输入等基础操作的自动化执行。
视觉语言模型驱动
集成ChatGLM等视觉语言大模型,能够理解屏幕截图内容,将自然语言指令转化为具体的设备操作步骤。
MCP协议接入
遵循Model Context Protocol标准,可以轻松接入小智AI平台或私有化部署的小智服务器,实现远程调用。
跨平台支持
提供Linux/macOS和Windows系统的启动脚本,方便在不同操作系统上部署和运行。
优势
智能化操作:无需编写复杂脚本,用自然语言即可控制设备。
易于集成:通过标准MCP协议,可快速接入现有AI助手生态。
开源可定制:基于Open-AutoGLM开源项目构建,可根据需求进行二次开发。
支持真实设备与模拟器:既可用于真机测试,也可用于模拟器自动化。
局限性
依赖外部模型:视觉理解能力依赖于ChatGLM等第三方API,可能需要付费且受网络影响。
配置步骤较多:需要安装ADB、配置设备开发者选项、安装输入法等,对新手有一定门槛。
仅支持安卓:目前仅支持Android 7.0及以上版本的设备,不支持iOS或其他系统。
需要USB连接:大部分操作需要通过USB数据线连接设备,限制了完全的无线远程控制。

如何使用

环境准备:安装ADB工具
从Android开发者官网下载ADB工具包,解压到本地目录,并将该目录添加到系统的环境变量PATH中,以便在终端中可以直接使用adb命令。
设备准备:启用开发者选项
在安卓设备上,进入‘设置 > 关于手机’,连续点击‘版本号’7次以上,直到提示‘您已处于开发者模式’。然后返回设置,进入新出现的‘开发者选项’,开启‘USB调试’功能。
安装ADB Keyboard输入法
在安卓设备上安装ADB Keyboard APK文件。安装后,进入‘设置 > 系统 > 语言和输入法 > 虚拟键盘’,启用‘ADB Keyboard’输入法。这是实现自动化文本输入的关键。
连接设备并验证
使用USB数据线将安卓设备连接到电脑。在电脑终端运行 `adb devices` 命令,如果看到设备序列号并显示‘device’,则表示连接成功。
安装Python依赖
创建一个Python虚拟环境,并使用pip安装项目所需的所有依赖库。
配置服务参数
复制配置文件模板,并根据你的小智MCP服务接入点地址和智谱AI的API密钥(如果使用ChatGLM模型)来修改配置文件。
启动MCP服务
根据你的操作系统,运行对应的启动脚本,启动MCP服务。服务启动后,会等待来自小智AI的指令。

使用案例

案例一:自动化发送微信消息
你想让助手帮你给朋友发一条微信消息。你只需要告诉助手“给李四发微信说‘项目会议改到下午3点’”。
案例二:信息查询与记录
你想查询手机屏幕上显示的某条信息(如快递单号、验证码)并记录下来。
案例三:自动化应用操作流程
你需要每天在某个应用中执行固定的签到、领取奖励等操作。

常见问题

连接设备时,`adb devices` 命令没有显示任何设备,怎么办?
安装ADB Keyboard后,无法输入中文或输入法不生效?
服务运行时提示视觉模型API调用失败或余额不足?
可以同时控制多台安卓设备吗?
支持无线连接(Wi-Fi调试)吗?

相关资源

Open-AutoGLM 开源项目
本项目所基于的安卓自动化开源框架,包含更多技术细节和底层实现。
Android Platform Tools (ADB) 官方下载
Android Debug Bridge (ADB) 命令行工具的官方下载页面。
ADB Keyboard 项目页面
用于实现ADB文本输入的安卓输入法应用源码和APK下载。
小智AI官网
可以接入本MCP服务的AI助手平台。
智谱AI开放平台
提供ChatGLM等视觉语言模型的API服务,用于本项目的屏幕内容理解。

安装

复制以下命令到你的Client进行配置
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

R
Rsdoctor
Rsdoctor 是一款专为 Rspack 生态系统打造的构建分析工具,全面兼容 webpack,提供可视化构建分析、多维度性能诊断及智能优化建议,帮助开发者提升构建效率与工程质量。
TypeScript
5.7K
5分
N
Next Devtools MCP
Next.js开发工具MCP服务器,为Claude、Cursor等AI编程助手提供Next.js开发工具和实用程序,包括运行时诊断、开发自动化和文档访问功能。
TypeScript
6.4K
5分
T
Testkube
Testkube是一个面向云原生应用的测试编排与执行框架,提供统一平台来定义、运行和分析测试,支持现有测试工具和Kubernetes基础设施。
Go
5.2K
5分
M
MCP Windbg
一个MCP服务器,将AI模型与WinDbg/CDB集成,用于分析Windows崩溃转储文件和进行远程调试,支持自然语言交互执行调试命令。
Python
7.7K
5分
R
Runno
Runno是一个JavaScript工具包集合,用于在浏览器和Node.js等环境中安全地运行多种编程语言的代码,通过WebAssembly和WASI实现沙盒化执行,支持Python、Ruby、JavaScript、SQLite、C/C++等语言,并提供Web组件、MCP服务器等集成方式。
TypeScript
6.0K
5分
N
Netdata
Netdata是一个开源实时基础设施监控平台,提供每秒级指标收集、可视化、机器学习驱动的异常检测和自动化告警,无需复杂配置即可实现全栈监控。
Go
6.7K
5分
M
MCP Server
Mapbox MCP服务器是一个Node.js实现的模型上下文协议服务器,为AI应用提供Mapbox地理空间API的访问能力,包括地理编码、兴趣点搜索、路线规划、等时线分析和静态地图生成等功能。
TypeScript
5.7K
4分
U
Uniprof
uniprof是一个简化CPU性能分析的工具,支持多种编程语言和运行时,无需修改代码或添加依赖,可通过Docker容器或主机模式进行一键式性能剖析和热点分析。
TypeScript
7.6K
4.5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
65.1K
4.5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
71.9K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
122.7K
5分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
45.0K
4.5分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
48.0K
5分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
53.9K
4.8分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
28.7K
4.8分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
90.3K
4.7分
AIBase
智启未来,您的人工智能解决方案智库
© 2026AIBase