Xiaozhi Autoglm MCP
X

Xiaozhi Autoglm MCP

基於Open-AutoGLM構建的安卓設備自動化MCP服務,通過ADB連接手機並調用視覺模型,可接入小智AI實現智能控制。
2.5分
6.1K

什麼是小智AutoGLM MCP服務?

小智AutoGLM MCP服務是一個智能安卓設備自動化工具,它允許你通過自然語言指令控制安卓手機或平板電腦。該服務基於先進的視覺語言模型,能夠理解屏幕內容並執行相應的操作,如點擊、滑動、輸入文字等。

如何使用小智AutoGLM MCP服務?

使用本服務需要準備一臺安卓設備(手機或模擬器),通過USB連接到電腦,並完成ADB和ADB Keyboard的配置。配置完成後,啟動MCP服務,即可通過小智AI或私有化部署的小智服務器發送指令來控制設備。

適用場景

本服務特別適合需要自動化操作安卓設備的場景,例如:自動化測試、批量執行重複任務、遠程設備控制、為視力障礙用戶提供輔助操作等。

主要功能

安卓設備自動化控制
通過ADB連接,實現對安卓設備的點擊、滑動、輸入等基礎操作的自動化執行。
視覺語言模型驅動
集成ChatGLM等視覺語言大模型,能夠理解屏幕截圖內容,將自然語言指令轉化為具體的設備操作步驟。
MCP協議接入
遵循Model Context Protocol標準,可以輕鬆接入小智AI平臺或私有化部署的小智服務器,實現遠程調用。
跨平臺支持
提供Linux/macOS和Windows系統的啟動腳本,方便在不同操作系統上部署和運行。
優勢
智能化操作:無需編寫複雜腳本,用自然語言即可控制設備。
易於集成:通過標準MCP協議,可快速接入現有AI助手生態。
開源可定製:基於Open-AutoGLM開源項目構建,可根據需求進行二次開發。
支持真實設備與模擬器:既可用於真機測試,也可用於模擬器自動化。
侷限性
依賴外部模型:視覺理解能力依賴於ChatGLM等第三方API,可能需要付費且受網絡影響。
配置步驟較多:需要安裝ADB、配置設備開發者選項、安裝輸入法等,對新手有一定門檻。
僅支持安卓:目前僅支持Android 7.0及以上版本的設備,不支持iOS或其他系統。
需要USB連接:大部分操作需要通過USB數據線連接設備,限制了完全的無線遠程控制。

如何使用

環境準備:安裝ADB工具
從Android開發者官網下載ADB工具包,解壓到本地目錄,並將該目錄添加到系統的環境變量PATH中,以便在終端中可以直接使用adb命令。
設備準備:啟用開發者選項
在安卓設備上,進入‘設置 > 關於手機’,連續點擊‘版本號’7次以上,直到提示‘您已處於開發者模式’。然後返回設置,進入新出現的‘開發者選項’,開啟‘USB調試’功能。
安裝ADB Keyboard輸入法
在安卓設備上安裝ADB Keyboard APK文件。安裝後,進入‘設置 > 系統 > 語言和輸入法 > 虛擬鍵盤’,啟用‘ADB Keyboard’輸入法。這是實現自動化文本輸入的關鍵。
連接設備並驗證
使用USB數據線將安卓設備連接到電腦。在電腦終端運行 `adb devices` 命令,如果看到設備序列號並顯示‘device’,則表示連接成功。
安裝Python依賴
創建一個Python虛擬環境,並使用pip安裝項目所需的所有依賴庫。
配置服務參數
複製配置文件模板,並根據你的小智MCP服務接入點地址和智譜AI的API密鑰(如果使用ChatGLM模型)來修改配置文件。
啟動MCP服務
根據你的操作系統,運行對應的啟動腳本,啟動MCP服務。服務啟動後,會等待來自小智AI的指令。

使用案例

案例一:自動化發送微信消息
你想讓助手幫你給朋友發一條微信消息。你只需要告訴助手“給李四發微信說‘項目會議改到下午3點’”。
案例二:信息查詢與記錄
你想查詢手機屏幕上顯示的某條信息(如快遞單號、驗證碼)並記錄下來。
案例三:自動化應用操作流程
你需要每天在某個應用中執行固定的簽到、領取獎勵等操作。

常見問題

連接設備時,`adb devices` 命令沒有顯示任何設備,怎麼辦?
安裝ADB Keyboard後,無法輸入中文或輸入法不生效?
服務運行時提示視覺模型API調用失敗或餘額不足?
可以同時控制多臺安卓設備嗎?
支持無線連接(Wi-Fi調試)嗎?

相關資源

Open-AutoGLM 開源項目
本項目所基於的安卓自動化開源框架,包含更多技術細節和底層實現。
Android Platform Tools (ADB) 官方下載
Android Debug Bridge (ADB) 命令行工具的官方下載頁面。
ADB Keyboard 項目頁面
用於實現ADB文本輸入的安卓輸入法應用源碼和APK下載。
小智AI官網
可以接入本MCP服務的AI助手平臺。
智譜AI開放平臺
提供ChatGLM等視覺語言模型的API服務,用於本項目的屏幕內容理解。

安裝

複製以下命令到你的Client進行配置
注意:您的密鑰屬於敏感信息,請勿與任何人分享。

替代品

R
Rsdoctor
Rsdoctor 是一款專為 Rspack 生態系統打造的構建分析工具,全面兼容 webpack,提供可視化構建分析、多維度性能診斷及智能優化建議,幫助開發者提升構建效率與工程質量。
TypeScript
5.7K
5分
N
Next Devtools MCP
Next.js開發工具MCP服務器,為Claude、Cursor等AI編程助手提供Next.js開發工具和實用程序,包括運行時診斷、開發自動化和文檔訪問功能。
TypeScript
7.4K
5分
T
Testkube
Testkube是一個面向雲原生應用的測試編排與執行框架,提供統一平臺來定義、運行和分析測試,支持現有測試工具和Kubernetes基礎設施。
Go
5.1K
5分
M
MCP Windbg
一個MCP服務器,將AI模型與WinDbg/CDB集成,用於分析Windows崩潰轉儲文件和進行遠程調試,支持自然語言交互執行調試命令。
Python
7.5K
5分
R
Runno
Runno是一個JavaScript工具包集合,用於在瀏覽器和Node.js等環境中安全地運行多種編程語言的代碼,通過WebAssembly和WASI實現沙盒化執行,支持Python、Ruby、JavaScript、SQLite、C/C++等語言,並提供Web組件、MCP服務器等集成方式。
TypeScript
5.9K
5分
N
Netdata
Netdata是一個開源即時基礎設施監控平臺,提供每秒級指標收集、可視化、機器學習驅動的異常檢測和自動化告警,無需複雜配置即可實現全棧監控。
Go
6.4K
5分
M
MCP Server
Mapbox MCP服務器是一個Node.js實現的模型上下文協議服務器,為AI應用提供Mapbox地理空間API的訪問能力,包括地理編碼、興趣點搜索、路線規劃、等時線分析和靜態地圖生成等功能。
TypeScript
5.5K
4分
U
Uniprof
uniprof是一個簡化CPU性能分析的工具,支持多種編程語言和運行時,無需修改代碼或添加依賴,可通過Docker容器或主機模式進行一鍵式性能剖析和熱點分析。
TypeScript
6.4K
4.5分
M
Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
25.8K
5分
B
Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
33.6K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
91.9K
5分
S
Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
27.7K
4.5分
M
Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
18.1K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
20.6K
4.8分
C
Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
61.7K
4.7分
N
Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
15.3K
4.5分
AIBase
智啟未來,您的人工智慧解決方案智庫
© 2026AIBase