MCP Browser Use
M

MCP Browser Use

基於MCP協議的AI驅動瀏覽器自動化服務器,支持多模型交互與視覺分析,提供網頁操作與會話保持功能
2分
6.1K

什麼是Browser-Use MCP Server?

Browser-Use MCP Server是一個基於Model Context Protocol (MCP)的智能瀏覽器自動化服務器。它允許用戶通過自然語言指令控制瀏覽器操作,如網頁導航、表單填寫和元素交互,無需編寫代碼。

如何使用Browser-Use MCP Server?

安裝後,您可以通過Claude Desktop等客戶端連接服務器,發送自然語言指令來控制瀏覽器。服務器支持多種AI模型提供商,可根據需要配置。

適用場景

適合自動化網頁測試、數據採集、重複性網頁操作、無障礙瀏覽輔助等場景。特別適合需要智能理解和執行復雜網頁任務的場景。

主要功能

MCP協議集成
完整實現Model Context Protocol,支持AI代理與瀏覽器的智能交互
瀏覽器自動化
支持網頁導航、表單填寫、元素點擊等常見瀏覽器操作
視覺理解
通過截圖分析實現基於視覺的網頁元素識別和交互
多模型支持
支持OpenAI、Anthropic、Azure、DeepSeek等多種AI模型提供商
會話持久化
可保持瀏覽器會話狀態,支持長時間任務執行
優勢
無需編程知識,使用自然語言控制瀏覽器
支持多種主流AI模型,可根據需求靈活切換
可視化交互能力,能理解網頁佈局和內容
會話保持功能,適合多步驟複雜任務
侷限性
需要穩定的網絡連接和API訪問權限
複雜網頁可能需要更精確的指令
部分高級功能需要特定瀏覽器配置

如何使用

安裝準備
確保已安裝Python 3.11+和Chrome/Chromium瀏覽器
配置環境變量
設置API密鑰和瀏覽器參數,如OPENAI_API_KEY等
啟動服務器
通過uv工具運行服務器
連接客戶端
在Claude Desktop等客戶端中配置連接參數

使用案例

網頁數據收集
自動收集指定網頁上的特定數據
表單自動填寫
自動填寫網頁表單並提交
多步驟操作
執行需要多個步驟的網頁任務

常見問題

為什麼我的瀏覽器無法啟動?
如何切換AI模型提供商?
服務器支持哪些瀏覽器?
如何啟用視覺功能?

相關資源

官方文檔
Browser-Use項目的完整文檔
GitHub倉庫
項目源代碼和問題追蹤
MCP協議說明
Model Context Protocol的官方說明
示例配置
各種環境下的配置示例

安裝

複製以下命令到你的Client進行配置
"mcpServers": {
    "browser-use": {
      "command": "uvx",
      "args": [
        "mcp-server-browser-use",
      ],
      "env": {
        "OPENROUTER_API_KEY": "",
        "OPENROUTER_ENDPOINT": "https://openrouter.ai/api/v1",
        "OPENAI_ENDPOINT": "https://api.openai.com/v1",
        "OPENAI_API_KEY": "",
        "ANTHROPIC_ENDPOINT": "https://api.anthropic.com",
        "ANTHROPIC_API_KEY": "",
        "GOOGLE_API_KEY": "",
        "AZURE_OPENAI_ENDPOINT": "",
        "AZURE_OPENAI_API_KEY": "",
        "DEEPSEEK_ENDPOINT": "https://api.deepseek.com",
        "DEEPSEEK_API_KEY": "",
        "MISTRAL_API_KEY": "",
        "MISTRAL_ENDPOINT": "https://api.mistral.ai/v1",
        "OLLAMA_ENDPOINT": "http://localhost:11434",
        "ANONYMIZED_TELEMETRY": "true",
        "BROWSER_USE_LOGGING_LEVEL": "info",
        "CHROME_PATH": "",
        "CHROME_USER_DATA": "",
        "CHROME_DEBUGGING_PORT": "9222",
        "CHROME_DEBUGGING_HOST": "localhost",
        "CHROME_PERSISTENT_SESSION": "false",
        "BROWSER_HEADLESS": "false",
        "BROWSER_DISABLE_SECURITY": "false",
        "BROWSER_WINDOW_WIDTH": "1280",
        "BROWSER_WINDOW_HEIGHT": "720",
        "BROWSER_TRACE_PATH": "trace.json",
        "BROWSER_RECORDING_PATH": "recording.mp4",
        "RESOLUTION": "1920x1080x24",
        "RESOLUTION_WIDTH": "1920",
        "RESOLUTION_HEIGHT": "1080",
        "VNC_PASSWORD": "youvncpassword",
        "MCP_MODEL_PROVIDER": "anthropic",
        "MCP_MODEL_NAME": "claude-3-5-sonnet-20241022",
        "MCP_TEMPERATURE": "0.3",
        "MCP_MAX_STEPS": "30",
        "MCP_USE_VISION": "true",
        "MCP_MAX_ACTIONS_PER_STEP": "5",
        "MCP_TOOL_CALL_IN_CONTENT": "true"
    }
}
注意:您的密鑰屬於敏感信息,請勿與任何人分享。

替代品

K
Klavis
Klavis AI是一個開源項目,提供在Slack、Discord和Web平臺上簡單易用的MCP(模型上下文協議)服務,包括報告生成、YouTube工具、文檔轉換等多種功能,支持非技術用戶和開發者使用AI工作流。
TypeScript
9.2K
5分
D
Devtools Debugger MCP
Node.js調試器MCP服務器,提供基於Chrome DevTools協議的完整調試功能,包括斷點設置、單步執行、變量檢查和表達式評估等
TypeScript
6.4K
4分
M
Mcpjungle
MCPJungle是一個自託管的MCP網關,用於集中管理和代理多個MCP服務器,為AI代理提供統一的工具訪問接口。
Go
0
4.5分
N
Nexus
Nexus是一個AI工具聚合網關,支持連接多個MCP服務器和LLM提供商,通過統一端點提供工具搜索、執行和模型路由功能,支持安全認證和速率限制。
Rust
0
4分
Z
Zen MCP Server
Zen MCP是一個多模型AI協作開發服務器,為Claude和Gemini CLI等AI編碼助手提供增強的工作流工具和跨模型上下文管理。它支持多種AI模型的無縫協作,實現代碼審查、調試、重構等開發任務,並能保持對話上下文在不同工作流間的延續。
Python
16.3K
5分
O
Opendia
OpenDia是一款開源瀏覽器擴展工具,允許AI模型直接控制用戶瀏覽器,利用現有登錄狀態、書籤等數據進行自動化操作,支持多種瀏覽器和AI模型,注重隱私保護。
JavaScript
9.1K
5分
N
Notte Browser
已認證
Notte是一個開源的全棧網絡AI代理框架,提供瀏覽器會話、自動化LLM驅動的代理、網頁觀察與操作、憑證管理等功能,旨在將互聯網轉化為代理友好的環境,並通過自然語言描述網站結構,降低LLM的認知負擔。
14.4K
4.5分
B
Bing Search MCP
一個用於集成微軟Bing搜索API的MCP服務器,支持網頁、新聞和圖片搜索功能,為AI助手提供網絡搜索能力。
Python
12.9K
4分
M
Markdownify MCP
Markdownify是一個多功能文件轉換服務,支持將PDF、圖片、音頻等多種格式及網頁內容轉換為Markdown格式。
TypeScript
19.8K
5分
B
Baidu Map
已認證
百度地圖MCP Server是國內首個兼容MCP協議的地圖服務,提供地理編碼、路線規劃等10個標準化API接口,支持Python和Typescript快速接入,賦能智能體實現地圖相關功能。
Python
27.6K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一個集成Firecrawl網頁抓取能力的模型上下文協議服務器,提供豐富的網頁抓取、搜索和內容提取功能。
TypeScript
66.9K
5分
S
Sequential Thinking MCP Server
一個基於MCP協議的結構化思維服務器,通過定義思考階段幫助分解複雜問題並生成總結
Python
21.0K
4.5分
N
Notion Api MCP
已認證
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Python
13.4K
4.5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一個通過MCP協議快速部署HTML內容到EdgeOne Pages並獲取公開URL的服務
TypeScript
15.4K
4.8分
M
Magic MCP
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
JavaScript
16.5K
5分
C
Context7
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
TypeScript
44.7K
4.7分
AIBase
智啟未來,您的人工智慧解決方案智庫
© 2025AIBase