🚀 OpenDia
OpenDia 是 Dia / Perplexity Comet 的開源替代方案,它可以將你的瀏覽器與 AI 模型連接起來。無需切換瀏覽器,它能與 Chrome、Firefox 以及任何基於 Chromium 的瀏覽器無縫協作。注重隱私,以本地優先,聚焦多命令處理器(MCP)。
如果你並非技術人員,或者從未使用過多命令處理器(MCP),我們建議你使用 Perplexity Comet。

🚀 快速開始
1. 安裝瀏覽器擴展
對於 Chrome/Chromium 瀏覽器:
- 從 releases 下載
opendia-chrome-1.0.6.zip
文件。
- 將壓縮文件解壓到一個文件夾中。
- 訪問
chrome://extensions/
(或你瀏覽器的擴展頁面)。
- 啟用“開發者模式”。
- 點擊“加載已解壓的擴展程序”,並選擇解壓後的文件夾。
對於 Firefox 瀏覽器:
- 從 releases 下載
opendia-firefox-1.0.6.zip
文件。
- 將壓縮文件解壓到一個文件夾中。
- 訪問
about:debugging#/runtime/this-firefox
。
- 點擊“加載臨時附加組件...”。
- 選擇解壓文件夾中的
manifest.json
文件。
⚠️ 重要提示
Firefox 擴展是以臨時附加組件的形式加載的,當 Firefox 重啟時,擴展將會被移除。這是 Firefox 對未簽名擴展的限制。
2. 連接到你的 AI
選項 1:雙擊安裝(推薦)
- 從 releases 下載
opendia.dxt
文件。
- 雙擊
.dxt
文件進行自動安裝。
- MCP 將被添加到你的 Claude Desktop 配置中。
選項 2:手動配置
在你的 Claude Desktop 配置中添加以下內容:
{
"mcpServers": {
"opendia": {
"command": "npx",
"args": ["opendia"]
}
}
}
對於 Cursor 或其他 AI 工具,請使用相同的配置,或遵循它們的特定設置說明。
✨ 主要特性
- 通用 AI 支持:可與 Claude、ChatGPT、Cursor 甚至本地模型協同工作。
- 反檢測功能:針對 Twitter/X、LinkedIn、Facebook 等平臺,有專門的繞過檢測機制。
- 智能自動化:AI 能夠理解網頁內容,並找到合適的元素進行交互。
- 隱私優先:所有操作都在本地運行,你的數據始終掌握在自己手中。
- 零設置:只需一個命令即可開始使用。
📦 安裝指南
本地模式(默認)
npx opendia
- Chrome 擴展:ws://localhost:5555(啟用自動發現)
- Claude Desktop:stdio(現有配置)
- 本地 SSE:http://localhost:5556/sse
端口配置
npx opendia --port=6000
npx opendia --ws-port=5555 --http-port=5556
自動隧道模式
npx opendia --tunnel
- 自動創建 ngrok 隧道。
- 複製 URL 用於 ChatGPT/在線 AI 服務。
- 保留本地功能。
⚠️ 重要提示
要使用自動隧道功能,你需要安裝 ngrok:
macOS:
brew install ngrok
Windows:
choco install ngrok
Linux:
curl -s https://ngrok-agent.s3.amazonaws.com/ngrok.asc | sudo tee /etc/apt/trusted.gpg.d/ngrok.asc >/dev/null
echo "deb https://ngrok-agent.s3.amazonaws.com buster main" | sudo tee /etc/apt/sources.list.d/ngrok.list
sudo apt update && sudo apt install ngrok
然後從 https://dashboard.ngrok.com/get-started/your-authtoken 獲取你的免費認證令牌,並運行以下命令:
ngrok config add-authtoken YOUR_TOKEN_HERE
💻 使用示例
基礎用法
npx opendia
高級用法
npx opendia --port=6000
npx opendia --tunnel
📚 詳細文檔
📺 查看實際運行效果

🚀 什麼是 OpenDia?
OpenDia 可以讓 AI 模型自動控制你的瀏覽器。其關鍵優勢在於,它可以利用你現有的一切 —— 你已登錄的賬戶、保存的密碼、cookie、錢包以及瀏覽歷史。無需從頭開始或切換上下文。
🔑 使用你現有的數字生活:
- ✅ 已登錄的賬戶:使用你現有的會話在 Twitter/X、LinkedIn、Facebook 上發佈內容。
- ✅ 瀏覽器數據:訪問你的書籤、歷史記錄和保存的密碼。
- ✅ 擴展程序和錢包:使用 MetaMask、密碼管理器或任何已安裝的擴展程序。
- ✅ Cookie 和會話:在你喜歡的所有網站上保持認證狀態。
- ✅ 本地測試:非常適合使用 Cursor 進行開發 —— 使用真實用戶會話進行測試。
🌐 瀏覽器支持
OpenDia 可與 Chrome、Firefox 以及任何基於 Chromium 的瀏覽器 兼容:
- ✅ Google Chrome
- ✅ Arc
- ✅ Mozilla Firefox
- ✅ Microsoft Edge
- ✅ Brave
- ✅ Opera
- ✅ 任何基於 Chromium 的瀏覽器
對於想要自動化本地測試和開發工作流程的 Cursor 用戶 來說,它也是一個絕佳選擇!
🎬 你可以做什麼
你今天就可以嘗試的實際工作流程:
📰 內容與社交媒體
- “總結我今天閱讀的所有文章,併發布一條 Twitter 線程,分享關鍵見解”
- “從我的書籤中找到與 AI 相關的有趣文章,並創建一個閱讀列表”
- “閱讀這篇文章,並在 LinkedIn 版本上發表一條有深度的評論”
- “查看我最近的 Twitter 書籤,並總結主要主題”
📧 生產力與研究
- “瀏覽我最新的電子郵件,告訴我哪些需要緊急關注”
- “找出我本週訪問過的所有 GitHub 倉庫,並創建一份總結報告”
- “提取這篇研究論文的要點,並保存到我的筆記中”
- “在我的瀏覽歷史中搜索我上個月閱讀的那篇關於 AI 安全的文章”
🤖 開發與測試(非常適合 Cursor!)
- “測試我的 Web 應用的註冊流程,並在每個步驟截取屏幕截圖”
- “用測試數據填寫此表單,並檢查驗證是否有效”
- “瀏覽我的應用,檢查所有按鈕是否正常工作”
- “使用我連接的錢包測試此 DeFi 界面”
🔄 高級自動化
- “為我所有的每日新聞來源打開標籤頁,並總結頭條新聞”
- “根據上下文為我的未讀消息起草回覆”
- “監控此網頁,當內容更改時通知我”
- “自動為我正在閱讀的有趣文章添加書籤”
🎨 視覺定製與樂趣
- “為這個文檔網站應用賽博朋克主題,使其更具吸引力”
- “將此頁面設置為夜間模式,文字為綠色,方便夜間閱讀”
- “添加彩虹派對效果,慶祝完成這個項目”
- “在我填寫這個無聊的表單時,為其應用復古 80 年代主題”
- “使用高對比度樣式,以便我能更好地閱讀”
💬 可以嘗試的示例提示
一切設置完成後,你可以嘗試向你的 AI 提問:
內容創作:
“閱讀此頁面上的文章,並創建一條 Twitter 線程,總結主要觀點”
研究與分析:
“查看我本週的瀏覽器歷史記錄,找到關於機器學習的文章。總結關鍵趨勢。”
社交媒體管理:
“檢查我的 Twitter 書籤,並將它們分類。為每個類別創建一個總結。”
生產力:
“為我平時早上閱讀的網站打開標籤頁,並給我今天頭條新聞的簡報”
開發測試:
“用測試數據填寫此聯繫表單,並檢查提交是否正常工作”
個人助理:
“找到我昨天查看的關於 React 組件的 GitHub 倉庫,並將其添加到書籤以便以後查看”
頁面樣式與樂趣:
“為這個頁面應用黑暗黑客主題,使其看起來更有趣”
“讓這個無聊的文檔頁面感覺像一個舒適的咖啡店”
“為這個頁面添加 30 秒的矩陣雨效果,以便截取酷炫的屏幕截圖”
“為這個頁面應用高對比度主題,以提高可讀性”
🏗️ 工作原理
graph LR
A[AI 模型] --> B[OpenDia 服務器]
B --> C[瀏覽器擴展]
C --> D[你的瀏覽器]
D --> E[任何網站]
- 你向 你的 AI 提出與瀏覽器相關的請求。
- AI 調用 OpenDia 工具來理解和與頁面進行交互。
- OpenDia 通過 擴展程序控制你的瀏覽器。
- 你獲得結果 —— AI 可以看到發生了什麼,並做出智能響應。
🛠️ 功能
OpenDia 為 AI 模型提供了 18 種強大的瀏覽器工具:
🎯 智能頁面理解
- 分析任何網頁 —— AI 自動找到按鈕、表單和交互式元素。
- 智能提取內容 —— 從文章、社交媒體帖子或搜索結果中獲取清晰的文本。
- 理解上下文 —— AI 知道它正在查看的頁面類型以及如何與之交互。
🖱️ 自然交互
- 點擊任何元素 —— 按鈕、鏈接、菜單 —— AI 找到並點擊正確的元素。
- 智能填寫表單 —— 即使在 Twitter、LinkedIn、Facebook 等複雜網站上也能正常工作。
- 無縫導航 —— 前往頁面、滾動、等待內容加載。
- 處理現代 Web 應用 —— 繞過社交平臺的檢測。
📑 標籤和窗口管理
- 多標籤工作流程 —— 自動打開、關閉和切換標籤。
- 組織你的工作空間 —— 讓 AI 高效管理你的瀏覽器標籤。
- 協調複雜任務 —— 同時在多個網站上工作。
📊 訪問你的瀏覽器數據
- 書籤和歷史記錄 —— 找到你上週閱讀的文章。
- 當前頁面內容 —— 獲取選定的文本、鏈接或完整頁面內容。
- 實時信息 —— 處理當前屏幕上的任何內容。
🛡️ 反檢測功能
- 社交媒體發佈 —— 繞過 Twitter/X、LinkedIn、Facebook 等平臺的自動化檢測。
- 自然交互 —— 模仿人類行為,避免觸發安全措施。
- 可靠的自動化 —— 即使在阻止典型自動化工具的網站上也能持續工作。
🎨 頁面樣式與定製
- 轉換任何網站 —— 應用有趣的主題、自定義顏色和視覺效果。
- 預設主題 —— 黑暗黑客、復古 80 年代、彩虹派對、簡約禪意等等。
- AI 情緒樣式 —— 描述一種情緒,獲得匹配的視覺設計。
- 交互式效果 —— 矩陣雨、浮動粒子、霓虹燈效果和光標軌跡。
- 無障礙主題 —— 高對比度和易讀的設計,提高可見性。
🔧 技術細節
OpenDia 為 AI 模型提供了與瀏覽器交互的能力,它通過瀏覽器擴展和本地服務器實現。瀏覽器擴展負責與瀏覽器進行交互,而本地服務器則負責接收 AI 模型的請求,並將其轉換為瀏覽器可以理解的操作。這種架構使得 AI 模型可以利用用戶現有的瀏覽器環境,實現各種自動化任務。
📄 許可證
本項目採用 MIT 許可證,詳情請參閱 LICENSE 文件。
準備好讓 AI 為你的瀏覽器賦能了嗎?使用 npx opendia
開始吧!🚀