🚀 OpenDia
OpenDiaは、ブラウザをAIモデルに接続することができるツールです。ブラウザを切り替える必要がなく、Chrome、Firefox、およびChromiumベースのブラウザでシームレスに動作します。プライバシー重視で、ローカルファーストで、MCPに特化しています。

🚀 クイックスタート
1. ブラウザ拡張機能のインストール
Chrome/Chromiumブラウザの場合:
- リリースから
opendia-chrome-1.0.6.zip
をダウンロードします。
- ダウンロードしたzipファイルを任意のフォルダに解凍します。
chrome://extensions/
(またはブラウザの拡張機能ページ)にアクセスします。
- 「デベロッパーモード」を有効にします。
- 「パッケージ化されていない拡張機能を読み込む」をクリックし、解凍したフォルダを選択します。
Firefoxの場合:
- リリースから
opendia-firefox-1.0.6.zip
をダウンロードします。
- ダウンロードしたzipファイルを任意のフォルダに解凍します。
about:debugging#/runtime/this-firefox
にアクセスします。
- 「一時的なアドオンを読み込む...」をクリックします。
- 解凍したフォルダから
manifest.json
ファイルを選択します。
⚠️ 重要提示
Firefoxの拡張機能は一時的なアドオンとして読み込まれ、Firefoxを再起動すると削除されます。これは、署名されていない拡張機能に対するFirefoxの制限です。
2. AIへの接続
オプション1:ダブルクリックでのインストール(推奨)
- リリースから
opendia.dxt
ファイルをダウンロードします。
.dxt
ファイルをダブルクリックして自動的にインストールします。
- MCPがClaude Desktopの設定に追加されます。
オプション2:手動設定
Claude Desktopの設定に以下を追加します。
{
"mcpServers": {
"opendia": {
"command": "npx",
"args": ["opendia"]
}
}
}
Cursorや他のAIツールの場合、同じ設定を使用するか、それぞれの設定手順に従ってください。
✨ 主な機能
🔍 機能概要
OpenDiaは、AIモデルにブラウザを自動制御させることができます。既にログインしているアカウント、保存されたパスワード、クッキー、ウォレット、および閲覧履歴など、既存のすべてのリソースを活用することができます。
🔑 既存のデジタル生活を活用
- ✅ ログイン済みアカウント:既存のセッションを使用して、Twitter/X、LinkedIn、Facebookに投稿できます。
- ✅ ブラウザデータ:ブックマーク、閲覧履歴、および保存されたパスワードにアクセスできます。
- ✅ 拡張機能とウォレット:MetaMask、パスワードマネージャー、またはインストールされた任意の拡張機能を使用できます。
- ✅ クッキーとセッション:お気に入りのサイト全体で認証を維持できます。
- ✅ ローカルテスト:Cursorを使用した開発に最適で、実際のユーザーセッションでテストできます。
✨ 主要な利点
- 🔄 汎用的なAIサポート:Claude、ChatGPT、Cursor、さらにはローカルモデルとも連携します。
- 🎯 検知回避:Twitter/X、LinkedIn、Facebookなどの自動化検知を回避するための特殊な機能があります。
- 📱 スマートな自動化:AIがページを理解し、適切な要素を見つけることができます。
- 🛡️ プライバシー重視:すべてがローカルで実行され、データはユーザーの手元に留まります。
- ⚡ ゼロセットアップ:1つのコマンドですぐに始めることができます。
📦 インストール
ローカルモード(デフォルト)
npx opendia
- Chrome拡張機能: ws://localhost:5555(自動検出機能有効)
- Claude Desktop: stdio(既存の設定)
- ローカルSSE: http://localhost:5556/sse
ポート設定
npx opendia --port=6000
npx opendia --ws-port=5555 --http-port=5556
自動トンネルモード
npx opendia --tunnel
- 自動的にngrokトンネルを作成します。
- ChatGPT/オンラインAIサービス用のURLをコピーできます。
- ローカル機能は維持されます。
⚠️ 重要提示
自動トンネリングを機能させるには、ngrokをインストールする必要があります。
macOS:
brew install ngrok
Windows:
choco install ngrok
Linux:
curl -s https://ngrok-agent.s3.amazonaws.com/ngrok.asc | sudo tee /etc/apt/trusted.gpg.d/ngrok.asc >/dev/null
echo "deb https://ngrok-agent.s3.amazonaws.com buster main" | sudo tee /etc/apt/sources.list.d/ngrok.list
sudo apt update && sudo apt install ngrok
次に、https://dashboard.ngrok.com/get-started/your-authtoken から無料の認証トークンを取得し、以下を実行します。
ngrok config add-authtoken YOUR_TOKEN_HERE
💻 使用例
基本的な使用法
npx opendia
高度な使用法
npx opendia --port=6000
npx opendia --tunnel
📚 ドキュメント
🌐 ブラウザサポート
OpenDiaは、Chrome、Firefox、およびChromiumベースのブラウザで動作します。
- ✅ Google Chrome
- ✅ Arc
- ✅ Mozilla Firefox
- ✅ Microsoft Edge
- ✅ Brave
- ✅ Opera
- ✅ 任意のChromiumベースのブラウザ
また、ローカルテストや開発ワークフローを自動化したいCursorユーザーにも最適です。
🎬 実行可能なこと
📰 コンテンツとソーシャルメディア
- 「今日読んだすべての記事を要約し、重要な洞察についてTwitterスレッドを投稿する」
- 「ブックマークからAIに関連する興味深い記事を見つけ、読書リストを作成する」
- 「この記事を読み、LinkedInのバージョンに思慮深いコメントを投稿する」
- 「最近のTwitterのブックマークを確認し、主要なテーマを要約する」
📧 生産性と研究
- 「最新のメールを閲覧し、緊急に対応する必要があるものを教えてくれる」
- 「今週訪問したすべてのGitHubリポジトリを見つけ、要約レポートを作成する」
- 「この研究論文の要点を抽出し、ノートに保存する」
- 「先月読んだAIセキュリティに関する記事を閲覧履歴から検索する」
🤖 開発とテスト(Cursorに最適!)
- 「Webアプリのサインアップフローをテストし、各ステップでスクリーンショットを撮る」
- 「このフォームにテストデータを入力し、検証が機能するか確認する」
- 「アプリをナビゲートし、すべてのボタンが正常に機能するか確認する」
- 「接続されたウォレットを使用して、このDeFiインターフェースをテストする」
🔄 高度な自動化
- 「毎日のニュースソースすべてのタブを開き、主要な記事を要約する」
- 「未読メッセージに対して、コンテキストに基づいて返信を下書きする」
- 「このWebページを監視し、コンテンツが変更されたら通知する」
- 「読んでいる興味深い記事を自動的にブックマークする」
🎨 ビジュアルカスタマイズと楽しみ
- 「このドキュメントサイトにサイバーパンクテーマを適用し、もっと魅力的にする」
- 「このページをダークモードにし、緑色のテキストにして夜読みに最適なものにする」
- 「このプロジェクトの完了を祝って、レインボーパーティエフェクトを追加する」
- 「この退屈なフォームを80年代のレトロテーマで変えながら、入力する」
- 「高コントラストのスタイリングを使用して、読みやすくする」
💬 試してみるべき例題プロンプト
すべてのセットアップが完了したら、AIに以下のような質問を試してみてください。
コンテンツ作成:
「このページの記事を読み、主要なポイントを要約するTwitterスレッドを作成する」
研究と分析:
「今週のブラウザ履歴を調べ、機械学習に関する記事を見つける。主要なトレンドを要約する。」
ソーシャルメディア管理:
「Twitterのブックマークを確認し、カテゴリに分類する。各カテゴリの要約を作成する。」
生産性:
「通常の朝の読書サイトのタブを開き、今日の主要な記事のブリーフィングを提供する」
開発テスト:
「この問い合わせフォームにテストデータを入力し、送信が正常に機能するか確認する」
パーソナルアシスタント:
「昨日見ていたReactコンポーネントに関するGitHubリポジトリを見つけ、後で参照できるようにブックマークする」
ページスタイリングと楽しみ:
「このページにダークハッカーテーマを適用し、もっと面白く見せる」
「この退屈なドキュメントページを居心地の良いカフェのような雰囲気にする」
「このページに30秒間マトリックスの雨のエフェクトを追加し、クールなスクリーンショットを撮る」
「このページを高コントラストテーマで変えて、読みやすくする」
🔧 技術詳細
📺 動作の様子

🏗️ 動作原理
graph LR
A[AI Model] --> B[OpenDia Server]
B --> C[Browser Extension]
C --> D[Your Browser]
D --> E[Any Website]
- あなたがAIにブラウザ関連の何かを依頼します。
- AIがOpenDiaのツールを呼び出して、ページを理解し、インタラクションします。
- OpenDiaが拡張機能を介してあなたのブラウザを制御します。
- あなたが結果を得ます - AIは何が起こったかを把握し、賢く応答することができます。
🛠️ 機能
OpenDiaは、AIモデルに18の強力なブラウザツールを提供します。
🎯 スマートなページ理解
- 任意のWebページを分析 - AIが自動的にボタン、フォーム、およびインタラクティブな要素を見つけます。
- コンテンツをインテリジェントに抽出 - 記事、ソーシャルポスト、または検索結果からクリーンなテキストを取得します。
- コンテキストを理解 - AIが見ているページのタイプを把握し、それとインタラクションする方法を理解します。
🖱️ 自然なインタラクション
- 任意のものをクリック - ボタン、リンク、メニュー - AIが正しい要素を見つけてクリックします。
- スマートにフォームを入力 - Twitter、LinkedIn、Facebookなどの複雑なサイトでも機能します。
- シームレスにナビゲート - ページに移動し、スクロールし、コンテンツの読み込みを待ちます。
- 最新のWebアプリを扱う - ソーシャルプラットフォームの検知を回避します。
📑 タブとウィンドウ管理
- マルチタブワークフロー - 自動的にタブを開き、閉じ、切り替えます。
- ワークスペースを整理 - AIがブラウザタブを効率的に管理します。
- 複雑なタスクを調整 - 複数のサイトで同時に作業します。
📊 ブラウザデータへのアクセス
- ブックマークと履歴 - 先週読んだ記事を見つけます。
- 現在のページコンテンツ - 選択されたテキスト、リンク、または全ページコンテンツを取得します。
- リアルタイム情報 - 現在画面に表示されているもので作業します。
🛡️ 検知回避機能
- ソーシャルメディア投稿 - Twitter/X、LinkedIn、Facebookの自動化検知を回避します。
- 自然なインタラクション - 人間の行動を模倣して、セキュリティ対策をトリガーしないようにします。
- 信頼性の高い自動化 - 通常の自動化ツールをブロックするサイトでも一貫して機能します。
🎨 ページスタイリングとカスタマイズ
- 任意のWebサイトを変える - 面白いテーマ、カスタムカラー、およびビジュアルエフェクトを適用します。
- プリセットテーマ - ダークハッカー、80年代のレトロ、レインボーパーティ、ミニマリストな禅など。
- AIムードスタイリング - ムードを説明すると、一致するビジュアルデザインを取得します。
- インタラクティブエフェクト - マトリックスの雨、浮遊粒子、ネオングロー、およびカーソルの軌跡。
- アクセシビリティテーマ - 高コントラストで読みやすいデザインで、視認性を向上させます。
📄 ライセンス
このプロジェクトはMITライセンスの下で公開されています。詳細はLICENSEを参照してください。
AIでブラウザを強化したいですか? npx opendia
で始めましょう! 🚀