🚀 Lyra Intel
大規模コードベース分析のための完全なインテリジェンスインフラストラクチャエンジン
Complete Intelligence Infrastructure Engine for Massive-Scale Codebase Analysis

📚 Full Documentation | Quick Start | Use Cases | API Reference
AIによる洞察、セキュリティスキャン、セマンティック検索を活用して、コードベースの分析を10~100倍高速化します。
🚀 クイックスタート
数回のコマンドですぐに始めることができます。複雑なセットアップは必要ありません。
git clone https://github.com/nirholas/lyra-intel.git
cd lyra-intel
pip install -e .
python cli.py scan /path/to/any/code
python cli.py analyze /path/to/code --output ./results.json
cat results.json | jq .
python launch_dashboard.py
期待される結果
scanを実行した後、次のような出力が表示されます。
✅ Analyzing repository...
📊 Files analyzed: 156
📈 Total functions: 1,247
⚠️ Issues found: 43
🔐 Security findings: 5
analyzeを実行すると、次のような詳細なJSONが生成されます。
- Metrics: 行数、複雑度、テストカバレッジ
- Security: 脆弱性、シークレットの検出
- Dependencies: インポート関係、循環依存
- Patterns: コードの悪い習慣、アンチパターン
- Git history: コミット統計、貢献者
詳細なクイックサンプルを見る →
✨ 主な機能
Lyra Intelには、機能別に整理された70以上の専用コンポーネントが含まれています。
すべての機能を表示 (70以上のコンポーネント)
コア分析 - コードを理解する
- 📁 File Crawler - メモリ効率のためのストリーミングを備えた並列ディレクトリトラバーサル。メモリ問題なしで数百万のファイルを処理します。
- 📜 Git Collector - 完全なコミット履歴、責任分析、貢献者統計。誰がいつ何を変更したかを理解します。
- 🔍 AST Analyzer - 多言語構文木解析 (Python、JS/TS、Go、Rust、Java、C++、C#、Ruby、PHP)。正確なコード構造を取得します。
- 🔗 Dependency Mapper - 循環検出を備えた完全な依存関係グラフを構築します。アーキテクチャを理解します。
- ⚠️ Pattern Detector - コードの悪い習慣、アンチパターン、セキュリティ問題を見つけます。問題が深刻化する前に検出します。
スケーラビリティ - ノートPCからエンタープライズまで
- 🖥️ Local Mode - 開発用の単一マシン分析。セットアップ不要、すぐにマシン上で実行します。
- 🌐 Distributed Mode - より大きなコードベース用のマルチワーカー処理。10万ファイル以上の分析を効率的にスケールさせます。
- ☁️ Cloud Massive Mode - 自動スケーリングのクラウドインフラストラクチャ (AWS、GCP、Azure)。数百万のファイルを持つモノレポを分析します。
ストレージオプション - あらゆる規模に柔軟対応
- SQLite - ローカル開発と小規模プロジェクト。組み込み、依存関係なし。
- PostgreSQL - 本番環境のデプロイ。信頼性が高く、実績があり、スケーラブルです。
- BigQuery - 大規模な分析。100万以上の分析結果を瞬時にクエリします。
- Cache Layer - メモリ、ファイル、RedisバックエンドでTTL/LRUエビクションをサポート。繰り返しの分析を高速化します。
🔐 セキュリティ - 脆弱性が問題になる前に見つける
- Security Scanner - OWASP Top 10、ハードコードされたシークレット、SQLインジェクションの検出。50以上の脆弱性パターンをスキャンします。
- Vulnerability Database - 既知のCVEとアドバイザリを追跡します。新たな脅威に常に対応します。
- Custom Rules - カスタムセキュリティパターンを定義します。組織のセキュリティ標準を強制します。
🤖 AI統合 - より賢い洞察を得る
- AI Analyzer - コードの説明、バグ検出、リファクタリングの提案。複雑なコードをすぐに理解します。
- Multiple Providers - OpenAI (GPT-4/3.5)、Anthropic (Claude)、またはローカル (Ollama/llama.cpp)。ワークフローに合ったものを選択します。
- Cost Effective - 無料の分析用にローカルモデル、最大の精度を得るためにクラウドモデル。
📊 可視化とレポート - 結果を伝える
- Graph Generator - D3.js、Mermaid、Graphviz DOTにエクスポートします。依存関係とアーキテクチャを可視化します。
- Report Generator - エグゼクティブ、テクニカル、セキュリティ、アーキテクチャレポート。異なる対象者に向けた異なるレポート。
- Web Dashboard - インタラクティブなD3.js/Cytoscape可視化。コードベースを視覚的に探索します。
🌐 APIとエンタープライズ機能
- REST API Server - 統合用の15以上のエンドポイント。Lyra Intelの上に構築します。
- Authentication - APIキー、JWT、OAuth 2.0 (SSO)、LDAPサポート。セキュアなアクセス制御。
- RBAC - ロールベースのアクセス制御。チーム全体の権限を管理します。
- Rate Limiting - インフラストラクチャを保護します。安全にスケールします。
🔬 法医学的分析 - 隠れた問題を見つける
- Forensic Analyzer - コードとドキュメントの双方向マッピング。ドキュメントの欠落を自動的に見つけます。
- Dead Code Detector - 未使用の関数、クラス、インポートを見つけます。コードベースをクリーンアップします。
- Complexity Analyzer - 循環的、認知的、ハルステッドメトリクス。問題のあるコードを特定します。
📋 その他の機能
- Code Generation - カスタムテンプレートを使用したAIによる関数/クラス/API生成
- Diff & Impact Analysis - 何が変更されたか、そしてそれが何を意味するかを理解します
- Migration Planning - フレームワーク/バージョンのアップグレードを段階的にガイドします
- Code Profiling - N+1クエリ、ブロッキングI/O、非効率なアルゴリズムを検出します
- Schema Analysis - ORMモデルからのデータベーススキーマ分析
- Documentation Generator - APIドキュメントと変更履歴を自動生成します
- Workflow Engine - 多段階の分析パイプラインを定義して実行します
🔍 自動検出パイプライン (新機能)
- GitHub Scanner - GitHubから新しいMCP暗号ツールを自動的に検出します
- AI Tool Analyzer - AI/パターンマッチングを使用してツール定義を抽出します
- Security Scanner - 検出されたツールの脆弱性をスキャンします
- Registry Submitter - 承認されたツールをLyraレジストリに提出します
- Daily Automation - 継続的な検出のためのGitHub Actionsワークフロー
検出ドキュメントを見る →
📦 インストール
前提条件
インストール手順
git clone https://github.com/nirholas/lyra-intel.git
cd lyra-intel
pip install -e .
💻 使用例
基本的な使用法
python cli.py scan /path/to/any/code
python cli.py analyze /path/to/code --output ./results.json
高度な使用法
python cli.py analyze /path/to/code --output ./results.json --option1 value1 --option2 value2
📚 ドキュメント
Lyra Intelには、プラットフォームのあらゆる側面をカバーする包括的なドキュメントが含まれています。
コアドキュメント
-
📖 FEATURES.md - 詳細な機能ドキュメントとコードサンプル:
- セマンティック検索 (MLによるコード検索)
- SSO統合 (OAuth 2.0、SAML 2.0、LDAP)
- 言語パーサー (C++、C#、Ruby、PHP)
- プラグインシステム
- IDE拡張機能 (VS Code、JetBrains)
- CI/CD統合 (GitLab、Bitbucket、GitHub Actions)
- エクスポート形式 (PDF、SARIF、Excel、CSV)
- WebSocketストリーミング
- インタラクティブCLI
- Webダッシュボード
- モニタリングとメトリクス (Prometheus、Grafana)
-
💻 EXAMPLES.md - 実際のコードサンプル:
- クイックスタート (60秒での分析)
- コア分析ワークフロー
- セマンティック検索の使用
- SSOのセットアップと構成
- 言語固有のパーシング
- カスタムプラグインの開発
- IDE拡張機能のインストール
- CI/CDパイプラインの統合
- リアルタイムWebSocketストリーミング
- モニタリングのセットアップ
- 完全なエンドツーエンドワークフロー
-
🏗️ ARCHITECTURE.md - 技術的なアーキテクチャドキュメント:
- システムの概要と設計
- コアコンポーネントのアーキテクチャ
- データフロー図
- モジュールの組織
- 拡張ポイント
- デプロイメントアーキテクチャ (単一サーバー、Kubernetes、AWS)
- パフォーマンスとスケーラビリティ
- セキュリティアーキテクチャ
- 技術スタック
-
🔌 API.md - 完全なREST APIリファレンス
-
🚀 DEPLOYMENT.md - デプロイメントガイド (Docker、Kubernetes、AWS)
-
📜 openapi.yaml - OpenAPI 3.0仕様
実践的なワークフロー
- 💼 USE_CASES.md - 実践的なワークフローとベストプラクティス:
- レガシーコードベースのセキュリティ対策
- コミット前のコード品質ゲート
- CI/CDセキュリティパイプライン
- コードレビューの支援
- モノレポの移行計画
- 技術的負債の追跡
- チームの知識ベースの構築
- 統合パターン
- パフォーマンス最適化のヒント
始めるためのガイド
- ⚡ QUICKSTART.md - 5分で起動して実行する
- 🔧 INSTALL.md - インストール手順
- 📚 TUTORIAL.md - 一般的なユースケースのステップバイステップチュートリアル:
- 最初の分析
- セキュリティ監査
- セマンティック検索のセットアップ
- CI/CD統合
- カスタムプラグインの開発
- 本番環境のデプロイ
- リアルタイムダッシュボード
- ❓ FAQ.md - よくある質問
- 🤝 CONTRIBUTING.md - 貢献ガイドライン
💼 一般的なユースケース
実際のチームがLyra Intelを使用しています。
🔒 セキュリティチーム
「私たちの50万行のコードベースを脆弱性についてスキャンする必要があります」
- レガシーコードベースのセキュリティ対策 - 30分で完全な監査
- 自動化されたCI/CDセキュリティゲート
- セキュアでないコードをブロックするコミット前フック
- 定期的なスケジュールされたセキュリティスキャン
👨💻 開発チーム
「新しい開発者が加入する - 20万行のコードベースで彼らをオンボードするにはどうすればいいですか?」
- チームの知識ベースを構築する - コードベース全体でセマンティック検索
- 似たようなコードパターンを見つける
- 可視化を通じてアーキテクチャを理解する
- 技術的負債を追跡する
🏗️ プラットフォームチーム
「Node 14からNode 18にアップグレードする必要があります - 安全ですか?」
- モノレポの移行計画を立てる - 段階的な移行計画
- すべてのパッケージに対する影響を分析する
- 破壊的な変更を特定する
- パッケージごとの作業量を見積もる
📊 エンジニアリングリーダー
「私たちのコード品質は改善しているのか、それとも悪化しているのか?」
- 技術的負債を追跡する - 月次のトレンド追跡
- 時間の経過に伴うメトリクスを可視化する
- 最初に修正するものを優先順位付けする
- データ駆動型のレポートを管理層に提示する
🔍 コードレビュー
「レビューに時間がかかりすぎています - PRごとに30分」
詳細なユースケースを見る →
🤖 MCP統合 (Claude & LLMs)
Claude、Claude Code、またはMCP互換のLLMから直接Lyra Intelを使用できます。
クイックセットアップ
npx lyra-intel-mcp
{
"mcpServers": {
"lyra-intel": {
"command": "npx",
"args": ["-y", "lyra-intel-mcp"]
}
}
}
利用可能なMCPツール
| ツール |
説明 |
analyze-codebase |
AST、依存関係、メトリクスを用いた包括的なコード分析 |
search-code |
MLによるセマンティックコード検索 |
get-complexity |
循環的、認知的、ハルステッドの複雑度 |
get-security-issues |
セキュリティ脆弱性、シークレット、コンプライアンス |
discovery-scan-github |
GitHub上の新しいMCP暗号ツールを見つける |
discovery-analyze-repo |
リポジトリからMCPツール定義を抽出する |
discovery-run-pipeline |
完全な検出 + 分析 + 提出 |
サンプルプロンプト
"~/code/myappのプロジェクトをセキュリティ問題について分析してください"
"コードベース内の認証パターンを検索してください"
"過去7日間の新しいMCP暗号ツールをGitHubでスキャンしてください"
"検出パイプラインを実行し、承認されたツールを提出してください"
完全なMCPドキュメントを見る →
🏛️ アーキテクチャ
lyra-intel/
├── src/
│ ├── core/ # メインエンジンのオーケストレーション
│ ├── collectors/ # データ収集 (ファイル、git)
│ ├── analyzers/ # コード分析 (AST、依存関係、パターン)
│ ├── storage/ # データベースと永続化
│ ├── agents/ # マルチエージェントシステム
│ ├── search/ # コードとセマンティック検索
│ ├── query/ # 自然言語クエリ
│ ├── visualizers/ # グラフ生成
│ ├── reports/ # レポート生成
│ ├── web/ # Webダッシュボード
│ ├── api/ # REST APIサーバー
│ ├── auth/ # 認証と承認
│ ├── plugins/ # プラグインシステム
│ ├── ai/ # AI統合
│ ├── metrics/ # メトリクス収集
│ ├── events/ # イベントシステム
│ ├── notifications/ # 通知とアラート
│ ├── forensics/ # 法医学的分析
│ ├── cache/ # キャッシュ層
│ ├── pipeline/ # ストリーミングパイプライン
│ ├── testing/ # テストインフラストラクチャ
│ ├── knowledge/ # 知識グラフシステム
│ ├── diff/ # 差分と影響分析
│ ├── generation/ # コード生成
│ ├── security/ # セキュリティスキャン
│ ├── migration/ # 移行計画
│ ├── profiler/ # パフォーマンスプロファイリング
│ ├── schema/ # スキーマ分析
│ ├── docgen/ # ドキュメント生成
│ ├── integrations/ # 外部統合
│ └── workflow/ # ワークフローエンジン
├── config/ # 設定ファイル
├── scripts/ # ユーティリティスクリプト
├── Dockerfile # コンテナビルド
├── docker-compose.yml # マルチサービスデプロイメント
└── cli.py # コマンドラインインターフェース
処理モード
ローカルモード
開発と小規模リポジトリに最適です。
from src import LyraIntelEngine, EngineConfig, ProcessingMode
config = EngineConfig(mode=ProcessingMode.LOCAL, max_workers=8)
engine = LyraIntelEngine(config)
result = await engine.analyze_repository("/path/to/repo")
分散モード
複数のワーカーを使用するより大きなコードベースに適しています。
config = EngineConfig(
mode=ProcessingMode.DISTRIBUTED,
max_workers=50,
)
クラウド大規模モード
エンタープライズ規模の分析に適しています。
config = EngineConfig(
mode=ProcessingMode.CLOUD_MASSIVE,
cloud_provider="aws",
cloud_region="us-east-1",
max_cloud_workers=1000,
)
分析結果
エンジンは、次のような包括的な分析を行います。
- ファイルメトリクス: 総ファイル数、サイズ、拡張子別の行数
- コード構造: 関数、クラス、メソッドとその複雑度スコア
- 依存関係: インポート/エクスポート関係、循環依存
- Git履歴: コミット、作者、変更頻度
- パターン: コードの悪い習慣、アンチパターン、セキュリティ問題
結果はSQLite (または構成されたバックエンド) に保存され、JSONとしてエクスポートできます。
クラウドサポート
Lyra Intelは、クラウドリソースを効率的に活用するように設計されています。
| プロバイダ |
インスタンスタイプ |
スポットサポート |
最適化 |
| AWS |
EC2、Lambda、ECS |
✅ サポート |
~70%の節約 |
| GCP |
Compute Engine、Cloud Run |
✅ サポート |
~70%の節約 |
| Azure |
VMs、Functions |
✅ サポート |
~70%の節約 |
自動スケーリングとコスト最適化機能が含まれています。
Lyra Intelの比較
| 機能 |
Lyra Intel |
SonarQube |
Snyk |
GitHub Advanced Security |
| オープンソース |
✅ MIT |
❌ 商用 |
❌ 独自 |
⚠️ 制限あり |
| セマンティックコード検索 |
✅ MLベース |
❌ なし |
❌ なし |
❌ なし |
| AI統合 |
✅ 任意のプロバイダ |
❌ なし |
❌ なし |
✅ GitHub Copilotのみ |
| モノレポサポート |
✅ 最大100万ファイル |
⚠️ 制限あり |
✅ 良好 |
✅ 良好 |
| セルフホスト |
✅ 完全 |
⚠️ エンタープライズのみ |
⚠️ 制限あり |
✅ GitHubホスト |
| コスト |
✅ 無料 |
💰💰💰 |
💰💰 |
💰 |
| 知識グラフ |
✅ 自動 |
❌ なし |
❌ なし |
❌ なし |
| 法医学的分析 |
✅ 未使用コード、負債 |
⚠️ 基本 |
❌ なし |
⚠️ 基本 |
| 移行計画 |
✅ 自動化された手順 |
❌ なし |
❌ なし |
❌ なし |
| 多言語対応 |
✅ 10以上の言語 |
✅ 多くの言語 |
⚠️ JS/Python中心 |
✅ 多くの言語 |
| リアルタイムダッシュボード |
✅ React UI |
✅ あり |
✅ あり |
✅ あり |
要約: Lyra Intelは、深いコード理解 + AI洞察 + 完全なコントロールを求めるチームに最適で、すべてオープンソースです。
🛣️ ロードマップ
✅ フェーズ1: コアプラットフォーム (完了)
- 70以上のコンポーネントを備えた完全な分析エンジン
- 多言語パーシング (10以上の言語)
- 依存関係グラフとパターン検出
- Git履歴分析と法医学的分析
- セキュリティスキャン (50以上のパターン)
- AI統合 (OpenAI、Anthropic、Ollama)
✅ フェーズ2: エンタープライズ機能 (完了)
- 15以上のエンドポイントを備えたREST API
- インタラクティブな可視化を備えたWebダッシュボード
- 知識グラフとセマンティック検索
- RBAC、SSO、および認証
- コード生成と移行計画
- IDEプラグイン (VS Code、JetBrains)
✅ フェーズ3: スケールとパフォーマンス (完了)
- 10万ファイル以上の分散分析
- クラウド大規模モード (AWS/GCP/Azureの自動スケーリング)
- リアルタイムストリーミング分析
- MLベースのコードレビュー
- パフォーマンスプロファイリングと最適化
- スキーマ分析とワークフローエンジン
🔄 フェーズ4: 高度な機能 (進行中)
- コード理解のための強化されたMLモデル
- カスタムモデルの微調整
- 高度なコンプライアンスレポート
- リアルタイムダッシュボードの改善
- パフォーマンスベンチマークスイート
📅 将来のフェーズ
- 自動的な修復提案
- より多くのCI/CDプラットフォームとの統合
- ダッシュボードアクセス用のモバイルアプリ
- 高度な可視化オプション
- コミュニティプラグインマーケットプレイス
📈 メトリクスとモニタリング
次の場所でメトリクスにアクセスできます。
- Prometheus:
http://localhost:9090
- Grafana:
http://localhost:3000
- APIのヘルスチェック:
http://localhost:8080/api/v1/health
主要なメトリクス:
lyra_intel_requests_total - 総APIリクエスト数
lyra_intel_analysis_duration_seconds - 分析パフォーマンス
lyra_intel_ai_tokens_total - AIの使用量追跡
lyra_intel_cache_hits_total - キャッシュ効率
🤝 貢献
貢献を歓迎します!ガイドラインについては、CONTRIBUTING.md を参照してください。
🐛 トラブルシューティング
一般的な問題と解決策:
データベース接続に失敗した場合
docker-compose restart postgres
docker-compose logs postgres
メモリ使用量が高い場合
export WORKERS=4
docker-compose up -d --scale api=1 --memory 4g
APIのレート制限に達した場合
export RATE_LIMIT_PER_MINUTE=1000
包括的なトラブルシューティングについては、DEPLOYMENT.md を参照してください。
📊 プロジェクトの状態
- ✅ コア分析エンジン
- ✅ 多言語サポート (10以上の言語)
- ✅ AI統合 (OpenAI、Anthropic、Ollama)
- ✅ セキュリティスキャン (OWASP、シークレット、依存関係)
- ✅ エクスポート形式 (JSON、HTML、PDF、SARIF、CSV、Excel)
- ✅ IDEプラグイン (VS Code、JetBrains)
- ✅ プラットフォーム統合 (GitHub、GitLab、Bitbucket)
- ✅ クラウドデプロイメント (AWS、Kubernetes、Docker)
- ✅ リアルタイムストリーミング (WebSocket)
- ✅ Webダッシュボード (React)
- ✅ モニタリング (Prometheus、Grafana)
- ✅ エンタープライズ機能 (SSO、RBAC、監査ログ)
🌟 サポートを表明する
Lyra Intelが役立つと思われる場合は、以下のことを検討してください。
- ⭐ このリポジトリをスターする - 他の人がプロジェクトを発見するのに役立ちます
- 🐛 問題を報告する - バグを報告して改善に貢献しましょう
- 💡 アイデアを共有する - 機能や改善点を提案しましょう
- 🤝 貢献する - ガイドラインについては、CONTRIBUTING.md を参照してください
- 📢 広める - チームやコミュニティと共有しましょう
すべてのスター、貢献、言及がコミュニティの成長に役立ちます!
🙏 謝辞
素晴らしいオープンソースツールを使用して構築されています。
📧 連絡先とサポート
- 問題とバグ報告: GitHub Issues
- ドキュメント: Full Documentation
- 貢献について: CONTRIBUTING.md を参照してください
開発者、セキュリティチーム、およびエンジニアリングリーダーのために愛を込めて作られています。
⬆ ページの先頭に戻る
📄 ライセンス
MITライセンス - 詳細については、LICENSE ファイルを参照してください。
Made with❤️by nich | Follow me on X.com