Curate Ipsum

Curate-Ipsumは、グラフと信念修正に基づくMCPサーバーで、LLM生成、形式的検証、合成サイクルを組み合わせて、コード生成に検証可能な正しさの保証を提供します。

開発者ツール人工知能チャットボット #コード検証 #プログラム合成 #グラフ分析 #信念修正 .Python

スコア : 2ポイント

ダウンロード数 : 5.4K

更新時間 : 2026-03-12

サイトを開く

Curate-Ipsumとは？

Curate-Ipsumは、AIによるコード生成の核心的な問題、つまりコードが正しく見えるが形式的検証が欠けている問題を解決する、インテリジェントなコード検証と合成システムです。システムは、AIの高速生成能力と形式的検証の信頼性を組み合わせて、効率的で信頼できるコードパッチを生成します。

Curate-Ipsumの使い方は？

Curate-IpsumはMCPサーバーとして動作し、Claude DesktopなどのAIアシスタントと統合できます。インストール後、AIアシスタントは30個の専用ツールを通じて、テストの実行、コード属性の検証、修復パッチの合成などの機能にアクセスできます。

適用シーン

Curate-Ipsumは、高品質で信頼性の高いコードが必要なシーンに特に適しています： 1. 重要なビジネスシステムの開発 2. セキュリティに敏感なアプリケーション 3. 形式的検証が必要なコードライブラリ 4. 自動化テストと修復プロセス 5. 教育や研究環境におけるコード検証

主要機能

包括的なテストツールセット

複数のテストフレームワーク（Stryker、mutmut、cosmic-rayなど）をサポートし、単体テスト、統合テスト、変異テスト機能を提供し、コードフレームワークを自動検出してテストカバレッジを分析します。

インテリジェントな信念修正

AGM信念修正理論に基づき、システムはコードの動作に関する理解をインテリジェントに更新および修正し、コード知識の完全性と一貫性を維持します。

グラフ - スペクトル分析

高度なグラフ理論アルゴリズムを使用してコード構造を分析し、呼び出しグラフを抽出、パーティションを計算、到達可能性をクエリし、コード最適化のためのデータサポートを提供します。

形式的検証

Z3やangrなどの検証ツールを統合し、属性検証と反例誘導抽象精緻化（CEGAR）をサポートし、コードの正しさの形式的証明を提供します。

インテリジェントなコード合成

CEGIS（反例誘導帰納合成）、遺伝的アルゴリズム、AI生成を組み合わせて、検証済みのコードパッチを自動合成し、意味検索とコンテキスト感知をサポートします。

ロールバックと障害分析

完全な操作履歴、障害分析、ロールバックメカニズムを提供し、開発プロセスのトレーサビリティと信頼性を保証します。

利点

AIの速度と形式的検証の信頼性を組み合わせる

複数のテストと検証フレームワークをサポートする

インテリジェントな信念修正と知識管理

高度なグラフ理論分析能力

完全なコード合成と修復プロセス

良好な拡張性と統合性

制限

一定の計算リソースが必要（特に検証段階）

複雑なコードの検証には長い時間がかかる場合がある

複数の依存コンポーネントの設定が必要

学習曲線が比較的急峻

一部の高度な機能にはDocker環境が必要

使い方

Curate-Ipsumのインストール

pipまたはDockerを使用してCurate-Ipsumサーバーをインストールします。Docker版には事前にロードされた埋め込みモデルが含まれており、追加のPython環境は必要ありません。

MCPクライアントの設定

Curate-IpsumをMCPクライアントの設定に追加します。Claude Desktopを例にとると、設定ファイルを編集してサーバー設定を追加します。

起動と使用

MCPクライアントを起動すると、AIアシスタントは30個の専用ツールを通じてCurate-Ipsumの機能（テスト、検証、合成など）にアクセスできます。

環境変数の設定

必要に応じて、グラフバックエンド、ログレベル、埋め込みモデルなどの環境変数を設定します。

使用例

自動化テストと修復

AIによって生成されたコードが初期チェックを通過したが、さらなる検証が必要な場合、Curate-Ipsumを使用して包括的なテストセットを実行し、潜在的な問題を特定し、自動的に修復パッチを合成します。

コード属性の検証

安全上重要なアプリケーションでは、コードが特定の安全属性を満たすことを検証する必要があります。Curate-Ipsumはこれらの属性を形式的に検証し、コードの動作が予期された通りであることを保証します。

インテリジェントなコードリファクタリング

複雑なコードライブラリをリファクタリングする必要がある場合、グラフ分析を使用してコード構造を理解し、結合度が高いモジュールを特定し、最適化方案を提案します。

知識ベース強化型コード生成

意味検索とコード合成を組み合わせ、既存のコードライブラリのパターンとベストプラクティスに基づいて新しいコードを生成します。

よくある質問

Curate-Ipsumは従来の単体テストフレームワークとどのように異なりますか？

Curate-Ipsumを実行するためにどのようなハードウェア構成が必要ですか？

Curate-Ipsumはどのようなプログラミング言語をサポートしていますか？

Curate-Ipsumを私のCI/CDパイプラインにどのように統合できますか？

信念修正機能は具体的にどのように動作しますか？

CEGISとCEGARはシステム内でそれぞれどのような役割を果たしますか？

🚀 Curate-Ipsum

信念修正による検証済みコード合成のためのグラフスペクトルMCPサーバー

Curate-Ipsumは、LLMによって生成されたコード（高速であり、妥当性があるが、検証されていない）と、正式に検証されたパッチ（低速であるが、正確で、信頼できる）との間のギャップを埋めます。これは、ミューテーションテストを、到達可能性分析、シンボリック実行、および自動テスト生成をサポートする、堅牢で自己修復可能なコードベースメタデータを維持するための大規模なシステムの一部として扱います。

🚀 クイックスタート

# クローンしてインストール（開発用）
git clone https://github.com/egoughnour/curate-ipsum.git
cd curate-ipsum
uv sync --extra dev --extra verify --extra rag --extra graph --extra synthesis

# MCPサーバーを実行
uv run curate-ipsum

# またはテストを実行
make test                     # 高速なテストセット（Dockerやモデルは不要）
make test-all                 # 統合テストも含む

✨ 主な機能

Curate-Ipsumは、MCP標準入出力トランスポートを介して30のツールを公開しており、6つのグループに分類されています。

テスト — run_unit_tests, run_integration_tests, run_mutation_tests, get_run_history, get_region_metrics, detect_frameworks, parse_region, check_region_relationship, create_region
信念修正 — add_assertion, contract_assertion, revise_theory, get_entrenchment, list_assertions, get_theory_snapshot, store_evidence, get_provenance, why_believe, belief_stability
ロールバックと失敗 — rollback_to, undo_last_operations, analyze_failure, list_world_history
グラフスペクトル — extract_call_graph, compute_partitioning, query_reachability, get_hierarchy, find_function_partition, incremental_update, persistent_graph_stats, graph_query
検証 — verify_property (Z3/angr), verify_with_orchestrator (CEGAR予算エスカレーション), list_verification_backends
合成とRAG — synthesize_patch (CEGIS + 遺伝的アルゴリズム + LLM), synthesis_status, cancel_synthesis, list_synthesis_runs, rag_index_nodes, rag_search, rag_stats

📦 インストール

# PyPI
pip install curate-ipsum

# またはuvを使用
uv pip install curate-ipsum

# Docker（組み込みの埋め込みモデルを含む）
docker pull ghcr.io/egoughnour/curate-ipsum:latest

Claude Desktop / MCP Client

claude_desktop_config.jsonに追加します。

{
  "mcpServers": {
    "curate-ipsum": {
      "command": "uvx",
      "args": ["curate-ipsum"]
    }
  }
}

またはDockerを使用する場合（埋め込みモデルが事前にロードされており、Pythonは不要）

{
  "mcpServers": {
    "curate-ipsum": {
      "command": "docker",
      "args": ["run", "-i", "--rm", "ghcr.io/egoughnour/curate-ipsum:latest"]
    }
  }
}

📚 ドキュメント

計画と設計

Phase 2 Plan - アクティブ：グラフスペクトルインフラストラクチャ（9ステップ）
Progress - 現在の状況、完了したこと、次に行うこと
Decisions - 理由付きのアーキテクチャ上の決定（D-001からD-008）
M1 Multi-Framework Plan - 領域モデルとパーサーの設計（完了）
BRS Integration Plan - 信念修正の統合
BRS v2 Refactoring Plan - モジュール化されたアーキテクチャ
ROADMAP - 完全なマイルストーントラッカー

アーキテクチャ

Architectural Vision - グラフスペクトルフレームワーク
Synthesis Framework - CEGIS/CEGAR/遺伝的アルゴリズムアプローチ
Belief Revision - AGM理論とプロバナンス

リファレンス

Summary - 機能カタログ
Potential Directions - 拡張ロードマップ
Synergies - ツールエコシステムの統合
CONTEXT - AIアシスタントのセッションコンテキスト
DOCS_INDEX - ドキュメントのクイックリファレンス

🔧 技術詳細

問題

LLMは以下のようなコードを生成します。

✅ 構文的に有効（通常）
✅ 統計的に妥当
❌ 意味的に正しい（時々）
❌ 型安全（偶然）
❌ 正式に検証された（決して）

現在のアプローチでは、LLMの出力を盲目的に信頼するか、完全に拒否するかのどちらかです。どちらも最適ではありません。

解決策

LLMを安価な候補生成に使用し、その後、計算リソースを投資して正式な保証を達成します。

LLM Candidates (k samples)
        ↓
   Seed Population
        ↓
┌───────────────────────────┐
│  CEGIS + CEGAR + Genetic  │  ← 検証ループ
│  + Belief Revision        │
└───────────────────────────┘
        ↓
  Strongly Typed Patch
  (with proof certificate)

既存技術との主な違い

従来のミューテーションテスト（Stryker, mutmut, cosmic-ray）との比較

従来の方法	Curate-Ipsum
単一のツール、単一の言語	マルチフレームワークオーケストレーション
フラットなファイルレベルの分析	階層的なグラフスペクトル分解
ミューテーションスコアを出力	ミューテーションテストを合成の入力として使用
正式な検証なし	CEGIS/CEGAR検証ループ
手動でのテスト作成	自動パッチ生成

LLMによるコード生成（Copilot, Claude, GPT）との比較

LLMのみ	Curate-Ipsum
モデルの出力を信頼	モデルの出力を検証
単一のサンプルまたはkの中から最良のもの	母集団ベースの改良
正式な保証なし	証明書付き
ステートレスな生成	プロバナンス付きの信念修正
妥当なコード	証明可能に正しいコード

プログラム合成（Sketch, Rosette, SyGuS）との比較

従来の合成方法	Curate-Ipsum
手書きのスケッチ	LLMによって生成された候補
コールドスタートの検索	LLMの母集団からのウォームスタート
実行間での学習なし	総合的な理論が知識を蓄積
単一の仕様	マルチフレームワークの暗黙的な領域

シンボリック実行（KLEE, S2E）との比較

シンボリック実行	Curate-Ipsum
パス探索のみ	合成と統合
ブール制約の解決	数学的な再定式化（SymPy）
単一ツールの分析	グラフDB + SMT + ミューテーションオーケストレーション
コード生成なし	検証済みのパッチを生成

新しい貢献

グラフスペクトルコード分解
- 最適な到達可能性のためのフィードラーベクトルパーティショニング
- 階層的なSCC凝縮
- 平面サブグラフの識別 → O(1)の亀田クエリ
- クラトウスキーサブグラフを原子的な非平面ユニットとして
合成のための信念修正
- AGM準拠の理論修正
- 最小限の収縮のための固着順序付け
- 失敗モード分析のためのプロバナンスDAG
- ロールバックによる有効性の向上（失敗が普遍的なモデルを精緻化）
暗黙的な領域検出
- スペクトル異常によるテスト不足コードの検出
- クロスフレームワークのミューテーション耐性による重要領域の識別
- 履歴的な可変性によるパーティション最適化のガイド
数学的な制約再定式化
- ブール難解問題 → 微分/根探索
- SymPyによるパス条件のエンコーディング
- ハイブリッドSMT + 数値解法

アーキテクチャ

flowchart TB
    subgraph MCP["MCP Interface"]
        direction TB

        subgraph Sources["Analysis Sources"]
            direction LR
            MUT["🧬 Mutation<br/>Orchestrator<br/><small>Stryker<br/>mutmut<br/>cosmic-ray</small>"]
            SYM["🔬 Symbolic<br/>Execution<br/><small>KLEE · Z3<br/>SymPy</small>"]
            GRAPH["📊 Graph<br/>Analysis<br/><small>Joern<br/>Neo4j<br/>Fiedler</small>"]
        end

        MUT --> BRE
        SYM --> BRE
        GRAPH --> BRE

        BRE["🧠 Belief Revision Engine<br/><small>AGM Theory · Entrenchment · Provenance DAG</small>"]

        BRE --> SYNTH

        SYNTH["⚙️ Synthesis Loop<br/><small>CEGIS · CEGAR · Genetic Algorithm</small>"]

        SYNTH --> |"counterexample"| BRE

        SYNTH --> OUTPUT

        OUTPUT["✅ Strongly Typed Patch<br/><small>Proof Certificate ·Type Signature<br/>Pre/Post Conditions</small>"]
    end

    LLM["🤖 LLM Candidates<br/><small>top-k samples</small>"] --> SYNTH

    style MCP fill:#1a1a2e,stroke:#16213e,color:#eee
    style Sources fill:#16213e,stroke:#0f3460,color:#eee
    style MUT fill:#0f3460,stroke:#e94560,color:#eee
    style SYM fill:#0f3460,stroke:#e94560,color:#eee
    style GRAPH fill:#0f3460,stroke:#e94560,color:#eee
    style BRE fill:#533483,stroke:#e94560,color:#eee
    style SYNTH fill:#e94560,stroke:#ff6b6b,color:#fff
    style OUTPUT fill:#06d6a0,stroke:#118ab2,color:#000
    style LLM fill:#ffd166,stroke:#ef476f,color:#000

ロードマップ

フェーズ1: 基礎 ✅

[x] MCPサーバーインフラストラクチャ
[x] Strykerレポートの解析
[x] 実行履歴とPIDメトリクス
[x] 柔軟な領域モデル（階層的：ファイル → クラス → 関数 → 行）
[x] mutmutパーサーの統合
[x] フレームワークの自動検出
[x] 統一されたパーサーインターフェース

フェーズ2: グラフインフラストラクチャ ✅

[x] グラフモデル（CodeGraph, Node, Edge）
[x] 呼び出しグラフの抽出（ASTベース）
[x] ASR抽出器（インポート/クラス分析）
[x] 依存関係グラフの抽出（モジュールレベルのインポート）
[x] 呼び出し/依存関係グラフからのラプラシアンの構築
[x] フィードラーベクトルの計算（scipy.sparse.linalg）
[x] 仮想シンク/ソースを用いた再帰的なフィードラーパーティショニング
[x] SCC検出と階層的な凝縮
[x] 平面サブグラフの識別（ボイヤー・マイルヴォルド法）
[x] O(1)到達可能性のための亀田事前処理
[x] MCPツール（抽出、パーティショニング、到達可能性、階層、検索）

フェーズ3: マルチフレームワークオーケストレーション ✅

[x] 統一されたミューテーションフレームワークインターフェース
[x] cosmic-rayパーサー
[x] poodleパーサー
[x] universalmutatorパーサー

フェーズ4: 信念修正エンジン ✅

[x] py-brsライブラリの統合（AGMコア）
[x] 証拠アダプター（ミューテーション結果 → 信念）
[x] curate-ipsumの理論マネージャー
[x] AGM収縮（py-brs v2.0.0リリース）
[x] 固着計算（py-brs v2.0.0）
[x] プロバナンスDAGの保存とクエリ
[x] 失敗モード分析器
[x] ロールバックメカニズム

フェーズ5: 合成ループ ✅

[x] LLMシーディングによるCEGISの実装
[x] AST認識クロスオーバーを持つ遺伝的アルゴリズム
[x] エントロピーモニタリングと多様性注入
[x] 反例指向のミューテーション
[x] CEGAR予算エスカレーション（10秒 → 30秒 → 120秒）

フェーズ6: 検証バックエンド ✅

[x] SMT解決のためのZ3の統合（デフォルトバックエンド）
[x] angr Dockerシンボリック実行（高コストのタイア）
[x] 予算エスカレーションを持つCEGARオーケストレーター
[x] 検証ハーネスビルダー（Cソース生成）
[x] テスト用のモックバックエンド
[ ] 代替ソルバー（CVC5, Boolector）
[ ] SymPyパス条件のエンコーディング

フェーズ7: グラフ永続化 ✅

[x] 抽象的なGraphStore ABC
[x] SQLiteグラフストア（主要）
[x] Kuzuグラフストア（オプション）
[x] 合成結果の永続化
[x] 亀田とフィードラーの永続化
[x] 増分更新エンジン

フェーズ8: RAG / 意味検索 ✅

[x] ChromaDBベクトルストアの統合
[x] sentence-transformers埋め込みプロバイダー（all-MiniLM-L6-v2）
[x] グラフ拡張されたRAGパイプライン（ベクトルの上位k → 近傍拡張 → 再ランク付け）
[x] 時間的な関連性のための減衰スコアリング
[x] コンテキスト認識合成のためのCEGISの統合

フェーズ9: 本番環境の強化 ✅

[x] CI/CD（GitHub Actions — リント、テストマトリックス、統合、ロックファイル）
[x] リリースパイプライン（タグプッシュ → PyPI + GHCR + MCPレジストリ）
[x] uvロックファイル（149パッケージ）
[x] プリコミットフック（ruffフォーマット + リント + ロックチェック）
[x] MCPバンドルパッケージング（server.json, smithery.yaml, manifest.json）
[ ] HTML/SARIFレポート
[ ] IDE拡張（VSCode）
[ ] 回帰検出とアラート

将来の作業

高度なオーケストレーション（延期）

[ ] 暗黙的な領域検出（スペクトル異常）
[ ] 非矛盾的なフレームワーク割り当て
[ ] クロスフレームワークの生存分析

意味検索とRAG

[x] 意味検索のためのコードグラフRAG
[x] 意味検索インデックス（ChromaDB）
[x] グラフ拡張を持つRAG検索パイプライン
[ ] テキストからCypherクエリへの変換

設定

すべての設定は環境変数を通じて行われます（.env.exampleを参照）。

CURATE_IPSUM_GRAPH_BACKEND=sqlite   # またはkuzu
MUTATION_TOOL_DATA_DIR=.mutation_tool_data
MUTATION_TOOL_LOG_LEVEL=INFO
CHROMA_HOST=                         # 空 = プロセス内、またはlocalhost:8000
EMBEDDING_MODEL=all-MiniLM-L6-v2

完全なサービススタック（ChromaDB + angrランナー）の場合

make docker-up-verify         # Docker Composeを介してChroma + angrを起動

主要参考文献

Alchourrón, Gärdenfors, Makinson (1985). On the Logic of Theory Change
Fiedler (1973). Algebraic Connectivity of Graphs
Kameda (1975). On the Vector Representation of Reachability in Planar Directed Graphs
Solar-Lezama (2008). Program Synthesis by Sketching (CEGIS)
Clarke et al. (2000). Counterexample-Guided Abstraction Refinement (CEGAR)