Auto Causal Inference MCP - 藉助LLM自動因果推斷，適用於銀行場景的高效開發工具

Auto Causal Inference

Auto Causal Inference是一個利用大型語言模型(LLM)自動進行因果推斷的項目，用戶只需指定處理變量和結果變量，系統就能自動完成變量角色識別、因果圖構建、效應估計和模型驗證等全流程分析。項目提供兩種代理架構(LangGraph和MCP)來實現這一功能，特別適用於銀行場景下的因果問題分析。

研究與數據開發者工具 #因果推斷 #自動化分析 #銀行場景 #LLM應用 .Python

評分 : 2.5分

下載量 : 8.4K

更新時間 : 2025-07-24

打開站點

什麼是MCP服務器？

MCP服務器是一種基於Model-Context-Protocol模式構建的分佈式服務架構，用於執行復雜的因果推理任務。它將每個分析步驟拆分為獨立的服務模塊，通過HTTP協議進行通信，實現靈活擴展和高效部署。

如何使用MCP服務器？

用戶通過客戶端程序向MCP服務器發送請求，服務器接收請求後，根據任務類型調用相應的服務模塊進行處理。處理結果會通過HTTP響應返回給客戶端，整個過程完全自動化。

適用場景

適用於需要高併發、可擴展性的因果推理任務，如金融風控分析、市場行為研究等。特別適合需要模塊化部署和動態擴展的場景。

主要功能

模塊化服務

每個分析步驟都作為獨立服務模塊運行，便於維護和擴展。

分佈式處理

支持多節點並行處理，提升大規模數據處理效率。

自動路由

根據請求內容自動選擇合適的服務模塊進行處理。

API友好

提供標準化的HTTP接口，方便與其他系統集成。

優勢

支持高併發和分佈式處理

模塊化設計便於維護和更新

提供標準化接口便於系統集成

易於擴展新的分析功能

侷限性

需要一定的網絡基礎設施支持

對於簡單任務可能顯得過於複雜

配置和管理需要一定技術知識

初期部署成本較高

如何使用

啟動服務器

進入mcp_agent目錄，運行服務器程序以啟動MCP服務。

發送請求

使用客戶端程序向服務器發送因果推理任務請求。

獲取結果

服務器處理完成後，通過HTTP響應返回分析結果。

使用案例

分析促銷活動對數字產品激活的影響

通過MCP服務器執行因果推理分析，確定促銷活動是否有效提升了數字產品激活率。

評估客戶參與度對業務指標的影響

利用MCP服務器分析客戶參與度與其他業務指標之間的因果關係。

常見問題

MCP服務器需要哪些依賴環境？

如何確保MCP服務器的安全性？

MCP服務器能否處理大量數據？

如何監控MCP服務器的運行狀態？

🚀 銀行業自動因果推斷

本項目藉助大語言模型（LLM）的強大語義理解和推理能力，讓用戶只需指定“處理”和“結果”變量，即可自動推斷變量角色並生成建議的因果圖，解決了傳統因果推斷中變量角色識別依賴專業知識和手動構建的難題，實現了銀行業因果推斷的自動化，提高了實驗效率和結果的透明度與可重複性。

🚀 快速開始

本項目提供了兩種不同的代理架構來運行因果推斷工作流，你可以根據需求選擇運行方式。

運行 LangGraph

cd agent
python app.py

若要使用 LangGraph Studio 進行測試：

langgraph dev

UI 地址為：https://smith.langchain.com/studio/?baseUrl=http://127.0.0.1:2024

結合 Claude Desktop 運行 MCP

cd mcp_agent
python client.py

✨ 主要特性

自動化變量角色識別：利用大語言模型（LLM），用戶只需指定“處理”和“結果”變量，即可自動推斷變量角色和建議的因果圖。
多工具集成：集成了 CausalNex、CausalTune、DoWhy 等工具，實現了從因果關係發現、估計到調優的全流程自動化。
可擴展性架構：提供了 LangGraph Agent 和 MCP Agent 兩種不同的代理架構，支持同步或異步任務執行，便於擴展和模塊化服務部署。
結果驗證與修正：運行反駁測試來檢查因果結構，並在測試不通過時提出修正解決方案。

📦 安裝指南

環境要求

Python 3.10
Claude Desktop（用於運行 MCP）

安裝依賴

pip install requirements.txt

💻 使用示例

基礎用法

以下是一個簡單的示例，展示瞭如何使用本項目進行因果推斷：

# 示例輸入
User asks: "Does offering a promotion increase digital product activation ?"

# 示例輸出
# 因果關係
age -> promotion_offer;
age -> activated_ib;
income -> promotion_offer;
income -> activated_ib;
education -> promotion_offer;
education -> activated_ib;

region_code -> promotion_offer;

promotion_offer -> branch_visits;
branch_visits -> activated_ib;

promotion_offer -> customer_engagement;
activated_ib -> customer_engagement;

channel_preference -> activated_ib;
promotion_offer -> activated_ib

# 因果變量
{
  "confounders": ["age", "income", "education"],
  "mediators": ["branch_visits"],
  "effect_modifiers": ["channel_preference"],
  "colliders": ["customer_engagement"],
  "instruments": ["region_code"],
  "causal_graph": "...DOT format...",
  "dowhy_code": "...Python code..."
}

# 計算平均處理效應（ATE）
import dowhy
from dowhy import CausalModel

model = CausalModel(
    data=df,
    treatment='promotion_offer',
    outcome='activated_ib',
    common_causes=['age', 'income', 'education'],
    instruments=['region_code'],
    mediators=['branch_visits']
)

identified_model = model.identify_effect()
estimate = model.estimate_effect(identified_model, method_name='backdoor.propensity_score_matching')
print(estimate)

高級用法

以下是一些高級用法示例，包括模型調優和反駁測試：

# 模型調優
estimators = ["S-learner", "T-learner", "X-learner"]
# base_learners = ["random_forest", "neural_network"]

cd = CausalityDataset(data=df, treatment=state['treatment'], outcomes=[state["outcome"]],
                    common_causes=state['confounders'])
cd.preprocess_dataset()

estimators = ["SLearner", "TLearner"]
# base_learners = ["random_forest", "neural_network"]

ct = CausalTune(
    estimator_list=estimators,
    metric="energy_distance",
    verbose=1,
    components_time_budget=10, # in seconds trial for each model
    outcome_model="auto",
)

# run causaltune
ct.fit(data=cd, outcome=cd.outcomes[0])

print(f"Best estimator: {ct.best_estimator}")
print(f"Best score: {ct.best_score}")

# 反駁測試
refute_results = []
refute_methods = [
    "placebo_treatment_refuter",
    "random_common_cause",
    "data_subset_refuter"
]
for method in refute_methods:
    refute = model.refute_estimate(identified_estimand, estimate, method_name=method)
    refute_results.append({"method": method, "result": str(refute)})

pass_test = all("fail" not in r["result"].lower() for r in refute_results)

📚 詳細文檔

示例用例

場景	處理變量	結果變量
促銷活動是否會增加網上銀行激活率？	`promotion_offer`	`activated_ib`
分行訪問是否會增加客戶參與度？	`branch_visits`	`customer_engagement`
教育水平是否會影響收入？	`education`	`income`
渠道偏好是否會影響網上銀行使用？	`channel_preference`	`activated_ib`

分析變量列表

變量	描述
`age`	客戶年齡
`income`	客戶收入水平
`education`	客戶教育水平
`branch_visits`	客戶在一段時間內訪問實體分行的次數
`channel_preference`	首選的溝通或服務渠道（如在線、電話、分行內）
`customer_engagement`	反映客戶互動、登錄、對通信的響應等的綜合指標
`region_code`	地理區域標識符
`promotion_offer`	二元變量：客戶是否收到促銷活動
`activated_ib`	二元結果：客戶是否激活網上銀行

項目結構

auto_causal_inference/
├── agent/                 # LangGraph agent source code
│   ├── data/              # Sample data (bank.db)
│   ├── app.py             # Main entry point for LangGraph causal agent
│   ├── generate_data.py   # Data generation script for causal inference
│   ├── requirements.txt   # Dependencies for LangGraph agent
│   └── ...                # Other helper modules and notebooks
│
├── mcp_agent/             # MCP agent implementation
│   ├── data/              # Sample data (bank.db)
│   ├── server.py          # MCP causal inference server
│   ├── client.py          # MCP client to call the causal inference server
│   ├── requirements.txt   # Dependencies for MCP agent
│   └── ...                # Additional files
│
└── README.md              # This documentation file

結果分析

角色	變量	分配此角色的原因
混雜因素	`age`, `income`, `education`	影響客戶收到促銷活動的機會和網上銀行的使用。
中介變量	`branch_visits`	因果路徑中的一個步驟：促銷 → 訪問 → 網上銀行激活。
效應修飾因子	`channel_preference`	改變促銷活動對網上銀行激活效果的強度。
對撞因子	`customer_engagement`	受促銷活動和網上銀行使用的影響；不應進行調整。
工具變量	`region_code`	在區域層面隨機分配促銷活動。

最佳估計器：backdoor.econml.metalearners.TLearner，得分：483.1930697900207

反駁測試通過：True。

與其他工具/方法的比較

標準	CausalNex	DoWhy	CausalTune	自動因果推斷
主要目的	因果圖學習	完整因果流程	自動估計器調優	自動因果問答：發現 → 估計 → 調優
發現	是（NOTEARS、Hill Climb）	是（PC、NOTEARS、LiNGAM）	否	是（CausalNex + DoWhy 發現）
混雜因素識別	否	是	否	是（LLM 分析圖以識別混雜因素）
估計	有限（貝葉斯網絡）	豐富的估計器	是（多種學習器）	是（DoWhy 估計 ATE）
自動估計器	否	否	是	是（CausalTune 自動選擇最佳估計器）
反駁測試	否	是	否	是（DoWhy 反駁測試）
用戶輸入需求	手動圖和方法	手動估計器	選擇估計器	只需提出處理 → 結果問題
自動化水平	低到中等	中等	高	非常高
輸入數據	觀測表格數據	觀測數據 + 圖	觀測數據 + 模型	觀測數據 + 數據庫元數據
靈活性	高結構學習	高推斷和反駁	高調優	非常高，結合多種工具 + LLM
最適合場景	構建圖的研究人員	流程用戶	機器學習生產調優	希望快速獲得因果答案的業務用戶
優勢	良好的因果圖學習	完整因果工作流	自動估計器調優	端到端自動化 + LLM 支持
侷限性	無內置驗證	無自動調優	無發現/反駁	依賴數據質量，反駁失敗時需手動檢查