TOOLS_QUICK_REFERENCE.md•5.83 kB
# 🚀 DoWhy MCP工具快速参考
## 📋 工具选择指南
### 按分析目标选择工具
| 分析目标 | 推荐工具 | 适用场景 |
|---------|---------|---------|
| **构建因果模型** | `causal_graph_builder` | 理论建模阶段 |
| **估计处理效应** | `backdoor_estimator` | 有足够混杂因子 |
| **处理内生性** | `instrumental_variable_estimator` | 有有效工具变量 |
| **高维混杂** | `propensity_score_estimator` | 混杂因子很多 |
| **稳健估计** | `doubly_robust_estimator` | 模型不确定性 |
| **异质效应** | `metalearner_estimator` | 个体差异大 |
| **政策评估** | `difference_in_differences_estimator` | 面板数据 |
| **阈值设计** | `regression_discontinuity_estimator` | 有分配阈值 |
| **稳健性检验** | `refutation_test_suite` | 验证结果 |
| **敏感性分析** | `e_value_analyzer` | 未观测混杂 |
| **归因分析** | `shapley_value_attribution` | 多因素贡献 |
| **反事实推理** | `individual_counterfactual` | 个体预测 |
| **因果发现** | `pc_algorithm` | 探索性分析 |
### 按数据类型选择工具
| 数据类型 | 推荐工具组合 |
|---------|-------------|
| **横截面数据** | `backdoor_estimator` + `propensity_score_estimator` |
| **面板数据** | `difference_in_differences_estimator` + `stability_analyzer` |
| **实验数据** | `doubly_robust_estimator` + `individual_counterfactual` |
| **观察数据** | `instrumental_variable_estimator` + `e_value_analyzer` |
| **高维数据** | `metalearner_estimator` + `causal_contribution_analysis` |
---
## 🔧 常用工具参数
### backdoor_estimator
```python
{
"data_path": "data.csv",
"treatment": "treatment_var",
"outcome": "outcome_var",
"confounders": ["conf1", "conf2"],
"method": "linear" # 可选: "linear", "nonlinear"
}
```
### propensity_score_estimator
```python
{
"data_path": "data.csv",
"treatment": "treatment_var",
"outcome": "outcome_var",
"confounders": ["conf1", "conf2"],
"method": "matching" # 可选: "matching", "weighting", "stratification"
}
```
### instrumental_variable_estimator
```python
{
"data_path": "data.csv",
"treatment": "treatment_var",
"outcome": "outcome_var",
"instrument": "instrument_var",
"confounders": ["conf1", "conf2"] # 可选
}
```
### e_value_analyzer
```python
{
"observed_effect": 0.5,
"confidence_interval": [0.3, 0.7],
"effect_type": "mean_difference" # 可选: "risk_ratio", "odds_ratio"
}
```
---
## 📊 输出结果解读
### 因果效应估计结果
```json
{
"causal_effect": {
"estimate": 0.45, // 因果效应估计值
"standard_error": 0.08, // 标准误
"confidence_interval": { // 置信区间
"lower": 0.29,
"upper": 0.61
}
},
"method": "Backdoor Adjustment",
"sample_size": 1000
}
```
### 敏感性分析结果
```json
{
"e_value": 2.1, // E-value值
"e_value_ci": 1.6, // 置信区间的E-value
"interpretation": {
"strength_needed": "moderate", // 所需混杂强度
"robustness": "high" // 稳健性等级
}
}
```
---
## ⚡ 快速诊断
### 结果可信度检查清单
- [ ] **因果假设合理**: 基于领域知识验证
- [ ] **识别策略有效**: 后门/前门/工具变量假设成立
- [ ] **模型规范正确**: 函数形式和变量选择合适
- [ ] **样本代表性**: 目标群体的代表性
- [ ] **敏感性稳健**: 通过多种敏感性测试
- [ ] **结果一致性**: 多种方法得到相似结果
### 常见问题诊断
| 问题 | 可能原因 | 解决方案 |
|------|---------|---------|
| **效应估计不稳定** | 模型规范错误 | 尝试不同的函数形式 |
| **置信区间很宽** | 样本量不足 | 增加样本或使用更精确的方法 |
| **敏感性测试失败** | 存在重要混杂 | 寻找更多控制变量或工具变量 |
| **不同方法结果差异大** | 方法假设不满足 | 检查各方法的适用条件 |
---
## 🎯 分析流程模板
### 标准因果推断流程
```
1. 理论建模 → causal_graph_builder
2. 效应估计 → backdoor_estimator / propensity_score_estimator
3. 稳健性检验 → doubly_robust_estimator
4. 敏感性分析 → e_value_analyzer + refutation_test_suite
5. 结果解释 → shapley_value_attribution
```
### 政策评估流程
```
1. 数据准备 → 确保面板数据结构
2. 平行趋势检验 → difference_in_differences_estimator
3. 稳健性检验 → stability_analyzer
4. 异质效应 → metalearner_estimator
5. 反事实分析 → population_counterfactual
```
### 机制分析流程
```
1. 总效应估计 → total_causal_influence
2. 路径分析 → path_specific_effects
3. 中介分析 → mechanism_attribution
4. 归因分析 → causal_contribution_analysis
```
---
## 🚨 重要提醒
### 使用前必读
1. **因果推断不是预测**: 关注的是因果关系而非预测精度
2. **假设至关重要**: 所有方法都依赖不可验证的假设
3. **领域知识必需**: 统计方法无法替代专业知识
4. **多方法验证**: 单一方法的结果可能误导
### 报告建议
1. **明确因果问题**: 清楚定义因果问题和目标群体
2. **说明识别策略**: 解释如何识别因果效应
3. **报告敏感性分析**: 展示结果的稳健性
4. **讨论局限性**: 诚实讨论方法的局限性
---
## 📞 技术支持
如果遇到技术问题或需要方法学指导,请参考:
- 详细文档: `TOOLS_DETAILED_GUIDE.md`
- 项目结构: `PROJECT_STRUCTURE.md`
- 完成报告: `FINAL_COMPLETION_REPORT.md`
**记住**: 因果推断是科学,也是艺术。工具只是手段,关键在于正确的思维方式和严谨的分析过程。