
前提:因果は“必ず起きる”約束ではない
同じ原因でも結果がブレるのは、途中で触れる条件(環境・タイミング・介在要因)が異なるためです。ゆえに、私たちが扱うのは因果の形式と条件つきの効果であり、万能の法則ではありません。
因果の3型で現実を切る
型A:単純介入(X→Y)
例:オンボーディング面談の実施(X)により30日継続率(Y)が上がる。前提が合えばシンプルに効くが、母集団や時期で効果は変動。
型B:連鎖・波及(X→M→Y)
例:価格改定(X)が離脱理由の構成(M)を変え、結果として解約率(Y)に波及。途中経路(M)を観測しないと誤診しやすい。
型C:条件付き効果(X×Z→Y)
例:通知頻度(X)の効果はユーザー熟達度(Z)で反転。未熟層は効果大、熟達層は逆効果。層別が必須。
危険域:相関と因果の取り違えを防ぐ
第三因子(Z)の影響
勤務満足(Y)と在宅日数(X)が一緒に動いていても、職種(Z)が両方を決めているだけ、ということはよくある。Zを観測・統制できないと結論は保留。
順序の混同(逆因果)
離職意向(Y)が先に高まり、その結果として残業時間(X)が増えるケース。時系列の先後と介入のタイムスタンプを必ず記録。
集計の罠(シンプソンの逆説)
全体では改善、部門別では悪化のような逆説。最低1回は層別(年齢・経験年数・チャネルなど)で確認。
観察から介入へ:実務で使う5つの手段
1. 反事実ログ(Counterfactual Log)
「介入しなかったら起きていたであろう結果」の推定根拠を都度メモ。代替シナリオを言語化するだけで、早計な決めつけを大幅に減らせます。
2. ナチュラル実験の拾い上げ
制度変更・在庫切れ・突発障害など、意図しない外乱を比較群として活用(ただし群の違いを記録)。
3. 先行/遅行の分離
例:問い合わせ未返信率(先行)と解約(遅行)。先行指標をいじって遅行で確認する二段ロックが安全。
4. DAG(因果ダイアグラム)を1枚描く
「観測できないけど効いていそうな要因」も含め、矢印で仮説を書き切る。抜けている変数を会議で洗い出し。
5. 小さな介入のA/B
完璧な実験でなくてよい。対象・期間・割付方法・主要指標・停止基準を簡潔に先出しするだけで因果の手触りが掴める。
現場テンプレート(コピペ可)
因果設計シート(1ページ)
【目的】何を変えたい?(遅行指標): 【介入X】やること/やらないこと: 【前提】対象/期間/除外条件: 【DAGメモ】X→( )→Y/潜在Z:( ) 【比較方法】A/B or 段階導入 or ナチュラル実験: 【主要指標】主:____ 副:____ 反作用:____ 【停止基準】悪化時の即時停止条件: 【反事実】介入なしならどうなった?根拠:
相関→因果の昇格チェック(5問)
- 時系列の先後は確認できたか(タイムスタンプあり)?
- 第三因子Zの候補を列挙し、最低1つは統制・層別したか?
- 層別しても効果の符号は一貫しているか?
- 小さくても介入を実施し、差で確認したか?
- 再現のための条件(対象・文脈・閾値)を書いたか?
事例で学ぶ:誤作動を正す
事例1:安全施策の逆効果
ヘルメット新型導入(X)後に事故率(Y)が上昇。相関だけ見て「装備が悪い」と結論。
実は、現場の人員不足(Z)が同時進行で悪化。Zを統制した層別では新型の効果はプラス。対策は装備刷新ではなく人的配置の是正だった。
事例2:教育コンテンツの効果見誤り
動画視聴(X)が高い学生ほど成績(Y)が高い。相関を因果と誤認して動画必修化。
反事実ログと簡易ランダム割付で検証すると、もともと自律学習の高い層に動画視聴が集中していただけ。対策は視聴の義務化でなく、自律学習の支援へ。
縁(コンテキスト)を前提に織り込む
条件を書いて、引き出しにする
「この施策は週次接点が2回以上・初期3週間・未熟ユーザーに限り効果大」。
こうした有効範囲の明記が、再現性を上げ“勝ちパターン”を資産化します。
再現確率の管理
- 効果量(中央値)+ばらつき(四分位)をセットで共有
- 条件外への適用は試験的導入→早期レビューで拡張
運用ルール(最小で効く)
ルール1:先に定義
指標は分母・分子・期間をセットで宣言(例:継続=30日後の再利用/分母=初回利用者)。
ルール2:層別は1回必ず
年齢・経験・チャネルなど主要軸で最低1回は層別確認。
ルール3:介入の“痕跡”を残す
誰が・いつ・何を・どれくらいの強度で実施したか。後から反事実が作れます。
まとめ:因果は“精密さ”より“使い方”
相関を否定せず、因果を神格化もしない。条件つきの効果として因果形式を設計し、反事実・層別・小さな介入で現場に落とす。これが結果を変える最短距離です。