Published October 14, 2024
| Version v1
Publication
Federated Causal Inference: Multi-Study ATE Estimation beyond Meta-Analysis
Creators
Contributors
Others:
- Université de Montpellier (UM)
- Institut Desbrest d'Epidémiologie et de Santé Publique (IDESP) ; Institut National de la Santé et de la Recherche Médicale (INSERM)-Université de Montpellier (UM)
- Médecine de précision par intégration de données et inférence causale (PREMEDICAL) ; Centre Inria d'Université Côte d'Azur (CRISAM) ; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Institut Desbrest d'Epidémiologie et de Santé Publique (IDESP) ; Institut National de la Santé et de la Recherche Médicale (INSERM)-Université de Montpellier (UM)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Université de Montpellier (UM)
- AXIUAM
- Inria-FedMalin
- ANR-22-PESN-0003,SMATCH,Statistical and AI based Methods for Advanced Clinical Trial CHallenges in Digital Health(2022)
Description
In this work, we study Federated Causal Inference, an approach to estimate treatment effects from decentralized data across studies. We compare three classes of Average Treatment Effect (ATE) estimators derived from the Plug-in G-Formula, ranging from simple meta-analysis to one-shot and multi-shot federated learning, the latter leveraging the full data to learn the outcome model (albeit requiring more communication). Focusing on Randomized Controlled Trials (RCTs), we derive the asymptotic variance of these estimators for linear models. Our results provide practical guidance on selecting the appropriate estimator for various scenarios, including heterogeneity in sample sizes, covariate distributions, treatment assignment schemes, and center effects. We validate these findings with a simulation study.
Abstract (French)
Dans ce travail nous étudions l'inférence causale fédérée, une approche consistant à estimer les effets du traitement à partir de données décentralisées provenant de plusieurs études. Nous comparons trois classes d'estimateurs de l'Effet Moyen du Traitement (ATE) dérivées de la G-formule Plug-in, allant de la méta-analyse simple à l'apprentissage fédéré à un tour de communication (One-Shot) et en plusieurs( Multi-Shot), cette-dernière exploitant l'ensemble des données pour apprendre le modèle de l'outcome (au prix de davantage de communications). En nous concentrant sur les essais contrôlés randomisés (RCT), nous dérivons la variance asymptotique de ces estimateurs pour des modèles linéaires. Nos résultats permettent d'établir des recommandations pratiques sur le choix de l'estimateur approprié en fonction de divers scénarios, y compris en présence d'hétérogénéité sur les tailles d'échantillons des études, des distributions des covariables, des schémas d'affectation des traitements et des effets centre. Nous validons ces résultats par une étude sur données synthétiques.Additional details
Identifiers
- URL
- https://hal.science/hal-04747923
- URN
- urn:oai:HAL:hal-04747923v2
Origin repository
- Origin repository
- UNICA