background-image: url(./figs/logo.png) background-position: 5% 95% background-size: 35% class: center, middle # Principios de inferencia causal en estudios observacionales <br> <br> .right[L. Paloma Rojas-Saunero MD, PhD **Departmento de Epidemiología** <svg viewBox="0 0 512 512" style="height:1em;position:relative;display:inline-block;top:.1em;" xmlns="http://www.w3.org/2000/svg"> <path d="M459.37 151.716c.325 4.548.325 9.097.325 13.645 0 138.72-105.583 298.558-298.558 298.558-59.452 0-114.68-17.219-161.137-47.106 8.447.974 16.568 1.299 25.34 1.299 49.055 0 94.213-16.568 130.274-44.832-46.132-.975-84.792-31.188-98.112-72.772 6.498.974 12.995 1.624 19.818 1.624 9.421 0 18.843-1.3 27.614-3.573-48.081-9.747-84.143-51.98-84.143-102.985v-1.299c13.969 7.797 30.214 12.67 47.431 13.319-28.264-18.843-46.781-51.005-46.781-87.391 0-19.492 5.197-37.36 14.294-52.954 51.655 63.675 129.3 105.258 216.365 109.807-1.624-7.797-2.599-15.918-2.599-24.04 0-57.828 46.782-104.934 104.934-104.934 30.213 0 57.502 12.67 76.67 33.137 23.715-4.548 46.456-13.32 66.599-25.34-7.798 24.366-24.366 44.833-46.132 57.827 21.117-2.273 41.584-8.122 60.426-16.243-14.292 20.791-32.161 39.308-52.628 54.253z"></path></svg> </i> @palolili23</a><br> ] --- ## Objetivos de la clase <br> - Tipos de preguntas de investigación -- - Qué es inferencia causal? -- - El mundo contrafactual -- - El ensayo clínico ideal (_ensayo diana_) --- ## Tipos de preguntas de investigación -- - **Estudios descriptivos:** <br> Nos dan un resumen cuantitativo de alguna características del mundo. Por ej. una prevalencia, visualizaciones. -- - **Estudios de predicción:** <br> Nos permite utilizar datos ya medidos para poder predecir un nuevo dato. Por ej. estudios de diagnóstico y scores de pronóstico -- - **Estudios causales:** <br> Nos permite utilizar datos para predecir ciertas características en el mundo, si el mundo fuera diferente. Por ej. el efecto de un tratamiento, el efecto de una política de salud, el efecto de una decisión. .footnote[Miguel A. Hernán, John Hsu & Brian Healy. **_A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks_**, CHANCE (2019) ] --- ## Estudios descriptivos .center[<img src= ./figs/hopkins.png width="120%"/>] .footnote[Fuente: https://coronavirus.jhu.edu/map.html] --- ## Estudios predictivos .center[<img src= ./figs/symptoms.jpg width="60%"/>] --- ## Estudios causales .center[<img src= ./figs/riskfactors.png width="60%"/>] --- ## Y los estudios de asociación? - Estudiar la **asociación** entre una exposición y un evento de desenlace no es una pregunta científica. - Es una pregunta estadística - Existe por razones históricas - Encubre la verdadera pregunta de investigación --- ## Mirada crítica ![](figs/choc.png) --- ## Mirada crítica <br><br><br> "_La asociación entre el consumo de chocolate está asociado con un riesgo menor de falla cardiaca._" <br><br> .center[ **A. Descriptivo** **B. Predictivo** **C. Causal** ] --- class: middle, left # Inferencia causal --- ## Correlación y Causalidad ![](figs/correlacion-no-implica-causalidad.png) --- ## Preguntas causales <br> - Cuál es la efectividad de un tratamiento para prevenir una enfermedad? -- - Si le quito las medias a mi bebé, se resfriará? -- - Cuál fue el impacto de cerrar las escuelas en la tasa de contagio de COVID19? -- - Si trabajo más horas, me subirán el sueldo? --- ## Causalidad en epidemiología <br> <br> .pull-left[ - En epidemiología estudiamos **determinantes** de la salud. - No siempre podemos realizar ensayos clínicos. - Muchos hitos de la epidemiología fueron a partir de estudios observacionales. ] .pull-right[ ![](figs/smoke.jpg) ] --- ## Cómo conectamos nuestras preguntas a la estadística? - Podemos definir la inferencia causal respecto al **evento contrafactual**. <br> -- - Podemos pensar la inferencia causal a partir de la **emulación de un ensayo clínico hipotético** ("ensayo ideal", _target trial_) <br> -- - Podemos definir la inferencia causal en base a **diagramas causales** (Gráficos acíclicos dirigidos causales) --- ## Preguntas precisas, respuestas precisas Establecer **cuál es la pregunta de investigación causal** nos permite: <br> - Definir cuál es el mejor método estadístico? - Por qué variables debería o no ajustar en mi modelo? - Cómo interpretan los resultados mis colegas? - Confío en un resultado publicado que diga que A causa Y? - Que datos debería recolectar en un próximo estudio? --- class:middle ## Mundo contrafactual --- class: middle, center ![](https://media.giphy.com/media/3o7TKVUn7iM8FMEU24/giphy.gif) .right[**Contrafactual:** _acontecimiento que no ha sucedido en el universo actualmente observable pero que podría haber ocurrido. Se dice que el acontecimiento forman parte de un universo posible, mientras que el acontecimiento actual forma parte del universo fáctico o universo actual o universo real_.] --- ## Notación - A = 1 si comí 🍫 - A = 0 si ❌🍫 - Y = 1 si aprobé estadística - Y = 0 si no aprobé estadística - `\(Y^a\)` es el evento contrafactual bajo A = a --- ### Efecto causal individual Partiendo de "_Comer chocolate permite aprobar estadística_ " <br> .pull-left[ .center[ Si hubiese comido 🍫, hubiera aprobado estadística. `\(Y^{a=1} = 1\)` Si no hubiese comido 🍫, no hubiera aprobado estadística `\(Y^{a=0} = 0\)` ] ] -- <br> .pull-right[ <table> <thead> <tr> <th style="text-align:left;"> Persona </th> <th style="text-align:right;"> A </th> <th style="text-align:right;"> Y </th> <th style="text-align:right;"> Ya=1 </th> <th style="text-align:right;"> Ya=0 </th> <th style="text-align:left;"> Efecto </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> Luli </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:left;"> Si </td> </tr> <tr> <td style="text-align:left;"> Sergio </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:left;"> No </td> </tr> <tr> <td style="text-align:left;"> Ana </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> No </td> </tr> <tr> <td style="text-align:left;"> Joaquín </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:left;"> Si </td> </tr> <tr> <td style="text-align:left;"> Camila </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> No </td> </tr> </tbody> </table> **Efecto causal**: `\(Y^{a=1} \neq Y^{a=0}\)` ] --- ### El problema fundamental de la inferencia causal <br><br> <table> <thead> <tr> <th style="text-align:left;"> Persona </th> <th style="text-align:left;"> A </th> <th style="text-align:left;"> Y </th> <th style="text-align:left;"> Ya=1 </th> <th style="text-align:left;"> Ya=0 </th> <th style="text-align:left;"> Efecto </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> Luli </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> ? </td> <td style="text-align:left;"> ? </td> </tr> <tr> <td style="text-align:left;"> Sergio </td> <td style="text-align:left;"> 0 </td> <td style="text-align:left;"> 0 </td> <td style="text-align:left;"> ? </td> <td style="text-align:left;"> 0 </td> <td style="text-align:left;"> ? </td> </tr> <tr> <td style="text-align:left;"> Ana </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> ? </td> <td style="text-align:left;"> ? </td> </tr> <tr> <td style="text-align:left;"> Joaquín </td> <td style="text-align:left;"> 0 </td> <td style="text-align:left;"> 0 </td> <td style="text-align:left;"> ? </td> <td style="text-align:left;"> 0 </td> <td style="text-align:left;"> ? </td> </tr> <tr> <td style="text-align:left;"> Camila </td> <td style="text-align:left;"> 0 </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> ? </td> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> ? </td> </tr> </tbody> </table> -- <br> **Efecto causal promedio:** `\(Pr[Y^{a=1} = 1] \neq Pr[Y^{a=0} = 1]\)` --- ### Ensayos clínicos Experimentos donde se asigna aleatoriamente el tratamiento que recibirá cada participante. -- **Ensayo clínico ideal:** + No tiene pérdida de seguimieto + Adherencia total durante la duración del estudio + Doble ciego -- **Pasos alineados en el tiempo:** - Criterios de eligibilidad - Asignación del tratamiento (aleatorización) - Inicia el seguimiento para medir el desenlace ??? Counterfactual or potential outcomes, Causal diagrams (e.g., DAGs, SWIGs) The concept of an “ideal randomized trial” is tied directly to these languages --- .center[ **Asociación es causalidad!** ![](figs/causalidad_asociacion.png) ] .footnote[**Hernán MA, Robins JM (2020). Causal Inference: What If**] ??? Under this design, comparing the observed average outcomes under each treatment arm is the Igual as comparing what would have happened had everybody been in one treatment arm versus the other --- ### Diferencia de riesgo causal <br><br> `\(Pr[Y^{a=1} = 1] - Pr[Y^{a=0} = 1]\)` Si toda la población de estudio hubiese sido tratada, el riesgo del evento seria X unidades más que si nadie hubiese sido tratada, durante el periodo de estudio. --- ### Riesgo relativo causal <br><br> `\(Pr[Y^{a=1} = 1] / Pr[Y^{a=0} = 1]\)` Si toda la población de estudio hubiese sido tratada, el riesgo del evento seria X veces más el riesgo que si nadie hubiese sido tratada, durante el periodo de estudio. --- ### Los ensayos de la vida real - No son ideales (falta de adherencia, pérdida de seguimiento) -- - Nos permiten contestar preguntas que no pueden contestarse por ECAs - No son éticos - No son factibles - Necesitan mucho tiempo -- - Debemos basarnos en estudios observacionales --- ### Qué hacemos en este caso? - Diseñamos el **ensayo clínico ideal o diana** considerando todos los puntos claves de un protocolo. - Esto nos permite definir bien la pregunta causal - Evitar errores en el diseño del análisis --- ### Emulación del ensayo diana (_target trial emulation_) ![](figs/target_trial.png) --- ### Beneficios <br><br> - Ayuda a refinar la pregunta de investigación (AKA _estimand_). -- - Permite detectar fuentes de sesgo que pueden ser prevenidas por el diseño o en el análisis. -- - Permite ser transparente y explicito sobre los supuestos que conectan los datos observacionales a la pregunta causal. -- - Asegura interpretación clara de los resultados --- ### Estudios observacionales .pull-left[ ![](figs/dag.png) ] -- .pull-right[ **Supuestos** que nos permitan conectar el mundo contrafactual con el factual. **Intercambiabilidad**: Medimos todas las otras variables que puedan confundir nuestra asociación? **Consistencia**: Esta bien definida la variable "comer chocolate"? **Positividad** **Sin interferencia** ] --- ## Sesgos de confusión .pull-left[ <img src= ./figs/simp1.png width="100%"/> ] -- .pull-right[ <img src= ./figs/simp2.png width="100%"/> ] --- ### Mensaje final - Si estas pensando en sesgos de confusión o que necesitas "ajustar" por covariables, tienes una pregunta causal. -- - Definir una pregunta clara como estimando es esencial para conceptualizar el diseño que la responda. -- - Podemos usar la emulación de ensayos diana aún si no hemos medido (o no existe) la intervención de interés. -- - Especificar todos los elementos del ensayo diana es un paso esencial para definir el análisis estadístico. -- - Es un proceso dinámico, require que entendamos bien los mecanismos de cómo se generan los datos y que los contrastes causales sean informativos. --- class: center, middle ![](figs/correlation.png) -- La inferencia causal nos permite definir **bajo qué _supuestos_ puedo interpretar mis resultados como causales** -- Siempre y cuando la **pregunta de investigación sea clara**. -- Diseñemos bien nuestro estudio. --- class::center, middle .right[ ###"_Eres más inteligente que tus datos. <br> Los datos no entienden de causas y efectos; las personas sí._" <br> **El libro del porqué, Judea Pearl** ]