Por Felipe Guerrero
La econometría es una herramienta fundamental para entender y evaluar políticas públicas. Por otro lado, el machine learning (ML) ha transformado la forma de analizar grandes volúmenes de información, permitiendo descubrir patrones y relaciones complejas que antes resultaban difíciles de identificar.
Ahora bien, cabe preguntarse qué es la econometría en términos prácticos. Esta es una rama de la estadística que utiliza métodos matemáticos y estadísticos para analizar datos, con el objetivo de cuantificar relaciones entre variables, probar teorías y hacer predicciones. En específico para la economía, uno de sus principales objetivos es cuantificar relaciones causales entre variables de interés, con el propósito de probar teorías y hacer predicciones. De esta forma, los economistas le dan énfasis a distinguir entre causalidad y correlación entre variables.
Supongamos que queremos analizar si el nivel de educación influye en el salario de una persona. Podríamos hacer una encuesta, donde se pregunte el nivel educacional y el salario a las personas, encontrándose que existe una relación positiva entre educación y salario. Sin embargo, existen otras variables que podrían estar afectando esta relación. Por ejemplo, es posible que el colegio o universidad donde se realizaron los estudios sean más importantes que el nivel de educación en sí, ya que es en esas instituciones donde se generan las redes que luego permiten buscar empleo.
Estos factores también son relevantes a la hora de establecer la relación causal entre educación y salarios. En este sentido, la econometría permite incluir las variables relevantes del análisis para obtener la respuesta de cuál es el retorno real del nivel de educación en el salario de una persona, considerando cualquier otro factor relevante que afecte dicho retorno.
En contraste, el machine learning, en su uso convencional, se enfoca en desarrollar modelos que puedan identificar patrones en los datos y hacer predicciones con la mayor precisión posible. En otras palabras, se centra en lograr que el modelo se adecúe lo mejor posible a cada una de las observaciones. Así, en un gráfico representativo de ML (ver Figura 2), el modelo ajusta una curva flexible que sigue de cerca cada punto, lo que permite una mayor precisión en las predicciones, aunque a veces sacrifica la claridad en la interpretación causal. Lo anterior, ya que estos modelos están diseñados para identificar patrones en los datos sin imponer una estructura teórica que permita diferenciar entre correlación y causalidad, justamente lo que se busca con la econometría.
Figura 2. Modelo de ML(LSTM). Fuente: Elaboración propia.
Lo anterior no implica que el ML no se pueda utilizar para evaluar políticas públicas o hacer interpretaciones causales. Un ejemplo práctico de la aplicación del ML lo encontramos en Sakamoto, Jerzak y Daoud (2024). En este trabajo los autores muestran cómo las imágenes satelitales pueden aportar información valiosa para estudiar temas de pobreza y desarrollo. Estas imágenes, que capturan detalles del entorno y la infraestructura de lugares de difícil acceso, permiten identificar patrones y variaciones que se relacionan con indicadores socioeconómicos. Al combinar estos indicadores socioeconómicos con técnicas de machine learning, es posible transformar las señales visuales en datos numéricos, facilitando así el análisis de cómo factores ambientales y urbanos se vinculan con los niveles de pobreza en distintas regiones.
El estudio destaca que esta integración de datos satelitales y herramientas de ML mejora la precisión en la detección de patrones, ofreciendo además una nueva perspectiva para abordar fenómenos sociales. Esta metodología complementa los métodos tradicionales de la econometría al proporcionar detalles adicionales que pueden enriquecer el análisis de políticas públicas y estrategias de desarrollo. En definitiva, este enfoque híbrido abre nuevas oportunidades para que los investigadores examinen la pobreza y el desarrollo de manera más completa y con un mayor nivel de detalle.
En resumen, mientras la econometría se enfoca en aplicar distintos métodos estadísticos para obtener relaciones causales de variables de interés, el machine learning se orienta a capturar todos los detalles y mejorar la precisión de las predicciones. La integración de ambos enfoques permite desarrollar modelos híbridos que combinan el rigor y la búsqueda de causalidad de la econometría con la capacidad de ajuste y precisión del ML, lo que resulta especialmente valioso para la toma de decisiones en política pública.
Referencias
Sakamoto, K., Jerzak, C. T., & Daoud, A. (2024). A scoping review of earth observation and machine learning for causal inference: Implications for the geography of poverty [Preprint]. Retrieved from https://github.com/AIandGlobalDevelopmentLab/eo-poverty-review