DATA ANALYTICS
Lo que No Ves Importa: El Sesgo del Superviviente y el Valor de los Datos Ignorados
En esta entrega, vamos a hablar sobre Abraham Wald, matemático y estadístico que colaboró con los aliados en la Segunda Guerra Mundial y que dió origen al Sesgo del Superviviente, un concepto que nos invita a reflexionar sobre la importancia de los datos ignorados en la toma de decisiones, y de su aporte a la Teoría de la Decisión. ¡Comencemos!
El Sesgo del Superviviente surge a partir del Matemático Abraham Wald y su observación de que se excluían del análisis los aviones caídos en combate
Introducción
Abraham Wald, nacido en 1902 en la ciudad de Cluj, que en ese momento era parte de Austria-Hungría, fue un matemático destacado cuyo trabajo revolucionó varios campos de la estadística y la teoría de la decisión. Wald era de origen judío y tuvo que huir del avance nazi en Europa, lo que lo llevó a trasladarse a los Estados Unidos en 1938. Allí, se convirtió en miembro del Statistical Research Group (SRG) de la Universidpad de Columbia, donde trabajó durante la Segunda Guerra Mundial.
En determinado momento de la guerra, los aliados perdian muchos aviones en combate, y se enfrentaron a la necesidad de reforzarlos para aumentar su resistencia. Para ello, realizaron planos de los aviones que regresaban de las misiones, y analizaron las áreas que habían sido impactadas por los disparos enemigos. Ésto les llevo a la conclusión de que debían reforzar las áreas que presentaban más daños, ya que eran las más vulnerables.
La propuesta inicial era reforzar la áreas impactadas
No obstante, dado que no estaban obteniendo los resultados que esperaban, solicitaron a Abraham Wald que revisara éste análisis. Luego de observar los planos, Wald inmediatamente observo que esos aviones, si bien con muchos impactos de bala, estaban de hecho regresando a la base, y que la cuestion que debían preguntarse en realidad era ¿Qué pasó con los aviones que no regresaron? ¿Por qué no estaban en el análisis? Evidentemente esos aviones debían de haber sido impactados en áreas más críticas que los aviones que regresaban, y por lo tanto ésas eran las áreas que debían ser reforzadas.
Con el enfoque de Wald se reforzaron las áreas inversas a las impactadas
Éste enfoque de Wald, basado en los datos ignorados, fue revolucionario y ayudó a salvar muchas vidas aliadas, y dió origen al concepto de Sesgo del Superviviente.
¿Qué es el Sesgo del Superviviente?
El Sesgo del Superviviente es entonces un "error" que ocurre cuando se toma en cuenta solo a los "supervivientes" de un proceso o evento, ignorando a aquellos que no lo superaron. Al igual que en el analisis de los aviones que sobrevivían unicamente, éste concepto refiere al sesgo que tienden a tener los analistas de contemplar solo lo que es visible o exitoso, lo que conduce a conclusiones incompletas y erróneas.
Existen muchos ejemplos de éste sesgo en la vida cotidiana y laboral que nos pueden llevar a conclusiones incorrectas por basarse en datos incompletos o sesgados. Por ejemplo, si una empresa solo analiza a los empleados que han ascendido de puesto, y no a aquellos que han sido despedidos, puede llegar a la conclusión de que el ascenso es el resultado de un determinado comportamiento, cuando en realidad puede haber otros factores involucrados.
En las finanzas, analizar solo las empresas o acciones que han tenido éxito en el mercado, y no a las que han fracasado o perdido valor, también puede llevar a malas inversiones.
En la medicina, estudiar solo a los pacientes que han respondido a un tratamiento, y no a los que no lo han hecho, puede llevar a la prescripción de medicamentos ineficaces.
En un e-commerce podriamos analizar la cantidad de carritos de compra que se han completado, y no aquellos que han sido abandonados, lo que nos llevaría a conclusiones erróneas sobre el proceso de compra. Si nos centramos en los 100 carritos que han sido exitosos, estamos ignorando que hubo 300 que no se concretaron. Ésto nos puede llevar a pensar que el proceso de compra es exitoso, cuando en realidad hay un 75% de abandono. Analizar el porque de este 75 % es vital para entender si hay un problema en el proceso de compra, y como mejorarlo.
Podemos nombrar muchos ejemplos de este tipo, donde el Sesgo del Sobreviviente nos lleva a conclusiones erróneas. Por eso es importante tener en cuenta este concepto a la hora de tomar decisiones, ya que los datos que no vemos pueden ser tan importantes como los que sí vemos. Es esencial para evitar caer en conclusiones erróneas, y aquí entra en juego la Teoría de la Decisión, un enfoque estadístico que nos ayuda a tomar decisiones racionales en situaciones de incertidumbre
Teoría de la Desición
La Teoría de la Decisión se ocupa de analizar cómo una persona elige la acción que, entre un conjunto de opciones posibles, le conduce al mejor resultado, considerando sus propias preferencias y objetivos. En otras palabras, la teoría busca identificar la opción que maximiza el beneficio o utilidad para el decisor, basándose en lo que este considera más valioso o deseable.
La teoría propone que las decisiones deben tomarse utilizando toda la información relevante disponible. Sin embargo, el problema surge cuando los datos están sesgados o incompletos, como ocurre con el Sesgo del Superviviente.
Para abordar este problema, la teoría nos insta a identificar y considerar la información que está ausente o no visible. Esto implica preguntarse activamente "¿Qué datos no estamos viendo?" o "¿Qué factores estamos ignorando?". La clave está en asegurar que todas las posibles variables, tanto las evidentes como las ocultas, se incluyan en el análisis antes de tomar una decisión.
Este enfoque integral permite evitar conclusiones equivocadas y decisiones incompletas que pueden surgir al basarse únicamente en datos visibles o en los casos de éxito. Al considerar la información completa y evaluar todas las variables relevantes, se mejora la precisión y la efectividad de la toma de decisiones.
Elementos Fundamentales de la Teoría de la Decisión
Para entender cómo se toman decisiones informadas, es crucial conocer los elementos fundamentales de la Teoría de la Decisión. Estos elementos forman la base para analizar y seleccionar las mejores opciones en situaciones de incertidumbre:
- Agente Decisor: El agente decisor puede ser una persona, una organización o un sistema que debe tomar una decisión. Este agente tiene el objetivo de maximizar un criterio específico, como utilidad, beneficio o eficiencia. El papel del agente decisor es fundamental, ya que define los objetivos y parámetros que guiarán la decisión.
- Conjunto de Alternativas: Cada decisión implica elegir entre varias opciones posibles. Cada alternativa tiene consecuencias distintas, y la Teoría de la Decisión ayuda a evaluar cuál opción es la más favorable en función de los objetivos establecidos. Este análisis permite comparar las alternativas en términos de sus resultados esperados y costos asociados.
- Resultados o Consecuencias: Las decisiones conducen a uno o más resultados posibles, que pueden ser ciertos o inciertos. La teoría proporciona herramientas para manejar ambos casos. La evaluación de las consecuencias es clave para entender los impactos de cada alternativa y tomar decisiones más informadas.
- Preferencias del Decisor: A menudo, los agentes decisores tienen preferencias subjetivas sobre los resultados. La Teoría de la Decisión utiliza funciones de utilidad para cuantificar estas preferencias, permitiendo medir la satisfacción o el valor asociado a cada posible resultado. Esto ayuda a alinear las decisiones con los objetivos y valores personales o organizacionales.
- Probabilidades: En situaciones de incertidumbre, es esencial asignar probabilidades a los diferentes resultados posibles. Técnicas estadísticas y probabilísticas, como la regla de Bayes, se utilizan para ajustar las probabilidades conforme se obtiene nueva información. Este enfoque permite tomar decisiones basadas en una evaluación precisa de las probabilidades y los riesgos asociados.
Estos elementos proporcionan un marco sólido para la toma de decisiones en condiciones de incertidumbre. Al considerar cada aspecto cuidadosamente, los decisores pueden mejorar la calidad y efectividad de sus elecciones, minimizando el impacto de sesgos como el sesgo del superviviente y maximizando la probabilidad de alcanzar los objetivos deseados.
Tipos de Desición
La Teoría de la Decisión contempla varios tipos de decisiones, clasificadas principalmente en función de la certeza o incertidumbre del resultado y la naturaleza de la elección:
Decisiones Bajo Certeza: En este tipo de decisiones, el resultado de cada acción es conocido con certeza. La decisión se basa en información completa y precisa, y no hay incertidumbre sobre los resultados futuros. Decidir el método más eficiente para realizar una tarea en la que todos los factores y resultados son bien conocidos es un ejemplo de ello.
Decisiones Bajo Incertidumbre: En estas decisiones, el resultado de cada acción no es completamente conocido. La incertidumbre puede ser total o parcial, y se utilizan herramientas de la teoría de probabilidad para gestionar esta incertidumbre.
- Decisiones Bajo Riesgo: Se conoce la distribución de probabilidad de los posibles resultados. Las decisiones se toman en función del valor esperado de cada opción. Esto puede implicar, por ejemplo, decidir invertir en una acción sabiendo las probabilidades de diferentes rendimientos futuros.
- Decisiones Bajo Incertidumbre: No se conoce la probabilidad de los diferentes resultados. Se deben utilizar técnicas como el análisis de escenarios y los árboles de decisión para evaluar las alternativas. Por ejemplo, decidir sobre el lanzamiento de un nuevo producto en un mercado con alta incertidumbre sobre la demanda.
Decisiones Intertemporales: Estas decisiones implican elegir entre opciones que tienen consecuencias a lo largo de diferentes períodos de tiempo. Se trata de evaluar el valor presente de los beneficios futuros frente a los costos actuales. Un ejemplo sería elegir entre gastar dinero ahora en un lujo o invertirlo para obtener beneficios futuros.
Decisiones Sociales: En este caso, las decisiones se toman en grupo o dentro de una estructura organizativa. Implica considerar no solo los intereses individuales, sino también el impacto en el grupo o la organización. Esto puede ser decidir sobre la asignación de recursos en una empresa o la planificación de una política pública o social.
Decisiones Bajo Condiciones de Complejidad: Estas decisiones involucran un alto grado de complejidad en el cálculo de expectativas o en la organización que toma la decisión. La teoría se enfoca en entender la dificultad de encontrar la solución óptima. Un ejemplo sería decidir sobre la estrategia de marketing de una empresa en un mercado altamente competitivo y cambiante, como un Club de Fútbol.
Decisiones entre Mercancías Inconmensurables: Este tipo de decisiones implica elegir entre opciones que no se pueden medir bajo una misma unidad o criterio, como elegir entre invertir en diferentes tipos de activos que tienen valoraciones cualitativas y cuantitativas diferentes.
Paradoja de la Elección: Este fenómeno ocurre cuando tener demasiadas opciones puede llevar a una menor satisfacción con la decisión o incluso a la parálisis por análisis. Como enfrentarse a una abrumadora cantidad de opciones de productos en una tienda, lo que puede llevar a una decisión menos satisfactoria o a no tomar ninguna decisión.
Estos tipos de decisiones muestran la diversidad de escenarios en los que se pueden aplicar los principios de la teoría. Cada uno requiere un enfoque específico y herramientas adecuadas para asegurar una toma de decisiones informada y efectiva.
Aplicaciones en Data
La Teoría de la Decisión es fundamental en el campo de la ciencia de datos y el análisis de datos. Al enfrentarse a grandes volúmenes de información y a situaciones de incertidumbre, se deben tomar decisiones informadas que maximicen el valor de los datos y minimicen los riesgos asociados. Algunas aplicaciones clave de la teoría en el ámbito de la ciencia de datos incluyen:
Optimización de Campañas de Marketing: En marketing, la teoría se usa para seleccionar la estrategia más efectiva. Se analizan datos históricos de campañas anteriores para calcular el valor esperado de cada estrategia. Por ejemplo, se pueden usar modelos de regresión para predecir la conversión de cada estrategia y seleccionar la que tenga la mayor probabilidad de maximizar el retorno de inversión (ROI).
Modelos de Clasificación en Machine Learning: En la detección de fraude en transacciones financieras, se pone en práctica para construir modelos predictivos que clasifican las transacciones como fraudulentas o no fraudulentas. La teoría ayuda a ajustar las probabilidades de diferentes resultados (fraude o no fraude) y asignar pesos a las características relevantes. Un modelo de árboles de decisión, por ejemplo, puede evaluar las características de una transacción y tomar decisiones basadas en la minimización del costo de falsos positivos y falsos negativos.
Gestión de Cartera de Inversiones: En el ámbito financiero, se usa para seleccionar inversiones que maximicen el rendimiento esperado mientras minimizan el riesgo. Utilizando la Teoría de la Utilidad Esperada, se pueden calcular las probabilidades de diferentes rendimientos de inversión y tomar decisiones basadas en el equilibrio entre riesgo y recompensa. Esto puede implicar la optimización de la asignación de activos en una cartera para lograr el mayor retorno ajustado al riesgo.
Planificación de Recursos en Proyectos: En la planificación de proyectos con múltiples tareas y recursos limitados, contrbuye a asignar recursos de manera que maximicen la eficiencia y cumplan con los plazos del proyecto. Se pueden evaluar diferentes escenarios de asignación de recursos y seleccionar el que ofrece el mejor equilibrio entre costo, tiempo y calidad.
Selección de Proveedores en la Cadena de Suministro: Al seleccionar entre varios proveedores para una materia prima, ayuda a evaluar y comparar las ofertas. Esto puede involucrar la evaluación de criterios como costo, calidad, tiempo de entrega y fiabilidad. Se pueden asignar pesos a cada criterio y tomar la decisión que maximice el valor total para la empresa.
Análisis de Sentimiento en Redes Sociales: En el análisis de sentimientos de redes sociales, ayuda a interpretar los resultados de las clasificaciones de sentimientos para tomar decisiones sobre estrategias de comunicación o marketing. Los modelos de procesamiento de lenguaje natural (NLP) pueden clasificar los comentarios de los usuarios y permitir ajustar las campañas en función de los sentimientos predominantes.
EXisten muchas aplicaciones de la Teoría de la Decisión en el campo de la ciencia y el análisis de datos, y su integración en los procesos de toma de decisiones puede mejorar significativamente la calidad y efectividad de las elecciones realizadas. Al considerar los elementos fundamentales de la teoría y aplicarlos a situaciones de incertidumbre, se puede maximizar el valor de los datos y minimizar los riesgos asociados, contribuyendo al éxito proyectos y organizaciones.
Conclusión
El Sesgo del Superviviente, como lo destacó Abraham Wald, resalta la importancia de considerar todos los datos relevantes, incluidos los que podrían no ser inmediatamente visibles. Este sesgo ocurre cuando se ignoran los datos de los "no sobrevivientes", lo que puede llevar a conclusiones incorrectas y decisiones mal fundamentadas.
La Teoría de la Decisión proporciona un marco robusto para enfrentar este desafío. Al incorporar toda la información disponible y considerar tanto las variables evidentes como las ocultas, los decisores pueden evitar errores comunes y mejorar la efectividad de sus elecciones. Este enfoque integral asegura que las decisiones se basen en una visión completa y precisa de la situación.
En la práctica actual, la integración de estos principios ayuda a optimizar decisiones en campos como el marketing, las finanzas, la planificación de proyectos y la selección de proveedores. Considerar los datos ausentes y evaluar todas las alternativas disponibles permite una toma de decisiones más informada y efectiva, minimizando el impacto de sesgos y maximizando los beneficios de los datos utilizados.
Aqui concluimos nuestro artículo sobre el Sesgo del Superviviente y la Teoría de la Decisión. Esperamos que haya sido de interés y utilidad, y que te haya brindado una nueva perspectiva sobre la importancia de considerar todos los datos relevantes en la toma de decisiones.
Te esperamos el próximo Domingo para que leas una nueva entrega, donde continuaremos explorando temas de Data Analytics, Desarrollo Web e Inteligencia Artificial, Filosofía & Diseño!
Te puede interesar