¿Cómo eliminar los sesgos en los datos?

By mayo 15, 2018Tomando el pulso

La inteligencia artificial y las soluciones basadas en datos tienden a reproducir los sesgos de quienes las programan. Así, si vendemos maquinillas para depilar para el Día de la Madre, es muy posible que una IA alimentada con datos de nuestro CRM termine asociando la depilación como una necesidad intrínsecamente femenina, cuando, ni todas las mujeres quieren depilarse ni todos los que se depilan son mujeres, ni es necesario segmentar por género para vender según qué (y hacerlo tiene consecuencias absurdas).

El sesgo cognitivo y los prejuicios están presentes en todo lo que hacemos, también en los datos que recopilamos y en los que basamos nuestras acciones de marketing. Ya que ahora se vienen los movimientos de adaptación al RGPD, ¿por qué no implementar también protocolos que eviten visiones parciales de los datos y en las conclusiones que inferimos de ellos, como propone este artículo de Lisa Lacy en AdWeek?

Los sesgos no solo afectan a las marcas que cuentan con grandes soluciones de business intelligence. Afectan a las pymes que no investigan y que se ciñen a su experiencia y también a las marcas con un presupuesto de investigación más moderado. Y por cierto: van más allá de un problema ideológico o de diversidad. ¡Sigue leyendo!

Riesgos de los sesgos de datos en marketing

Unos datos sesgados pueden hacerte tomar decisiones incorrectas sobre tu público: ya sea por falsas, por no ser del todo rigurosas o por ser descaradamente optimistas. En estos casos, aunque datos en mano, ese plan del que usted me habla tenía que funcionar, terminarás viéndote como cierto presidente, que dijo “quien me ha impedido cumplir mi programa electoral es la realidad”.

Demasiado a menudo, todo lo que no sabemos se completa con asunciones y prejuicios y eso cimienta errores y ensancha brechas. Debido a esto, muchos buyer persona están tremendamente idealizados y muchos modelos prevén ratios de conversión significativamente más altos y luego eso no se cumple, porque los consumidores son entes complejos y los datos que tenemos solo nos explican una parte de ellos… Por obvio que parezca, siempre es bueno recordarlo: la realidad no tiene por qué encajar en la idea que nos hemos hecho de sus hábitos y preferencias a partir de datos insuficientes.

¿Cómo se generan los sesgos en el procesado de datos?

El problema es que no solo la falta de exaustividad genera sesgos: hay variables que también los crean. A veces, el género, la edad o el nivel de formación no solo no son demasiado relevantes para la investigación sino que realizar cálculos con ellos da lugar a proyecciones sesgadas, porque son datos que reflejan desajustes sistémicos.

Los datos de mala calidad terminan perpetuando estereotipos

Por ejemplo: que las mujeres compran menos electrónica o que los jóvenes tienen más problemas financieros. Las desigualdades existen. Otra cosa es, ¿hasta qué punto debe reproducirlas el marketing? Si partimos de datos sesgados, las previsiones que hagamos o las segmentaciones en marketing digital solo harán que amplificar estos desajustes y probablemente con repercusiones directas en nuestra estrategia.

Pero la importancia de recabar datos de calidad va mucho más allá: como ya hemos comentado, luego los sesgos de los análisis se transmiten a los sistema de big data y machine learning que terminan resultando pobres a nivel de inclusión o diversidad. Para muestra un botón… o un sensor.

Obviamente es ilegal recopilar datos como el color de piel pero este ejemplo del dispensador de jabón refleja los test de producto se han hecho con un rango de datos insuficiente (pongamos que hacía falta más variedad de brillos de la piel).

El vínculo entre prejuicios y sesgos en tratamiento de datos

Según Ikechi Okoronkwo, científico de marketing en Mindshare, un sesgo proviene de todo aquello que damos por hecho y que termina influyendo el resultado final. Y es complicado de percibirlo como un error: con los datos en la mano, un estudio de mercado podría sugerir que una marca debería dirigirse a un target más adulto porque parece que la posibilidad de compra se correlaciona con la edad. Aunque lo que va vinculado a la edad es un mayor nivel de ingresos que a su vez también mejora la tasa de conversión. Así pues, lo que ampliaría las perspectivas de la marca es dirigirse a clientes más adinerados (sin hacer hincapié en la edad) y hacerlo solo en los de un cierto segmento demográfico le quita posibilidades y sigue normalizando una desigualdad económica.

Sin embargo, es posible reducir el sesgo de los modelos de procesamiento de los datos.

Todos los que trabajamos en estrategia tenemos una oportunidad de cambiar la forma en la que las marcas ven a los consumidores y de hecho, al hacerlo estamos consiguiendo nuevos puntos de vista que suponen una ventaja de negocio. Okoronkwo recomienda lo siguiente:

  • Tener en cuenta el contexto del que salen los datos y la metodología empleada en recogerlos. ¿Hay un entrevistador que interpreta las respuestas o es el sujeto el que interpreta las preguntas y responde directamente a ellas? Así conoceremos las carencias de la base de datos y sabremos qué tipo de conclusiones no podremos aceptar con seguridad.
  • Ser transparentes en las hipótesis: una investigación debe partir de una hipótesis a validar, sino es como si cualquier conclusión nos resultara válida. Por ello, es bueno discutir qué se busca y que quede por escrito. A veces con los famosos tests A/B, se nos olvida que en realidad no estamos respondiendo preguntas, sino midiendo la eficacia del color de un botón. La naturaleza fragmentaria de estos tests hace que, si inferimos algo de ellos, esté necesariamente sujeto a prejuicios. De hecho, una hipótesis tampoco queda validada con un solo cruce de variables.
  • Tener en cuenta las limitaciones de los datos y de la metodología: a menor cantidad de datos, más sesgo porque serán necesarias más asunciones basadas en prejuicios para completarlos o menos nivel de confianza tendrá el resultado final. «Tiramos con lo que hay» tiene limitaciones y si trabajamos con ellas, debemos ser muy conscientes.
  • Usar datos tranversales: que incluyan minorías y todos los segmentos representativos de la población, incluso no necesariamente de nuestro target… quizá nos llevamos alguna sorpresa.
  • Buscar datos de calidad: invertir en su recogida, asegurarse de trabajar con profesionales de la investigación y que los protocolos queden claros. Una buena base de datos es un buen antídoto contra los sesgos.
  • Detectar los propios prejuicios. Sabiendo qué piensas serás más consciente y evitarás usar solo los datos que respalden tu hipótesis. En investigación científica se suelen usar los estudios a doble ciego para evitar esto. En la investigación de mercados es mucho más complicado, pero no está prohibido modificar el sistema de recogida de datos.
  • Evita cuestionarios con preguntas que induzcan respuestas. ¿Básico, no?
  • Asegúrate de entender el mecanismo por el que tratarás de inferir conclusiones de esos datos. Puedes buscar una correlación pero ¿entiendes que una correlación no implica causalidad? Cruza distintas variables siempre para comprender cómo es la relación entre ellas.

Aplicar el sentido común y el método científico

Cuestionar las asunciones y los resultados es un hábito sano que proviene del método científico, ese conjunto de normas que deberíamos tener presente aunque no andemos entre probetas.

Al final, el método científico está inspirado por la curiosidad y la capacidad crítica y sin esas dos cualidades no podríamos hacer bien nuestro trabajo. Sin un buen trabajo, no hay momento eureka, ni valor añadido para nuestros clientes.

 

 

Oscar

Author Oscar

More posts by Oscar