¿Cuándo dar a los empleados acceso a datos y análisis?

A medida que los líderes empresariales buscan aprovechar al máximo sus inversiones en análisis, la ciencia de datos democratizada a menudo ofrece la solución perfecta. El uso de software de análisis con herramientas sin código y de bajo código puede poner las técnicas de ciencia de datos al alcance de prácticamente cualquier persona. En los mejores escenarios, esto conduce a una mejor toma de decisiones y una mayor autosuficiencia y autoservicio en el análisis de datos, especialmente porque la demanda de científicos de datos supera con creces su oferta. Agregue a eso costos de talento reducidos (con menos científicos de datos de alto costo) y una mayor personalización para adaptar los análisis a las necesidades y contextos comerciales específicos.

Sin embargo, en medio de toda la discusión sobre si y cómo democratizar la ciencia y el análisis de datos, se ha pasado por alto un punto importante. La conversación debe ser definida. cuando democratizar los datos y el análisis, incluso hasta el punto de redefinir lo que debería significar la democratización.

La ciencia y el análisis de datos completamente democratizados presentan muchos riesgos. Como escribieron Reid Blackman y Tamara Sipes en un artículo reciente, la ciencia de datos es difícil y un “experto” no capacitado no necesariamente puede resolver problemas difíciles, incluso con un buen software. La facilidad de hacer clic en un botón que produce resultados no garantiza que la respuesta sea buena; de hecho, podría tener muchos defectos y solo un científico de datos capacitado lo sabría.

Es solo cuestión de tiempo

Sin embargo, incluso con estas reservas, la democratización de la ciencia de datos está por verse, como lo demuestra la proliferación de software y herramientas de análisis. Thomas Redmayne y Thomas Davenport se encuentran entre los que abogan por el desarrollo de “científicos de datos ciudadanos”, incluso probando las habilidades y capacidades básicas de la ciencia de datos en cada puesto de contratación.

Sin embargo, la democratización de la ciencia de datos no debe llevarse al extremo. La analítica no tiene que estar en manos de todos para que una organización prospere. ¿Cuántas personas terriblemente talentosas no serán contratadas solo porque no tienen “habilidades básicas en ciencia de datos”? Es poco realista y demasiado restrictivo.

A medida que los líderes empresariales buscan democratizar los datos y el análisis en sus organizaciones, la verdadera pregunta que deben hacerse es “cuándo” tiene más sentido. Esto comienza con el reconocimiento de que no todos los “ciudadanos” en una organización tienen el conjunto de habilidades relativo para ser un ciudadano científico de datos. Como me dijo Nick Elprin, director ejecutivo y cofundador de Domino Data Labs, que proporciona a las organizaciones herramientas de ciencia de datos y aprendizaje automático; superficie.”

El reto de democratizar los datos

Considere una cadena de supermercados que recientemente usó técnicas avanzadas de pronóstico para planificar su demanda correctamente, tratando de evitar tener demasiado inventario (lo que resulta en el deterioro) o muy poco (lo que resulta en la pérdida de ventas). Las pérdidas por deterioro e inventario no eran grandes, pero el problema de reducirlas era muy difícil de resolver, teniendo en cuenta todas las variables de demanda, estacionalidad y comportamiento del consumidor. La complejidad del problema significaba que la cadena de supermercados no podía dejar que los científicos de datos ciudadanos lo descifraran, sino que recurría a un equipo de científicos de datos concienzudos y bien capacitados.

La ciudadanía de datos requiere una “democracia representativa”, como hemos discutido Elprin y yo. Así como los ciudadanos estadounidenses eligen a políticos para que los representen en el Congreso (presumiblemente para representar sus intereses en asuntos legislativos), las organizaciones necesitan la representación adecuada de científicos y analistas de datos para opinar sobre temas en los que otros simplemente carecen de experiencia. dirigirse

En definitiva, es saber cuándo y en qué medida democratizar los datos. Propongo los siguientes cinco criterios.

Piense en el nivel de habilidad del “ciudadano”. El ciudadano científico de datos, de alguna forma, llegó para quedarse. Como se mencionó anteriormente, simplemente no hay suficientes científicos de datos para todos, y usar este escaso talento para resolver todos los problemas de datos no es sostenible. Más precisamente, la democratización de los datos es clave para inculcar el pensamiento analítico en una organización. Un ejemplo bien conocido es Coca-Cola, que ha creado una academia digital para capacitar a gerentes y líderes de equipo, produciendo graduados del programa que están asignados a casi 20 iniciativas digitales, de automatización y analíticas en los sitios de fabricación de la empresa. .

Sin embargo, cuando se trata de modelos predictivos y análisis de datos avanzados que pueden cambiar fundamentalmente la forma en que opera una empresa, es importante considerar el nivel de habilidad del “ciudadano”. Una herramienta sofisticada en manos de un científico de datos es aditiva y valiosa; la misma herramienta en manos de alguien que simplemente “juega con los datos” puede conducir a errores, suposiciones incorrectas, resultados cuestionables y mala interpretación de resultados y conclusiones.

Medir la importancia del problema. Cuanto más importante es el problema para la empresa, más imperativo es contar con un experto en análisis de datos. Por ejemplo, la creación de un gráfico simple de tendencias de compra históricas probablemente pueda ser realizada por alguien con un tablero que muestre los datos de una manera visualmente atractiva. Pero una decisión estratégica que tiene un impacto significativo en las operaciones de una empresa requiere experiencia y precisión confiable. Por ejemplo, cuánto debe cobrar una compañía de seguros por una póliza es tan profundamente fundamental para el modelo de negocio en sí mismo que sería imprudente dejar esta tarea a un no experto.

Determinar la complejidad del problema. Resolver problemas complejos está más allá de las capacidades del ciudadano científico de datos típico. Considere la diferencia entre comparar los puntajes de satisfacción del cliente entre segmentos de clientes (métricas simples, bien definidas y de bajo riesgo) y usar el aprendizaje profundo para detectar el cáncer en un paciente (complejo y de alto riesgo). Tal complejidad no puede dejarse en manos del profano para que tome decisiones precipitadas, y posiblemente equivocadas. Cuando la complejidad y las apuestas son bajas, la democratización de los datos tiene sentido.

Un ejemplo es una empresa Fortune 500 con la que trabajo que utiliza datos en todas sus operaciones. Hace algunos años, realicé un programa de capacitación en el que más de 4500 gerentes se dividieron en pequeños equipos, a cada uno de los cuales se le pidió que formulara un problema comercial importante que pudiera resolverse mediante análisis. Los equipos estaban capacitados para resolver problemas simples con herramientas de software fácilmente disponibles, pero la mayoría de los problemas surgieron precisamente porque eran difíciles de resolver. Es importante destacar que estos gerentes fueron No comprometido a resolver realmente esos problemas complejos, sino más bien a colaborar con el equipo de ciencia de datos. En particular, estos 1000 equipos identificaron no menos de 1000 oportunidades comerciales y 1000 formas en que el análisis podría ayudar a la organización.

Empoderar a aquellos con experiencia en el dominio. Si una empresa está buscando algún tipo de información “dirigida” (es más probable que el cliente X compre un producto que el cliente Y), entonces la democratización de los datos y la ciencia de datos de los ciudadanos de nivel inferior probablemente serán suficientes. De hecho, estos tipos de análisis de nivel inferior pueden ser una excelente manera de empoderar a aquellos con experiencia en el dominio (es decir, estar más cerca de los clientes) con algunas herramientas de datos simples. Una mayor precisión (por ejemplo, en problemas complejos y de alto riesgo) requiere experiencia.

El caso más convincente para la precisión es cuando hay decisiones de alto riesgo que deben tomarse en función de algún umbral. Si, por ejemplo, un plan de tratamiento agresivo contra el cáncer tiene una probabilidad superior al 30 % de cáncer con efectos secundarios significativos, sería importante distinguir entre el 29,9 % y el 30,1 %. La precisión es especialmente importante para la medicina, las operaciones clínicas, las operaciones técnicas y las instituciones financieras que navegan por los mercados y los riesgos, a menudo para capturar márgenes muy reducidos.

Desafía a los expertos por parcialidad. Los análisis avanzados y la IA pueden conducir fácilmente a decisiones que se consideran “sesgadas”. Esto es difícil en parte porque el objetivo del análisis es discriminar, es decir, basar elecciones y decisiones en ciertas variables. (Envíe esta oferta a este hombre mayor, pero no a esta mujer más joven, porque creemos que mostrarán un comportamiento de compra diferente en respuesta). Entonces, la gran pregunta es cuándo este tipo de discriminación es realmente aceptable e incluso aceptable, y cuándo es esencialmente? problemático, injusto y peligroso para la reputación de la empresa.

Considere el ejemplo de Goldman Sachs, que fue acusado de discriminación al ofrecer menos crédito a las mujeres que a los hombres en una tarjeta de crédito de Apple. En respuesta, Goldman Sachs dijo que no utilizó el género en su modelo, solo factores como el historial crediticio y los ingresos. Sin embargo, se podría argumentar que el historial crediticio y los ingresos están correlacionados con el género, y el uso de estas variables penaliza a las mujeres, que tienden a ganar menos dinero en promedio e históricamente han tenido menos oportunidades de generar crédito. Los tomadores de decisiones y los profesionales de datos deben comprender cómo se generan los datos y cómo se relacionan, y cómo medir cosas como el trato diferencial y mucho más. Una empresa nunca debe arriesgar su reputación haciendo que un ciudadano científico de datos decida solo si un modelo está sesgado.

Democratizar los datos tiene sus méritos, pero conlleva desafíos. Darles a todos las claves no los convierte en expertos, y recoger las ideas equivocadas puede ser desastroso. Las nuevas herramientas de software pueden permitir que cualquier persona use datos, pero no confunda ese amplio acceso con verdadera experiencia.

Leave a Comment