Científicos de Datos: el eje del negocio

Definición de un Científico de Datos - Marcelo Lozano
Definición de un Científico de Datos - Marcelo Lozano

Los científicos de datos siguen teniendo una gran demanda en el mercado, la información es valor y la gran mayoría no sabe como extraerlo.

Cuando las organizaciones explotar las capacidades de los científicos de datos y comiencen a capitalizar completamente el uso de sus activos de datos internos y examinen la integración de cientos de fuentes de datos de terceros, el papel del científico de datos seguirá siendo central para el negocio.

En el pasado, los equipos responsables de los datos eran relegados a las trastiendas de la organización de TI, realizando las tareas críticas de la base de datos para mantener alimentados los diversos sistemas corporativos con el ‘combustible’ de datos que permitía a los ejecutivos corporativos informar las operaciones actividades y entregar resultados financieros.

Este rol es importante, pero las estrellas emergentes del negocio son los expertos científicos en datos que tienen la capacidad no solo de manipular grandes cantidades de datos con sofisticadas técnicas estadísticas y de visualización, sino que también tienen una perspicacia sólida desde la cual pueden derivar perspectivas progresistas. Estas ideas ayudan a predecir posibles resultados y mitigar posibles amenazas para el negocio.

Entonces, ¿qué se necesita para ser genio de la ciencia de datos? Aquí hay algunos atributos y habilidades importantes, según los líderes de TI, los analistas de la industria, los científicos de datos y otros.

 Pensamiento crítico

Los científicos de datos deben ser pensadores críticos, para poder aplicar un análisis objetivo de los hechos sobre un tema o problema determinado antes de formular opiniones o emitir juicios.

Deben entender el problema comercial o la decisión que se toma y ser capaces de ‘modelar’ o ‘abstraer’ lo que es crítico para resolver el problema, frente a lo que es extraño y puede ignorarse.

Esta habilidad más que cualquier otra cosa determina el éxito de un científico de datos.

Un científico de datos necesita tener experiencia, pero también tener la capacidad de suspender sus creencias, que proporciona una plataforma de marketing basada en la nube.

Este rasgo capta la idea de saber qué esperar cuando se trabaja en cualquier área, pero también sabe que la experiencia y la intuición son imperfectas. La experiencia proporciona beneficios, pero no está exenta de riesgos si nos volvemos demasiado complacientes. Aquí es donde el suspenso de la creencia es importante.

No se trata de mirar las cosas con los ojos abiertos de un novato, sino que da un paso atrás y es capaz de evaluar un problema o situación desde múltiples puntos de vista.

Codificación Los científicos de datos de primer nivel saben cómo escribir códigos y se sienten cómodos manejando una variedad de tareas de programación.

Nuevos Lenguajes

El lenguaje de elección en la ciencia de datos se está moviendo hacia Python, con un seguimiento sustancial para R también, hay otros idiomas en uso como Scala, Clojure, Java y Octave.

Para tener realmente éxito como científico de datos, las habilidades de programación deben comprender ambos aspectos computacionales:

tratar con grandes volúmenes de datos, trabajar con datos en tiempo real, computación en la nube, datos no estructurados, así como aspectos estadísticos, y trabajando con modelos estadísticos como regresión, optimización, clustering, árboles de decisión, bosques aleatorios.

El impacto del big data que comenzó a fines de la década de 1990 ha exigido que cada vez más científicos comprendan y sean capaces de codificar en lenguajes como Python, C ++ o Java.

Si un científico de datos no entiende cómo codificar, ayuda estar rodeado de personas que sí lo hacen. Asociar a un desarrollador con un científico de datos puede ser muy fructífero.

La ciencia de datos matemáticos probablemente no sea una buena opción de carrera para las personas que no les gusta o no son competentes en matemáticas.

En nuestro trabajo con organizaciones globales, nos relacionamos con clientes que buscan desarrollar modelos financieros u operativos complejos.

Para que estos modelos sean estadísticamente relevantes, se requieren grandes volúmenes de datos.

El papel del científico de datos es aprovechar su profunda experiencia en matemáticas para desarrollar modelos estadísticos que puedan usarse para desarrollar o cambiar estrategias comerciales clave.

Matemáticas y Estadísticas, la clave

El genio de los científicos de datos es uno que sobresale en matemáticas y estadística, mientras que tiene la capacidad de colaborar estrechamente con ejecutivos de líneas de negocios para comunicar lo que está sucediendo realmente en la “caja negra” de ecuaciones complejas de una manera que proporciona reafirmación que la empresa puede confiar en los resultados y las recomendaciones.

El aprendizaje automático, el aprendizaje profundo, las industrias de inteligencia artificial se están moviendo extremadamente rápido en estas áreas debido a la mayor potencia de cómputo, la conectividad y los enormes volúmenes de datos que se recopilan. Un científico de datos necesita mantenerse al frente de la curva en la investigación, así como comprender qué tecnología aplicar cuando.

Demasiadas veces un científico de datos aplicará algo ‘sexy’ y nuevo, cuando el problema real que están resolviendo sea mucho menos complejo.

Los científicos de datos necesitan comprender en profundidad el problema a resolver, y los datos mismos hablarán a lo que se necesita.

Conocer el costo computacional del ecosistema, la capacidad de interpretación, la latencia, el ancho de banda y otras condiciones de contorno del sistema, así como también la madurez del cliente, ayuda al científico de datos a comprender qué tecnología aplicar.

Eso es cierto siempre que entiendan la tecnología

También son valiosas las habilidades estadísticas. La mayoría de los empleadores no consideran estas habilidades, porque las herramientas automatizadas y el software de código abierto de hoy en día están tan disponibles.

Sin embargo, comprender las estadísticas es una competencia crítica para comprender las suposiciones que hacen estas herramientas y software. No es suficiente entender las interfaces funcionales de los algoritmos de aprendizaje automático.

Para seleccionar el algoritmo apropiado para el trabajo, un científico de datos exitoso necesita comprender las estadísticas dentro de los métodos y las técnicas adecuadas de preparación de datos para maximizar el rendimiento general de cualquier modelo.

 Las habilidades en informática también son importantes

Debido a que la ciencia de datos se realiza principalmente en el teclado, los fundamentos sólidos de la ingeniería de software son útiles.

 Comunicación

La importancia de las habilidades de comunicación es repetitiva. Prácticamente nada en la tecnología de hoy se realiza en el vacío; siempre hay algo de integración entre sistemas, aplicaciones, datos y personas.

La ciencia de los datos no es diferente, y ser capaz de comunicarse con múltiples partes interesadas usando datos es un atributo clave.

La capacidad de contar historias a través de los datos traduce lo que es un resultado matemático en una visión o intervención accionable.

Al estar en la intersección de los negocios, la tecnología y los datos, los científicos de datos deben ser expertos en contar una historia a cada uno de los interesados.

Eso incluye comunicar los beneficios comerciales de los datos a los ejecutivos de negocios; sobre tecnología y recursos computacionales; sobre los desafíos con la calidad de los datos, la privacidad y la confidencialidad; y sobre otras áreas de interés para la organización.

Ser un buen comunicador incluye la capacidad de destilar información técnica desafiante en una forma completa, precisa y fácil de presentar. Un científico de datos debe recordar que su ejecución arroja resultados que pueden y serán utilizados para apoyar la acción direccional de la empresa.

Traductor de la realidad

Por lo tanto, ser capaz de garantizar que la audiencia entienda y aprecie todo lo que se les presenta, incluidos el problema, los datos, los criterios de éxito y los resultados, es primordial.

Un buen científico de datos debe tener el negocio La inteligencia y la curiosidad para entrevistar adecuadamente a las partes interesadas de la empresa para comprender el problema e identificar qué datos pueden ser relevantes.

Además, los científicos de datos deben ser capaces de explicar los algoritmos a los líderes empresariales.

Comunicar cómo un algoritmo llegó a una predicción es una habilidad crítica para ganar la confianza de los líderes en modelos predictivos que son parte de sus procesos comerciales.

 Arquitectura de datos

Es imperativo que el científico de datos comprenda lo que está sucediendo con los datos desde el inicio No entender la arquitectura puede tener un serio impacto en las inferencias y suposiciones del tamaño de la muestra, lo que a menudo lleva a resultados y decisiones incorrectos.

Aún peor, las cosas pueden cambiar dentro de la arquitectura. Sin entender su impacto en los modelos para empezar, un científico de datos podría terminar “en una tormenta de rehacer modelos o modelos repentinamente inexactos sin entender por qué”.

Mientras que Hadoop dio grandes datos al entregar el código a los datos y no viceversa, comprender las complejidades del flujo de datos o de la transferencia de datos es fundamental para asegurar una buena toma de decisiones basada en hechos.

 Análisis de riesgos, mejora de procesos, ingeniería de sistemas

Un científico de datos agudo necesita comprender los conceptos de análisis del riesgo empresarial. haciendo mejoras en los procesos, y cómo funciona la ingeniería de sistemas. Todos juegan de común acuerdo, tanto enfocados interiormente al científico de datos como exteriormente al cliente.

Interiormente, el científico de datos debería recordar la segunda mitad del título -científico- y seguir una buena teoría científica.

El desarrollo de análisis de riesgos al inicio del desarrollo del modelo puede mitigar los riesgos.

Exteriormente, estas son todas las habilidades que los científicos de datos requieren para sondear al cliente sobre el problema que están tratando de resolver.

Conectando el gasto con la mejora del proceso, comprendiendo los riesgos inherentes de la empresa y otros sistemas que pueden afectar los datos o el resultado.

Un modelo puede conducir a una mayor satisfacción del cliente con los esfuerzos del científico de datos.

 Resolución de problemas y buena intuición empresarial

En general, los rasgos que los grandes científicos de datos exhiben son los mismos rasgos que cualquier buen solucionador de problemas ofrece.

Miran el mundo desde muchas perspectivas, buscan entender lo que se supone que deben hacer antes de sacar todas las herramientas de su cinturón de herramientas, trabajan de una manera rigurosa y completa, y pueden explicar sin problemas los resultados de su trabajo.

Al evaluar a los profesionales de la tecnología para funciones tales como los científicos de datos.

El enfoque arroja muchos más éxitos que fracasos, y también asegura que el potencial de crecimiento se maximice porque el pensamiento crítico se pone al frente. Encontrar un gran científico de datos implica encontrar a alguien que tenga habilidades un tanto contradictorias: inteligencia para manejar el procesamiento de datos y crear modelos útiles; y una comprensión intuitiva del problema comercial que intentan resolver, la estructura y los matices de los datos, y cómo funcionan los modelos.

El primero de ellos es la más fácil de encontrar, la mayoría de las personas con buenas habilidades matemáticas y un título en matemáticas, estadística, ingeniería u otros temas basados ​​en la ciencia es probable que tengan el poder intelectual para hacerlo.

El segundo es mucho más difícil de encontrar. Alguien con esta profunda comprensión e intuición de lo que está haciendo es un verdadero experto en ciencia de datos, y probablemente tendrá una carrera exitosa en este campo.

Sígueme en Twitter

Sé el primero en comentar

Dejar una contestacion