En 1985 comenzó todo. Microsoft lanzó al mercado una nueva herramienta que revolucionaría la manera de operar de las empresas, les permitiría recopilar, organizar y entender su información mejor que antes y daría lugar a una nueva disciplina llamada analítica empresarial. Sabes de que estamos hablando, ¿no? Pues más ni menos que del famoso Excel.
Los siguientes treinta (y pico) años sirvieron para evolucionar exponencialmente todo esto y el análisis de datos, de la mano de los grandes avances de la tecnología y la informática, se ha convertido en un arma muy potente para los negocios con los que conocer mejor el comportamiento de sus clientes o diferenciarse de la competencia. Por ello, hoy en día ya no se puede hablar de crecimiento, optimización o diferenciación si no hablamos del uso de los datos dentro de las empresas.
En definitiva, el Data Analytics llegó para quedarse y no para (ni va a parar) de crecer. Es por ello por lo que han surgido nuevos profesionales que dominan este campo y son capaces de entender los datos y extraer valor de los mismos. Sin embargo, a medida que el sector y la tecnología avanza, la cuestión se vuelve cada vez más complicada ya que existen numerosos perfiles y expertos que parece que todos hacen lo mismo. Esto ocurre por ejemplo con los científicos y los analistas de datos. Tanto si eres un estudiante que está decidiendo qué carrera va a elegir o un empresario que quiere contratar a alguien con talento en el campo de los datos, la pregunta de cuál es la diferencia entre un científico y un analista de datos muy común. Porque… ¿Quién es quién? ¿Quién hace qué? ¿No se ocupan ambos de trabajar con ordenadores, números, algoritmos, matemáticas, estadística y tablas sin parar? Bueno, eso es un poco verdad. Pero la realidad es que ambos son dos perfiles muy distintos y en este artículo vamos a conocer sus diferencias.
El término Data Scientist surgió oficialmente en la última década (o incluso menos) pero eso no significa que nadie estuviera haciendo un trabajo similar hace más de diez años o que no exista un Data Scientist con más experiencia.
Por ejemplo, muchos de los que empezaron en campos como la estadística, las ciencias actuariales o la analítica cuantitativa están sin duda realizando trabajos que se solapan con los científicos de datos actuales, y algunos incluso han dado el salto completo al Data Science. Del mismo modo, estos también pueden tener formación en áreas de estudio como la informática y muchos (aproximadamente la mitad), tienen títulos de doctorado. Hoy en día, y cada vez más, se tiene mucho en cuenta el “papel” de los cursos de ciencia o de educación de datos y si eso califica a alguien como analista o científico de datos en sí mismo, aunque haya personas que lleven dedicándose a lo mismo durante años.
En el caso de los analistas pueden tener o no una educación formal como tal y abarcan diversas áreas de estudio y especialización: desde negocios y finanzas, hasta una formación en artes liberales.
Pero la delimitación se complica todavía más con el ascenso del llamado "científico de datos ciudadano" que parece fusionar los dos mundos.
Entonces, ¿se trata de un área específica de estudio o el aprendizaje de una habilidad empuja a un analista de datos a ser científico de datos? ¿O es al revés por falta de conocimientos en un área concreta? Pues no, sobre todo teniendo en cuenta que cierta experiencia o habilidad (para uno u otro) pueden ser importantes en el papel en una empresa o en una industria, pero no en otra.
Una de las características más comunes que se utilizan para distinguir a los científicos de datos y a los analistas de datos es que los primeros son técnicos y los analistas de datos no. Y aunque es cierto que, en general, los científicos de datos probablemente sean más competentes en entornos de codificación, hay muchos analistas de datos que también son técnicos y se sienten cómodos con ese lenguaje.
Algo importante que hay que destacar es que los Data Scientists que tienen todas las habilidades técnicas del mundo no van a servir de nada en las empresas si no tienen también skills de comunicación y / o visión de negocio, es decir, la capacidad de conectar con los que conocen mejor el negocio con el fin de utilizar realmente esas aptitudes técnicas para proporcionar un impacto real.
Con el auge del aprendizaje automático, los analistas de datos y otros perfiles que carecen de conocimientos profundos de Machine Learning y estadística, se están poniendo las pilas para poder ampliar su utilidad en la cadena de datos. Pero estos avances tampoco dejarán obsoletos a los científicos de datos. Sus capacidades en torno a la interpretabilidad del aprendizaje automático y el mantenimiento de los modelos son generalmente áreas que los analistas de datos o de negocios no poseen.
Y si hablamos de habilidades comunes para los dos perfiles, simplemente cabe mencionar la limpieza y exploración de datos, ya que son probablemente las únicas dos (junto con la capacidad de cuestionar los datos y vincular los proyectos de Data a las necesidades del negocio) que son fundamentales tanto para los científicos de datos como para los analistas. Esto es así ya que la mayor parte de los proyectos de datos consisten en poner la información de forma adecuada (es decir, la fase de la preparación, que es la que ocupa más tiempo) para después poder aplicar el aprendizaje automático (o cualquiera que sea el objetivo final), por lo que esas dos capacidades se convierten la piedra angular de ambos puestos.
Las empresas que deseen contratar a uno de los dos puestos deben analizar críticamente a su personal actual, sus necesidades y el objetivo final del equipo de datos o de los proyectos de datos. Contratar a alguien que, en última instancia, producirá cuadros de mando para uso interno necesitará un conjunto de habilidades totalmente diferentes al de alguien cuyo KPI es poner en producción un modelo de detección de fraude basado en el aprendizaje automático.
Unas herramientas adecuadas también pueden elevar el nivel del personal, haciéndolo más eficiente y productivo, ya sea un científico de datos o un analista de datos. Por ejemplo, una plataforma de ciencia de datos, aprendizaje automático o IA puede ayudar a los empresarios a trabajar con los analistas de datos, a los analistas a trabajar con los científicos de datos y, para cerrar el círculo, a los científicos de datos con los ingenieros de TI o de datos.
En última instancia, al igual que la educación, está claro que las habilidades necesarias para ser un científico de datos frente a un analista de datos no son blancas o negras. Hay mucho solapamiento entre los dos perfiles y en función de las necesidades y los objetivos de cada empresa, se valorará cuál de los dos encaja más en ese caso concreto.