Seguramente hayas escuchado hablar mucho de Machine Learning en artículos, noticias, eventos... ¿Pero sabes realmente lo que es? ¿Tendrá algo que ver con Transformers, Terminator o los robots a los que perseguía Will Smith en la peli "Yo robot"? Dentro de cualquier película de ficción casi siempre hay conexiones con el mundo real, por lo que los robots de Will Smith podrían asemejarse a lo que hoy en día consideramos Machine Learning como tal. Lo que daba vida a estos robots era algo parecido a un algoritmo de Inteligencia Artificial que aprendía de manera automática. Volviendo al mundo real y a cómo las organizaciones están sacando partido a esta tecnología, te lo contamos todo en las próximas líneas. ¡Sigue leyendo!
Antes de responder a esa cuestión, intenta contestar lo siguiente: ¿qué es un árbol? Probablemente te resulte difícil definirlo, sin embargo, todos sabemos distinguir un árbol de cualquier otro objeto. Pero... ¿cómo lo hemos aprendido? No por su definición, sino a través de observaciones, desde nuestra infancia. Y es que el ser humano posee mucho más conocimiento del que consigue expresar. De igual forma, el Machine Learning (ML) permite que las máquinas aprendan y actúen como lo hacen los seres humanos, o incluso mejor. A través de datos e información en forma de observaciones, los algoritmos de ML se “entrenan”, y son capaces de aprender a lo largo del tiempo de una forma autónoma.
El Machine Learning o el Aprendizaje Automático es una de las disciplinas de la Inteligencia Artificial que, a través de técnicas estadísticas, dota a una máquina o a un sistema informático de la capacidad de aprender por sí solo.
No pienses que el Machine Learning solo funciona con robots, éste va mucho más allá, y lo utilizamos en nuestro día a día, aunque a veces no seamos conscientes. Los algoritmos de ML están presentes en muchos sectores, como, por ejemplo:
En el sector industrial, ayudando a predecir fallos de maquinaria (impulsado por IA y sin necesidad de entrenamiento de sus algoritmos)
En el mundo del marketing, segmentando a los usuarios
En la industria del entretenimiento, como las plataformas de streaming generando recomendaciones personalizadas
En el sector financiero, identificando a los clientes más propensos a contratar determinados productos o pronosticar el riesgo de una operación
Antes de profundizar en el concepto de Machine Learning, debemos comprender qué son los algoritmos y qué tienen que ver con toda esta historia. Un algoritmo es un conjunto de operaciones e instrucciones que resuelven un determinado problema. En el Machine Learning, los algoritmos recurren a datos históricos y permiten generar predicciones o realizar agrupaciones. Gracias a estos algoritmos, es posible implementar modelos y obtener la información necesaria para la toma de decisiones, minimizando la intervención humana. Los algoritmos de ML son capaces de analizar grandes volúmenes de datos y encontrar patrones, lo que para los seres humanos resulta prácticamente imposible. Por ejemplo, imagina una empresa con un millón de clientes, de los cuales se dispone de decenas de características (edad, sexo, variables sociodemográficas, hábitos de compra, etc.). Los algoritmos de ML permiten encontrar las variables más relevantes para, por ejemplo, predecir qué clientes se darán de baja de un producto o servicio, basándose en otros usuarios que ya abandonaron en el pasado y en las características que estos tenían.
La gran mayoría de las empresas tienen a su disposición soluciones avanzadas para analizar sus datos y prever qué pasará en su negocio en los próximos años, meses, o incluso días. Sin lugar a dudas, el análisis predictivo ha cambiado las reglas del juego. El análisis predictivo basado en Machine Learning resulta muy útil para satisfacer las necesidades de la mayoría de los negocios, y ha cambiado de forma definitiva la competitividad de las empresas. Diversos sectores como el del entretenimiento, media, retail y el bancario, entre otros, utilizan la analítica predictiva para conocer y predecir el comportamiento de sus clientes. Esto les permite adaptar su portfolio, optimizar los precios, conocer la percepción que existe hacia su marca, optimizar su productividad, prevenir el fraude...logrando así insights de valor para ayudarles en la toma de decisiones.
Los modelos de Machine Learning podríamos organizarlos en tres grandes categorías: aprendizaje supervisado, aprendizaje no supervisado y aprendizaje por refuerzo.
Los modelos de aprendizaje supervisado se caracterizan por aprender de un conjunto histórico de datos previamente etiquetados, intentando encontrar una función que, dadas las variables de entrada, les asigne una etiqueta de salida adecuada. Dentro de los modelos de aprendizaje supervisado destacamos los modelos de clasificación y los de regresión:
Los modelos de clasificación permiten diferenciar categorías con respecto a unos valores y datos de entrada, por ejemplo, si un email es spam (clasificación binaria), o si una fotografía contiene coches, personas u otros objetos (clasificación multiclase).
Para entrenar un modelo de clasificación, es necesario disponer de bastantes datos de entrada etiquetados, y la predicción puede ser la propia clase, o la probabilidad de pertenencia a una de las clases (por ejemplo, 95% de probabilidad de ser un coche o de abandonar un servicio).
Los casos de uso más comunes basados en Modelos de Clasificación son:
Churn Rate o Propensión al abandono: detecta los patrones o causas comunes que causan el abandono de un cliente que decide finalizar un contrato con una operadora de telefonía o con un banco por ejemplo.
Detección de clientes de alto valor: el uso de estos algoritmos nos ayuda a entender en profundidad a los clientes. Basándose en las transacciones históricas con la compañía, se puede predecir el valor económico que aportará ese cliente a lo largo de su relación con la empresa. Es decir, el Customer Lifetime Value, lo que ayuda a visualizar quiénes son los clientes más importantes y de mayor valor.
Cross Selling: de cara a vender productos y servicios complementarios a los clientes existentes. Los hoteles lo aplican muy a menudo, en la venta del parking a un huésped que además tiene otras opciones de parking en la zona.
Up Selling: vender productos y servicios de alto valor que supongan un mayor ingreso para la compañía.
Credit Scoring: este caso de uso predice la probabilidad que hay de impago y riesgo por parte de cada cliente.
NBO (Next Best Offer): garantizan una oferta totalmente personalizada, en el momento, precio y canal más adecuado. Se basan en modelos de filtrado colaborativo partiendo de la premisa de “observar” los patrones de compra y establecer relaciones entre los clientes según comportamientos similares.
NBA (Next Best Action): tras evaluar los patrones de comportamiento pasados y actuales, sus intereses y necesidades, llevaremos a cabo la mejor acción posible que sea relevante para nuestro cliente.
Dado que quieren ser tratados como individuos y no como segmentos o grupos demográficos, hay que analizar al máximo sus datos para poder generar ofertas, acciones o experiencias individualizadas en el momento oportuno. Este tipo de modelo predictivo también nos ayuda a corregir y evitar errores que pueden hacernos perder a potenciales clientes. Supongamos que un cliente no suele convertir cuando a las tiendas físicas si no que prefiere realizar la conversión de manera online desde su hogar. Hacer una oferta en este momento podría ser percibido como algo negativo por el consumidor, por ello, los modelos NBA nos ayudan a entender las circunstancias y comportamientos de nuestros clientes para poder conectar con ellos de la manera más relevante posible.
Los Modelos de Regresión son capaces de predecir un valor numérico a partir de las características de los datos de entrada. Por ejemplo, es posible entrenar un modelo de regresión para predecir el precio de un inmueble, utilizando características como el número de habitaciones, tamaño, y zona en la que se ubica una casa o apartamento. A diferencia de los modelos de clasificación, donde la salida se asocia a una categoría discreta (por ejemplo, precio alto o bajo), los modelos de regresión devuelven un valor continuo (por ejemplo, 130.000€).
Referencia imagen: Consultor TIC
A diferencia del Aprendizaje Supervisado, en el Aprendizaje No Supervisado se utilizan datos sin etiquetas para el entrenamiento. Por ello, no existen datos de salida que correspondan con un determinado input.
Este tipo de aprendizaje es de carácter exploratorio ya que solo podemos describir la estructura que tienen los datos y tratar de organizarlos para simplificar el análisis. Por ejemplo, en los modelos de clustering que veremos a continuación se espera encontrar conjunto de datos con características similares entre sí.
Dentro de los modelos de Aprendizaje no Supervisado destacamos los modelos de Clustering y los de reducción de la dimensionalidad.
El clustering debe responder a preguntas como: ¿qué les hace parecidos? O, ¿qué los diferencia de otros grupos?
El clustering es una técnica exploratoria de análisis de datos que consiste en obtener grupos (o clusters) de objetos que tengan características similares. Esta separación permite analizar cuáles son las características comunes a los objetos que pertenecen a un mismo grupo.
Referencia imagen: Dataiku
Mientras que la segmentación se encarga de agrupar elementos con características preestablecidas, el Clustering agrupa los elementos en base a los diferentes patrones de comportamiento como podrían ser los hábitos de consumo. Ambos tienen un punto en común: tanto la segmentación como el clustering tienen el propósito de crear grupos lo más similares posibles y que se diferencien de forma significativa con respecto a los demás grupos.
Otra técnica de Aprendizaje No Supervisado es la Reducción de Dimensionalidad. Muy a menudo se trabaja con datos en los que cada observación presenta un alto número de características, es decir, tiene una alta dimensionalidad. Este hecho es un reto para la capacidad de procesamiento y el rendimiento computacional de los algoritmos de Machine Learning. En general, cuantas más variables de entrada tengamos, existirá más ruido y necesitaremos un mayor número de observaciones para conseguir un modelo útil y aplicable. Aquí es donde entra en juego la reducción de la dimensionalidad: gracias a esta técnica se consigue mitigar tal efecto. Entre los beneficios de la reducción de dimensionalidad destacamos:
Identificar y eliminar las variables irrelevantes. No siempre el mejor modelo es el que más variables tiene, lo importante es tener en cuenta las variables que aportan valor.
Mejorar el desempeño de los algoritmos con menor cantidad de dimensiones.
Reducir la complejidad de los datos, resultando más fácil la comprensión de los modelos y de sus resultados.
Cuando ves a esos perros tan educados y obedientes, quizás no te des cuenta del esfuerzo que hay por detrás para adiestrarlos. Para un adiestrador, su mayor reto es ser capaz de enseñar a un perro a reproducir comportamientos. En el mundo de ML esto es parecido, solo que se adiestran máquinas.
El Aprendizaje por Refuerzo (o Reinforcement Learning) es un método de entrenamiento de aprendizaje automático basado en recompensar los comportamientos esperados y/o penalizar los no deseados para alcanzar un objetivo determinado. Aunque estos algoritmos existen desde hace décadas, hoy en día tenemos el poder de aplicarlos a mayor escala en un menor espacio de tiempo.
Referencia imagen: Web Aprende Machine Learning en Español
Estos son algunos ejemplos prácticos de algoritmos de Aprendizaje por Refuerzo:
Juegos: es el algoritmo convencional que se aplica para resolver diferentes juegos y, muy a menudo, conseguir un rendimiento sobrehumano, como por ejemplo el ajedrez y los videojuegos.
Configuración de sistemas web: el proceso de ajuste de los parámetros requiere un operador calificado y varias pruebas de seguimiento y error, mediante parámetros configurables en un sistema web.
Sector de automoción: un ejemplo de aprendizaje por refuerzo en el sector de la automoción es el de los coches autónomos, en que un vehículo autónomo como el Tesla recoge datos sobre el tráfico, como el tipo de carretera o señales de tráfico gracias al uso de sensores en el vehículo.
En definitiva, el Machine Learning ha llegado no solo para quedarse, si no para ser uno de los grandes protagonistas del mercado y del mundo Analytics. Las organizaciones que están aplicando diferentes casos de uso de ML, analítica predictiva e incluso de IA, están obteniendo una visión más clara de lo que está pasando actualmente y prediciendo qué va a pasar. Por ello, se están posicionando como players de alta competitividad en sus respectivos sectores, están mejorando su compañía y conectando mejor con sus clientes.