Imagínate unos trillizos: físicamente resultan muy parecidos. Nuestra primera impresión es que son idénticos y, además, como algo muy típico de madres, van vestidos y peinados igual, lo que dificulta todavía más el asunto. El caso, no sabemos diferenciarlos y les intercambiamos los nombres constantemente porque no sabemos quién es quién. Los pobres están hartos porque por mucha relación y parecido que haya entre ellos, son personas completamente distintas.
En el mundo de los datos ocurre un poco lo mismo. Referirnos a la IA es cada vez más complejo porque a menudo se confunde con el Machine Learning o con el Deep Learning. ¿Por qué se utilizan estos términos de forma intercambiable y cuáles son las diferencias entre todos ellos? Esto ocurre porque son áreas sumamente cercanas y tienen cosas en común, pero a la vez son muy distintas entre sí.
A grandes rasgos, podríamos decir que el DL es un subconjunto del ML, que a su vez es un subconjunto de la IA. Este gráfico ayuda a entenderlo un poco mejor:
La Inteligencia Artificial es una disciplina dentro de las ciencias de la computación que desarrolla algoritmos que se encargan de procesar los datos resultantes del aprendizaje de experiencias previas. El funcionamiento es parecido al de nuestro cerebro: recibe estímulos y procesa esa información para generar conocimiento. Así, básicamente el propósito de la IA es crear máquinas que imiten las capacidades de los seres humanos.
A diferencia de otros sistemas informáticos, la inteligencia artificial no hay que programarla de manera específica para cada escenario. Podemos enseñarle cosas (Machine Learning) o puede aprender por sí misma (Deep Learning). Vamos a ver estos dos conceptos específicos a continuación.
Antes de la aparición del aprendizaje automático en los años 80, las reglas de decisión de las empresas eran, en su mayoría, conjuntos de instrucciones codificadas a mano y basadas en los conocimientos de los expertos empresariales. Con el Machine Learning, esas reglas surgen a partir de los datos recogidos previamente: la experiencia empresarial desempeña un papel fundamental en la configuración de esta ingeniería.
Básicamente, el experto de negocio tiene que determinar qué factores pueden influir en los resultados que se quieren predecir, y el algoritmo selecciona automáticamente la forma óptima de combinar esos factores. En otras palabras, se "entrena" un modelo. La pregunta clave es: basándome en mis datos, ¿cuál es la mejor regla que puedo crear para resolver mi problema de negocio?
Así, podemos definir al Machine Learning como una rama de la IA que cuenta con algoritmos capaces de aprender de forma automatizada, a través de un entrenamiento de sus modelos. Es un método de análisis de datos en el que esta inteligencia es capaz de entrenarse través de esos datos, identificar patrones y tomar decisiones sin intervención humana.
El Deep Learning es una forma de Machine Learning pero mucho más innovadora, algo así como su evolución. Un algoritmo de DL es capaz de encontrar patrones ocultos de los datos por sí mismo, combinarlos y construir reglas de decisión mucho más eficientes. Así, el gran valor del Deep Learning es esta capacidad de identificación automática de patrones.
Un sistema de DL está constantemente analizado datos, de una forma parecida a la de los humanos. Para ello, cuenta con capas de estructuras de algoritmos. Este tipo de algoritmos se llaman redes neuronales artificiales e intentan imitar la función de las neuronas de los seres humanos. Esto significa tratar problemas más complejos, como la comprensión de conceptos en imágenes, vídeos, textos, sonidos, series temporales y todos los datos no estructurados que podamos imaginar. Por supuesto, el manejo de datos más complejos implica algoritmos más complejos. Y para extraer patrones complejos lo suficientemente buenos, se necesitan muchos ejemplos (datos), muchos más que un modelo de ML. Por ello, se trata de un tipo de aprendizaje más avanzado que el Machine Learning.
Pero no te imagines al Deep Learning como un modelo que aprende por sí mismo y ya está. Al igual que un modelo de Machine Learning necesita supervisión, los algoritmos del DL siguen necesitando datos debidamente etiquetados, una evaluación de los resultados del modelo y, por supuesto, una evaluación del valor de negocio que aportará. La falta de datos etiquetados con precisión es una de las principales razones por las que el DL puede fallar, por muy avanzado e innovador que resulte.
Dado que esta ingeniería es realizada automáticamente por la máquina, la interpretación no es obvia ni fácil para un humano y las reglas de decisión del Deep Learning pueden ser rechazadas por los analistas de negocio. De hecho, la interpretación de los modelos de DL es uno de los mayores retos actuales de la investigación.
A modo de resumen, estas son sus diferencias:
La IA: disciplina que, a través de la combinación de algoritmos, desarrolla máquinas que intentan replicar o imitar la inteligencia humana.
Machine Learning: es un subconjunto de la IA, donde los humanos entrenan a esas máquinas algorítmicas para que aprendan a través de los datos y hagan predicciones.
Deep Learning: la evolución del Machine Learning en la que los algoritmos están estructurados en redes neuronales y son capaces de aprender por sí mismas, comprender esos datos y sacar sus propias conclusiones.
Independientemente de que definamos la IA, el Machine Learning o el Deep Learning, el hilo conductor es que cada uno de los segmentos debe estar impulsado por el ser humano. Esta inteligencia humana en el bucle es la clave para una IA verdaderamente responsable y transparente. Aunque la IA empresarial está en su punto álgido, atrayendo la atención y el entusiasmo hacia el espacio del Data Science, es importante que las organizaciones se eduquen y construyan una misión y una visión responsables para la implementación de la IA con el fin de tener un verdadero impacto.