Una revolución en el mundo de la Inteligencia Artificial ha comenzado. DeepSeek, una modesta startup china, ha logrado sacudir a los gigantes establecidos como OpenAI con su modelo de código abierto R1. Esta audaz iniciativa recuerda el relato bíblico de David contra Goliat, donde el más pequeño triunfa contra todo pronóstico.
ChatGPT, el buque insignia de OpenAI, es el resultado de la suma de unas inversiones colosales más una investigación exhaustiva que a finales de 2022 revolucionó el mundo de la IA. Por el contrario, DeepSeek, una startup china fundada en 2023 por el empresario Liang Wenfeng, ha adoptado un enfoque más eficiente en términos de recursos y el pasado 20 de enero reveló su modelo R1, que rivaliza con los modelos de OpenAI lanzados hasta ahora, en términos de capacidades de razonamiento y, además, a un costo significativamente menor. Este enfoque ha permitido a DeepSeek ofrecer una alternativa a ChatGPT de alto rendimiento.
Los modelos DeepSeek demuestran un rendimiento excepcional en diversos estudios de mercado de referencia, superando a menudo a sus competidores estadounidenses. Por ejemplo, en AIME 2024, una prueba de razonamiento avanzado, DeepSeek-R1 obtiene una puntuación del 79,8%, superando a OpenAI-o1-1217 (72,6%) y OpenAI-o1-mini (39,2%). En Codeforces, que evalúa las habilidades de programación, DeepSeek-R1 alcanza el 96,3%, muy por encima de los modelos OpenAI comparables.
El modelo MATH-500, que mide la capacidad para resolver problemas matemáticos complejos, también pone de manifiesto la ventaja de DeepSeek-R1, con una impresionante puntuación de 97,3%, frente al 94,3% de OpenAI-o1-1217. En comprensión lingüística (MMLU), DeepSeek-R1 vuelve a destacar con un 90,8%, superando a los demás modelos de la categoría. Incluso en tareas más técnicas, como SWE-bench Verified, que pone a prueba la verificación de código, DeepSeek destaca con un 49,2%, confirmando su eficacia frente a sus competidores.
Estos resultados confirman la excelencia de los modelos DeepSeek en materia de razonamiento complejo y programación, posicionando a la startup china como líder frente a los gigantes de la industria.
Mientras que modelos como GPT-4o requieren inversiones masivas, DeepSeek sacude la industria gracias a unos costes de explotación y entrenamiento muy reducidos. El entrenamiento del modelo R1 costó sólo 5,6 millones de dólares, frente a los varios cientos de millones de GPT-4. Esta proeza se basa en métodos de entrenamiento innovadores y un uso optimizado de los recursos.
En términos de coste operativo, DeepSeek demuestra una eficacia impresionante. Por ejemplo, los costes de entrada (input) y salida (output) de DeepSeek R1 ascienden a 0,55 $ y 2,19 $ por unidad, respectivamente, frente a los 2,50 $ y 10,00 $ de GPT-4o, y hasta 15,00 $ y 60,00 $ de OpenAI-o1. Esta reducción de los costes de uso abre oportunidades considerables para democratizar el acceso a la Inteligencia Artificial.
Incluso las versiones ligeras como DeepSeek V3 superan a sus homólogas en términos de rentabilidad, con unos costes de entrada de 0,14 $ y de salida de 0,28 $, superando con creces a GPT-4-mini, manteniendo al mismo tiempo un rendimiento competitivo.
DeepSeek ha adoptado un enfoque de código abierto, poniendo el código de su modelo R1 a disposición de todos, fomentando así la innovación colaborativa a una escala sin precedentes. Esta decisión permite a investigadores, desarrolladores y empresas personalizar y adaptar el modelo a sus necesidades específicas, abriendo así el camino a desarrollos únicos en ámbitos tan variados como la medicina, la educación o las finanzas.
Un ejemplo destacado de esta filosofía es el éxito de modelos derivados como DeepSeek-R1-Distill-Qwen-7B, que superan a las versiones ligeras de competidores gracias a la flexibilidad y la comunidad activa que ofrece el código abierto. Este enfoque también facilita la aparición de iniciativas locales y regionales, permitiendo a países en desarrollo acceder a una IA avanzada sin depender de las costosas infraestructuras de los gigantes tecnológicos.
Por el contrario, ChatGPT de OpenAI se ofrece a través de servicios de suscripción, ofreciendo una experiencia de usuario controlada, pero limitando la experimentación externa. La falta de transparencia impide a los usuarios comprender o mejorar los modelos, lo que les hace dependientes de las estrategias comerciales de la empresa. Este enfoque propietario no sólo limita el acceso, sino que también frena la innovación colaborativa, un ámbito en el que DeepSeek destaca.
La transparencia de DeepSeek se inscribe en una tendencia mundial hacia la apertura y la democratización de las tecnologías más punteras, permite a los usuarios tomar el control de la IA y evitar los bloqueos impuestos por los modelos cerrados, contribuyendo así a reducir las desigualdades en el acceso a la innovación.
El modelo R1 de DeepSeek ha sido criticado por su estricta censura sobre temas sensibles, sobre todo en China, como las cuestiones relativas a Tiananmen o a la vida privada de los dirigentes chinos. Esta limitación se percibe a menudo como un compromiso necesario para operar en un entorno regulador restrictivo, al tiempo que se beneficia del apoyo del gobierno chino. No obstante, sus defensores destacan la excepcional calidad técnica de R1, sobre todo, en los ámbitos de la productividad, el razonamiento y la resolución de problemas complejos.
En comparación, ChatGPT también aplica una moderación de contenidos, pero está diseñada para favorecer un discurso más abierto, sobre todo, en temas sensibles. No obstante, esta moderación no está exenta de críticas, ya que algunos usuarios consideran que los algoritmos de moderación de OpenAI introducen sesgos propios de su diseño cultural o de sus valores empresariales.
El aspecto ético de estos modelos plantea una cuestión central: ¿hasta qué punto deben los sistemas de IA reflejar los valores locales o universales? DeepSeek ofrece una eficacia inigualable para aplicaciones prácticas, pero su adopción a escala internacional podría verse frenada por las reticencias relacionadas con sus restricciones culturales. Por su parte, OpenAI debe afrontar el reto de un equilibrio entre moderación, libertad de expresión y responsabilidad social.
Esta dicotomía pone de relieve los complejos desafíos éticos que los actores de la IA deben sortear, reflejando las tensiones entre innovación tecnológica, control regulatorio y expectativas de los usuarios en un mundo cada vez más interconectado.
La política de privacidad de DeepSeek suscita preocupación, sobre todo por la recopilación de datos sensibles (perfil, historial de interacciones) almacenados en servidores en China, sujetos a leyes locales estrictas. A diferencia de ChatGPT, que ofrece opciones como el modo incógnito, DeepSeek carece de transparencia sobre la conservación y el uso de los datos, lo que puede frenar su adopción, sobre todo, en Europa.
Sin embargo, su enfoque de código abierto permite un despliegue local, ofreciendo a los usuarios un control total sobre sus datos, reduciendo los riesgos y garantizando el cumplimiento de normativas como el RGPD. Esta flexibilidad la convierte en una alternativa interesante para aquellos preocupados por la confidencialidad.
La aparición de DeepSeek ha provocado una onda expansiva en el mercado de la IA, desafiando a los gigantes establecidos y provocando repercusiones financieras significativas. A modo de ejemplo, Nvidia vio caer su capitalización bursátil un 12% tras el lanzamiento de R1, ya que este modelo reduce drásticamente la dependencia de GPU (Unidad de Procesamiento Gráfico, por sus siglas en inglés) costosas.
DeepSeek también ha presentado una aplicación de chatbot para el gran público, número 1 en la App Store de Estados Unidos, que rivaliza directamente con ChatGPT, además de ser gratuita. Su estrategia descentralizada y económica abre oportunidades a las PYMES y a los países emergentes, al tiempo que obliga a una reconsideración de los gigantes como OpenAI y Google.
El duelo entre DeepSeek y ChatGPT simboliza una era de transformación en el campo de la IA. DeepSeek encarna la innovación audaz y la eficiencia económica, mientras que ChatGPT representa el poder establecido y la fiabilidad. Con modelos como R1, la IA entra potencialmente en una era de abundancia, prometiendo avances tecnológicos accesibles para todos. Queda por ver cómo reaccionarán los gigantes ante esta importante disrupción. Si quieres ampliar información sobre este tema o tu organización necesita una guía para conocer cómo puede sacar el máximo partido a la IA, cuenta con nosotros.