DeepSeek es una startup china de IA con un chatbot que lleva su nombre. Fundada en 2023 por Liang Wenfeng, con sede en Hangzhou, Zhejiang, DeepSeek está respaldada por el fondo de cobertura High-Flyer.

La misión de DeepSeek se centra en el avance de la inteligencia artificial general (AGI) a través de la investigación y el desarrollo de código abierto, con el objetivo de democratizar la tecnología de IA para aplicaciones comerciales y académicas. La compañía se enfoca en el desarrollo de grandes modelos de lenguaje (LLM) de código abierto que rivalizan o superan a los líderes de la industria existentes tanto en rendimiento como en rentabilidad.

Aquí tienes todo lo que necesitas saber sobre este nuevo jugador en el juego global de IA.

¿Cuáles son los modelos de IA de DeepSeek?

DeepSeek-V3: 
Lanzado a finales de 2024, este modelo cuenta con 671 mil millones de parámetros y se entrenó con un conjunto de datos de 14.8 billones de tokens durante aproximadamente 55 días, con un costo de alrededor de USD 5.58 millones. 
Las pruebas de referencia indican que DeepSeek-V3 supera a modelos como Llama 3.1 y Qwen 2.5, al tiempo que iguala las capacidades de GPT-4o y Claude 3.5 Sonnet. 
Su arquitectura emplea una mezcla de expertos con un transformador de atención latente multicabezal, que contiene 256 expertos enrutados y un experto compartido, activando 37 mil millones de parámetros por token.

DeepSeek-R1: 
Lanzado en enero de 2025, este modelo se centra en la inferencia lógica, el razonamiento matemático y la resolución de problemas en tiempo real. 
Se entrenó utilizando el aprendizaje por refuerzo sin ajuste fino supervisado, empleando la optimización de políticas relativas a grupos (GRPO) para mejorar las capacidades de razonamiento. 
Este modelo logra un rendimiento comparable al o1 de OpenAI en varias tareas, incluidas las matemáticas y la codificación.

¿Cómo obtengo acceso a DeepSeek?

Los modelos de IA de DeepSeek están disponibles a través de su sitio web oficial, donde los usuarios pueden acceder al modelo DeepSeek-V3 de forma gratuita. 
Además, la aplicación DeepSeek está disponible para su descarga, proporcionando una herramienta de IA todo en uno para los usuarios.

¿Cómo se compara con otros modelos?

Los modelos de IA de DeepSeek se distinguen por su rentabilidad y eficiencia. Por ejemplo, el modelo DeepSeek-V3 se entrenó con aproximadamente 2.000 chips Nvidia H800 durante 55 días, con un coste de unos 5,58 millones de dólares, sustancialmente menos que los modelos comparables de otras empresas. Esta eficiencia ha provocado una reevaluación de las inversiones masivas en infraestructura de IA por parte de las principales empresas tecnológicas.

Por ejemplo, OpenAI mantiene oculto al público el funcionamiento interno de ChatGPT. DeepSeek, por el contrario, adopta el código abierto, lo que permite a cualquiera echar un vistazo bajo el capó y contribuir a su desarrollo.

Esto fomenta un enfoque impulsado por la comunidad, pero también genera preocupaciones sobre el posible uso indebido.

Ambos sobresalen en tareas como la codificación y la escritura, y el modelo R1 de DeepSeek rivaliza con las últimas versiones de ChatGPT. Sin embargo, la asequibilidad de DeepSeek cambia las reglas del juego.

Desarrollado a una fracción del costo, demuestra que la IA de vanguardia no tiene por qué arruinarse.

ChatGPT ofrece un nivel gratuito, pero tendrás que pagar una suscripción mensual para las funciones premium. DeepSeek, por otro lado, cree en democratizar el acceso a la IA. Esto ha impulsado su rápido ascenso, superando incluso a ChatGPT en popularidad en las tiendas de aplicaciones. Dar a todo el mundo acceso a una IA potente tiene el potencial de generar problemas de seguridad, incluidos problemas de seguridad nacional y seguridad general de los usuarios.

ChatGPT es un modelo complejo y denso, mientras que DeepSeek utiliza una arquitectura «Mixture of-Experts» más eficiente. Esto le permite golpear por encima de su peso, ofreciendo un rendimiento impresionante con menos músculo computacional.

DeepSeek opera bajo el gobierno chino, lo que resulta en respuestas censuradas sobre temas delicados. ChatGPT, aunque moderado, permite una gama más amplia de discusiones. Esto plantea cuestiones éticas sobre la libertad de información y el potencial de sesgo de la IA.

La llegada de DeepSeek ha conmocionado al mundo de la tecnología, obligando a los gigantes occidentales a replantearse sus estrategias de IA. Sin embargo, sus prácticas de almacenamiento de datos en China han provocado preocupaciones sobre la privacidad y la seguridad nacional, haciéndose eco de los debates en torno a otras empresas tecnológicas chinas.

ChatGPT y DeepSeek representan dos caminos distintos en el entorno de la IA; Uno prioriza la apertura y la accesibilidad, mientras que el otro se centra en el rendimiento y el control. Sus enfoques contrastantes ponen de manifiesto las complejas compensaciones que conlleva el desarrollo y la implementación de la IA a escala mundial.

¿La tecnología de DeepSeek es de código abierto?

Sí, DeepSeek ha abierto completamente el código de sus modelos bajo la licencia MIT, lo que permite un uso comercial y académico sin restricciones. Este compromiso con la apertura contrasta con los enfoques patentados de algunos competidores y ha sido fundamental en su rápido aumento de popularidad.

DeepSeek muestra que los laboratorios de código abierto se han vuelto mucho más eficientes en la ingeniería inversa. Cualquier ventaja que logren los laboratorios de IA de EE. UU. ahora se puede borrar en cuestión de meses. Este es un serio desafío para las empresas cuyo negocio se basa en la venta de modelos: los desarrolladores se enfrentan a bajos costos de cambio y las optimizaciones de DeepSeek ofrecen ahorros significativos.

¿Qué impacto ha tenido DeepSeek en la industria de la IA?

Los avances de DeepSeek han causado interrupciones significativas en la industria de la IA, lo que ha provocado reacciones sustanciales en el mercado. La startup china de IA envió ondas de choque a través del mundo tecnológico y causó una caída de casi $ 600 mil millones en el valor de mercado de Nvidia.

La presentación del modelo de IA V3 de DeepSeek, desarrollado a una fracción del costo de sus contrapartes estadounidenses, provocó temores de que la demanda de las GPU de gama alta de Nvidia podría disminuir.

Esta preocupación desencadenó una venta masiva de acciones de Nvidia el lunes, lo que resultó en la mayor pérdida en un solo día en la historia corporativa de Estados Unidos. El efecto dominó también afectó a otros gigantes tecnológicos como Broadcom y Microsoft.

Sin embargo, el pánico duró poco. Las acciones de Nvidia se recuperaron casi un 9% el martes, lo que indica una renovada confianza en el futuro de la empresa. Los expertos señalan que, si bien el modelo rentable de DeepSeek es impresionante, no niega el papel crucial que desempeña el hardware de Nvidia en el desarrollo de la IA. De hecho, la aparición de modelos tan eficientes podría incluso ampliar el mercado y, en última instancia, aumentar la demanda de los procesadores avanzados de Nvidia.

El avance de DeepSeek ha tenido reacciones mixtas. Mientras que los CEO de Microsoft y OpenAI elogiaron la innovación, otros como Elon Musk expresaron dudas sobre su viabilidad a largo plazo. La propia Nvidia reconoció el logro de DeepSeek, enfatizando que se alinea con los controles de exportación de EE. UU. y muestra nuevos enfoques para el desarrollo de modelos de IA.

Está claro que la etapa crucial de «inferencia» de la implementación de la IA todavía depende en gran medida de sus chips, lo que refuerza su importancia continua en el ecosistema de la IA. Los últimos días han servido como un duro recordatorio de la naturaleza volátil de la industria de la IA. Las innovaciones disruptivas como DeepSeek pueden causar fluctuaciones significativas en el mercado, pero también demuestran el rápido ritmo de progreso y la feroz competencia que impulsa el sector.

¿Cómo recluta DeepSeek a su talento?

DeepSeek se centra en contratar a jóvenes investigadores de IA de las mejores universidades chinas y a personas de diversos orígenes académicos más allá de la informática. Esta estrategia tiene como objetivo diversificar el conocimiento y las habilidades dentro de sus modelos.

¿DeepSeek se ha enfrentado a algún desafío?

Sí, DeepSeek se ha encontrado con desafíos, incluido un ciberataque reportado que llevó a la empresa a limitar temporalmente los registros de nuevos usuarios. A pesar de estos problemas, los usuarios existentes continuaron teniendo acceso al servicio.

Además, los gigantes tecnológicos Microsoft y OpenAI han iniciado una investigación sobre una posible violación de datos del grupo asociado con la startup china de IA DeepSeek. La investigación gira en torno a una mirada a los datos adquiridos incorrectamente de la tecnología de OpenAI.

Esta investigación se desencadenó cuando los investigadores de seguridad de Microsoft observaron lo que creen que son individuos vinculados a DeepSeek extrayendo una cantidad sustancial de datos a través de la interfaz de programación de aplicaciones (API) de OpenAI en el otoño de 2024.

La escala de la exfiltración de datos generó señales de alerta, lo que generó preocupaciones sobre el acceso no autorizado y el posible uso indebido de los modelos de IA patentados de OpenAI. Las implicaciones de esta supuesta violación de datos son de gran alcance.

OpenAI, conocida por sus innovadores modelos de IA como GPT-4o, ha estado a la vanguardia de la innovación en IA. Su tecnología, accesible a través de API, se ha convertido en una piedra angular para numerosas aplicaciones en diversas industrias. Estas API permiten a los desarrolladores de software integrar los sofisticados modelos de IA de OpenAI en sus propias aplicaciones, siempre que tengan la licencia adecuada en forma de suscripción Pro de 200 dólares al mes.

La posible violación de datos plantea serias dudas sobre la seguridad e integridad de las prácticas de intercambio de datos de IA. A medida que las tecnologías de IA se vuelven cada vez más poderosas y omnipresentes, la protección de los algoritmos patentados y los datos de entrenamiento se vuelve primordial.

¿Hay preocupaciones con respecto a los modelos de IA de DeepSeek?

Algunas fuentes han observado que la versión oficial de la API del modelo R1 de DeepSeek utiliza mecanismos de censura para temas considerados políticamente sensibles por el gobierno chino.

Por ejemplo, la modelo se niega a responder preguntas sobre las protestas y la masacre de la Plaza de Tiananmen de 1989, la persecución de los uigures o los derechos humanos en China. Además, se teme que el sistema de IA pueda utilizarse para operaciones de influencia extranjera, difusión de desinformación, vigilancia y desarrollo de armas cibernéticas para el gobierno chino.

Cómo ha afectado DeepSeek al desarrollo global de la IA?

El rápido ascenso y los logros tecnológicos de DeepSeek han provocado debates sobre la carrera global de la IA, y algunos ven su éxito como un «momento Sputnik» para la industria de la IA. Este término sugiere un cambio significativo en el liderazgo tecnológico, lo que lleva a reflexiones sobre el equilibrio de la innovación entre China y los países occidentales

¿Cuáles son los planes futuros de DeepSeek?

Actualmente, DeepSeek se centra únicamente en la investigación y no tiene planes detallados para su comercialización. Este enfoque permite a la empresa concentrarse en el avance de las tecnologías fundamentales de IA sin presiones comerciales inmediatas.

En este momento, nadie sabe realmente cuáles son las intenciones a largo plazo de DeepSeek. DeepSeek parece carecer de un modelo de negocio que se alinee con sus ambiciosos objetivos. A diferencia de los principales laboratorios de IA de EE. UU., que tienen como objetivo desarrollar servicios de primer nivel y monetizarlos, DeepSeek se ha posicionado como un proveedor de herramientas gratuitas o casi gratuitas, casi un regalo altruista. Si bien este enfoque podría cambiar en cualquier momento, esencialmente, DeepSeek ha puesto un poderoso modelo de IA en manos de cualquiera, una amenaza potencial para la seguridad nacional y en otros lugares.

El auge de DeepSeek demuestra que mantener la IA avanzada fuera del alcance de posibles adversarios ya no es factible. Como señaló el cofundador de Anthropic, Jack Clark, «DeepSeek significa que la proliferación de la IA está garantizada».