Vizor Media - Deepseek: La nueva inteligencia artificial china que ha soprendido a la comptencia global

deepseekapp 1

La empresa china de inteligencia artificial (IA) DeepSeek ha generado un gran impacto en la industria tecnológica global, desafiando a gigantes como OpenAI y Anthropic con modelos de IA eficientes y económicos. Desde su fundación en 2023, DeepSeek ha logrado resultados de alto nivel utilizando menos recursos financieros y computacionales que sus competidores.

El modelo más reciente de DeepSeek, denominado R1, es una evolución de su modelo V3. Este último, presentado en diciembre, es un modelo de lenguaje grande que compite directamente con el GPT-4 de OpenAI y el Claude 3.5 de Anthropic. A pesar de sus limitaciones, como la ocasional generación de datos erróneos, el V3 destaca por su rendimiento en tareas de razonamiento matemático y resolución de problemas, superando al ser humano promedio en algunas pruebas. Lo sorprendente es que el costo de entrenamiento de V3 fue de aproximadamente 5,6 millones de dólares, una cifra significativamente inferior al desarrollo de GPT-4, que superó los 100 millones de dólares. Además, DeepSeek utilizó solo 2.000 chips GPU H800 de NVIDIA, en contraste con las 16.000 unidades empleadas por otras empresas.

El modelo R1, presentado el 20 de enero, representa un avance en el razonamiento paso a paso, siendo particularmente eficaz en tareas complejas como la comprensión lectora y la planificación estratégica. R1 fue entrenado mediante técnicas de aprendizaje por refuerzo, recompensando al sistema por llegar a respuestas correctas y por documentar su "proceso de pensamiento". Esto lo convierte en una herramienta de alto rendimiento comparable al OpenAI o1, pero a una fracción del costo. Según expertos, un experimento que podría costar más de 300 libras con OpenAI o1, puede realizarse por menos de 10 dólares con R1.

deepseekapp 3

El éxito de DeepSeek también radica en su enfoque en la eficiencia. La compañía implementó una técnica basada en la "escasez", identificando y entrenando únicamente los parámetros necesarios para procesar una entrada específica, reduciendo significativamente los recursos requeridos. Además, desarrollaron métodos avanzados para comprimir datos relevantes, optimizando su almacenamiento y acceso.

El impacto de DeepSeek no solo se limita al ámbito tecnológico. La empresa ha provocado una reevaluación de la industria de la IA, incluyendo caídas significativas en el valor de mercado de gigantes como NVIDIA, que perdió cerca de 600 mil millones de dólares tras el anuncio del modelo R1. Este desarrollo también ha generado interés en su chatbot basado en V3 y ha incrementado la adopción de sus herramientas de código abierto.

deepseek 4

DeepSeek ha publicado sus modelos bajo una licencia MIT, permitiendo que investigadores y desarrolladores accedan a ellos sin restricciones. Esto democratiza el acceso a tecnologías avanzadas y facilita la experimentación fuera de los grandes centros de poder tecnológico. Sin embargo, sus datos de entrenamiento permanecen cerrados, lo que limita la transparencia completa.

La irrupción de DeepSeek en el mercado ha llevado a expertos como Mario Krenn, del Instituto Max Planck, a destacar su potencial para transformar la adopción de IA. Por su parte, Alvin Wang Graylin, vicepresidente global de HTC, ha sugerido que la competencia entre China y Estados Unidos podría evolucionar hacia una colaboración en el desarrollo de IA avanzada, beneficiando a la humanidad en su conjunto.

deepseekapp 5

Con costos más bajos, técnicas innovadoras y una apertura parcial hacia la comunidad investigadora, DeepSeek está redefiniendo las reglas del juego en la inteligencia artificial, ampliando el acceso a estas herramientas y marcando un nuevo rumbo para la industria global.

Blog Vizor Media