¿Qué es DeepSeek y por qué está revolucionando la inteligencia artificial?

Las ...

28 Enero 2025

0 0

Las acciones de la industria tecnológica cayeron. Empresas gigantes como Meta y Nvidia se enfrentaron a un aluvión de preguntas sobre su futuro. Los ejecutivos tecnológicos se lanzaron a las redes sociales para proclamar sus temores.

Y todo por culpa de una empresa china de inteligencia artificial (IA) poco conocida llamada DeepSeek.

DeepSeek causó conmoción en todo el mundo el lunes porque uno de sus logros —haber creado un modelo de IA muy potente con mucho menos dinero del que muchos expertos en IA creían posible— suscitó multitud de preguntas, entre ellas si las empresas estadounidenses siquiera eran competitivas en IA.

DeepSeek es “el momento Sputnik de la IA”, publicó en las redes sociales Marc Andreessen, inversor de capital riesgo en tecnología, el domingo.

Deepseek R1 is AI's Sputnik moment.

— Marc Andreessen 🇺🇸 (@pmarca) January 26, 2025

¿Cómo una empresa de la que poca gente había oído hablar pudo tener ese efecto?

Esto es lo que hay que saber sobre DeepSeek.

¿Qué es DeepSeek?

DeepSeek es una empresa emergente fundada por High-Flyer, una firma china de comercio bursátil. Su objetivo es crear tecnologías de IA similares al chatbot ChatGPT de OpenAI o al Gemini de Google. Ya en 2021, DeepSeek había adquirido miles de chips informáticos del fabricante estadounidense Nvidia, que son una parte fundamental de cualquier esfuerzo por crear potentes sistemas de IA.

En China, la compañía es conocida por captar a talentosos jóvenes investigadores de IA en las mejores universidades, prometiéndoles salarios elevados y la oportunidad de trabajar en proyectos de investigación de vanguardia. Tanto High-Flyer como DeepSeek están dirigidas por Liang Wenfeng, un empresario chino.

En los últimos años, DeepSeek ha publicado varios modelos lingüísticos de gran tamaño, que es el tipo de tecnología en el que se basan chatbots como ChatGPT y Gemini. El 10 de enero, lanzó su primera aplicación gratuita de chatbot, basada en un nuevo modelo llamado DeepSeek-V3.

¿Por qué ha reaccionado el mercado de valores?

Cuando DeepSeek presentó su modelo DeepSeek-V3 el día después de Navidad, igualaba las capacidades de los mejores chatbots de empresas estadounidenses como OpenAI y Google. Solo eso ya habría sido impresionante.

Pero el equipo que está detrás del nuevo sistema también reveló un avance mayor. En un documento de investigación en el que explica cómo desarrolló la tecnología, DeepSeek dijo que solo utilizó una fracción de los chips informáticos en los que se basan las principales empresas de IA para entrenar sus sistemas.

Las principales compañías del mundo suelen entrenar a sus chatbots con supercomputadoras que utilizan hasta 16.000 chips o más. Los ingenieros de DeepSeek dijeron que solo necesitaron unos 2000 chips de Nvidia.

¿Por qué es importante?

Desde finales de 2022, cuando OpenAI desencadenó el auge de la IA, la idea predominante era que los sistemas de IA más potentes no podrían construirse sin invertir miles de millones de dólares en chips especializados en IA. Eso significaría que solo las mayores empresas tecnológicas —como Microsoft, Google y Meta, todas ellas con sede en Estados Unidos— podrían construir las tecnologías vanguardistas.

(The New York Times ha demandado a OpenAI y a su socio, Microsoft, alegando una infracción de los derechos de autor del contenido de las noticias relacionadas con los sistemas de IA. Las dos empresas tecnológicas han negado las afirmaciones de la demanda).

Pero los ingenieros de DeepSeek dijeron que solo necesitaron unos 6 millones de dólares en potencia informática bruta para entrenar su nuevo sistema. Eso fue aproximadamente 10 veces menos de lo que Meta gastó en construir su más reciente tecnología de IA.

¿Cómo creó DeepSeek su tecnología con menos chips de IA?

Los mejores ingenieros de IA de Estados Unidos afirman que el documento de investigación de DeepSeek exponía métodos inteligentes e impresionantes de construir tecnología de IA con menos chips.

En resumen, los ingenieros de la empresa emergente demostraron una manera más eficaz de analizar los datos utilizando los chips. Los principales sistemas de IA aprenden sus habilidades detectando patrones en enormes cantidades de datos, como texto, imágenes y sonidos. DeepSeek describió una forma de repartir este análisis de datos entre varios modelos especializados de IA —lo que los investigadores llaman un método de “mezcla de expertos”—, minimizando a la vez el tiempo perdido al trasladar los datos de un lugar a otro.

Otros han utilizado métodos similares antes, pero mover la información entre los modelos tendía a reducir la eficacia. DeepSeek lo hizo de un modo que le permitía utilizar menos potencia de cálculo.

“Ha quedado muy claro que otras empresas, no solo alguien como OpenAI, pueden construir este tipo de sistemas”, dijo Tim Dettmers, investigador del Instituto Allen de Inteligencia Artificial de Seattle y profesor de informática de la Universidad Carnegie Mellon, especializado en construir sistemas de IA eficientes. “DeepSeek utilizó métodos que cualquiera puede duplicar”.

El trabajo de investigación de DeepSeek suscitó dudas sobre si las grandes empresas estadounidenses podrían mantener una ventaja significativa en IA. Muchos expertos creen que la tecnología de IA se convertirá en una mercancía, con muchas empresas vendiendo prácticamente el mismo producto.

¿La tecnología de DeepSeek es tan buena como los sistemas de OpenAI y Google?

DeepSeek-V3 puede responder a preguntas, resolver problemas lógicos y escribir sus propios programas informáticos con la misma eficacia que cualquier otro sistema existente en el mercado, según las pruebas de referencia estándar.

Justo antes de que DeepSeek lanzara su tecnología, OpenAI había presentado un nuevo sistema, llamado OpenAI o3, que parecía más potente que DeepSeek-V3. Pero OpenAI no ha hecho completamente público este sistema.

OpenAI o3 se diseñó para “razonar” a través de problemas relacionados con las matemáticas, la ciencia y la programación informática. Muchos expertos señalaron que DeepSeek no había creado un modelo de razonamiento de este tipo, que se considera el futuro de la IA.

Entonces, el 20 de enero, DeepSeek publicó su propio modelo de razonamiento, llamado DeepSeek R1, y también impresionó a los expertos. Eso generó pánico entre los inversionistas estadounidenses y otros a finales de la semana pasada y durante el fin de semana, al darse cuenta de la importancia de la nueva tecnología de DeepSeek.

🚀 DeepSeek-R1 is here!

⚡ Performance on par with OpenAI-o1
📖 Fully open-source model & technical report
🏆 MIT licensed: Distill & commercialize freely!

🌐 Website & API are live now! Try DeepThink at https://t.co/v1TFy7LHNy today!

🐋 1/n pic.twitter.com/7BlpWAPu6y

— DeepSeek (@deepseek_ai) January 20, 2025Los gigantes tecnológicos estadounidenses están construyendo centros de datos con chips especializados en IA. ¿Eso sigue siendo importante, luego de lo que ha hecho DeepSeek?

Sí, sigue siendo importante.

Un gran número de chips de IA todavía puede ayudar a las empresas de muchas maneras. Con más chips, pueden hacer más experimentos a medida que exploran nuevas maneras de construir la IA. En otras palabras, una mayor cantidad de chips todavía pueden dar a las empresas una ventaja técnica y competitiva.

Los expertos dijeron que también se necesitarán más chips para hacer funcionar la nueva generación de modelos de IA que “razonan”. Estos requieren más potencia informática cuando las personas y las empresas los utilizan.

¿Estados Unidos no ha limitado el número de chips Nvidia vendidos a China?

Sí. Para mantener el liderazgo estadounidense en la carrera mundial de la IA, el gobierno de Joe Biden estableció normas que limitaban el número de potentes chips que podían venderse a China y a otros rivales.

Pero el impresionante rendimiento del modelo DeepSeek suscitó dudas sobre las consecuencias imprevistas de las restricciones comerciales del gobierno estadounidense. Los controles han obligado a los investigadores de China a ser creativos con una amplia gama de herramientas que están disponibles libremente en internet.

Algunos expertos siguen argumentando a favor de las restricciones comerciales estadounidenses, afirmando que solo se han implantado recientemente y que, a medida que pasen los años, tendrán un mayor efecto sobre la capacidad de China para crear IA.

¿La tecnología de DeepSeek significa que China supera a Estados Unidos en IA?

No. El mundo aún no ha visto el modelo o3 de OpenAI, y su rendimiento en las pruebas de referencia estándar fue más impresionante que cualquier otra cosa del mercado. Pero a los expertos les preocupa que China se esté adelantando en los sistemas de IA de código abierto.

¿Qué es exactamente la IA de código abierto?

Como muchas otras empresas, DeepSeek ha “abierto” su más reciente sistema de IA, lo que significa que ha compartido el código informático subyacente con otras empresas e investigadores. Esto permite que otros construyan y distribuyan sus propios productos utilizando las mismas tecnologías.

Esta es una de las razones por las que DeepSeek y otras empresas chinas han podido crear sistemas de IA competitivos de forma tan rápida y económica.

En el mundo de la IA, el código abierto cobró fuerza por primera vez en 2023, cuando Meta compartió libremente un sistema de IA llamado Llama. En ese momento, muchos supusieron que el ecosistema del código abierto florecería solo si empresas como Meta —gigantes con enormes centros de datos llenos de chips especializados— seguían abriendo sus tecnologías al código abierto.

Pero DeepSeek y otros han demostrado que este ecosistema puede prosperar de formas que van más allá de los gigantes tecnológicos estadounidenses.

¿Por qué es eso importante?

Muchos expertos han argumentado que las grandes empresas estadounidenses no deberían compartir el código de sus tecnologías porque podrían utilizarse para difundir desinformación o causar otros daños graves. Algunos legisladores estadounidenses han estudiado la posibilidad de impedir o minimizar esta práctica.

Pero otros expertos han sostenido que si los reguladores sofocan el progreso de la tecnología de código abierto en Estados Unidos, China obtendrá una ventaja significativa. Si las mejores tecnologías de código abierto proceden de China, argumentan estos expertos, los investigadores y las empresas estadounidenses construirán sus sistemas sobre esas tecnologías.

A largo plazo, eso podría situar a China en el centro de la investigación y el desarrollo de la IA, lo que podría acelerar aún más su esfuerzo por construir una amplia gama de tecnologías de IA, incluidas las armas autónomas y otros sistemas militares.

Fuente: https://www.lanacion.com.ar/tecnologia/que-es-deepseek-y-por-que-esta-revolucionando-la-inteligencia-artificial-nid28012025/

Escribe un comentario