Las “rampas de acceso” y las “cajas transparentes”: cómo sigue la película de la inteligencia artificial generativa
En abril de 2018, la economista nacida en Egipto Minouche Shafik dijo una frase premonitoria sobre el futuro del impacto de las nuevas tecnologías sobre el empleo y los negocios. Todavía no se ha...
En abril de 2018, la economista nacida en Egipto Minouche Shafik dijo una frase premonitoria sobre el futuro del impacto de las nuevas tecnologías sobre el empleo y los negocios. Todavía no se había desplegado la inteligencia artificial generativa (IAG), pero Shafik, que trabajó en el Banco Mundial, el FMI, la Universidad de Columbia y la LSE, sostuvo que “en el pasado, los trabajos requerían principalmente músculos; ahora demandan mayormente cerebros, pero en el futuro todo tendrá que ver con el corazón”.
Seis años más tarde, el concepto no podría tener más validez: las distintas plataformas de IAG están sumando este año nuevas herramientas complementarias que mejorarán radicalmente la “rampa de acceso” de distintas profesiones y negocios a esta nueva avenida tecnológica.
Algunos números de las últimas semanas para saber dónde estamos parados en el despliegue de esta ola de cambio: según el World Economic Forum, para 2025 emergerán 100 millones de empleos nunca antes vistos ya adaptados a la nueva división del trabajo entre humanos, máquinas y algoritmos. La inversión en sistemas de IAG será este año de casi US$100.000 millones a nivel global, según IDC, y los procesos operativos de muchos negocios podrían verse reducidos hasta en un 40% gracias a las nuevas tecnologías (IBM).
En una reciente entrevista en Inglaterra, Elon Musk aseguró que el estado actual de la inteligencia artificial podría representar “la fuerza más disruptiva de la historia”. Y a fines del año pasado Geoffrey Hinton, figura legendaria y uno de los “padres” de la nueva IA recomendó a la gente que “empiece a buscar trabajos en plomería”.
Y si alguien tuvo una primera experiencia decepcionante en los últimos meses con ChatGPT u otras arquitecturas de LLM (modelos de lenguaje de gran tamaño), porque las respuestas fueron vagas, falsas, alucinatorias o poco precisas, que se prepare porque eso podría estar por cambiar gracias a los nuevos avances.
Uno de los términos que crece en popularidad entre las empresas de este rubro es el de RAG (en inglés significa “trapo”), que alude a la sigla de Retrieval-Augmented Generation. En castellano: “Generación con Recuperación Aumentada”.
“Los grandes modelos de lenguaje son una tecnología clave que nos permitió en los últimos dos años usar la capacidad conversacional de las máquinas como nunca lo habíamos podido hacer”, cuenta a LA NACION Fredi Vivas, ingeniero, profesor de Udesa y autor de Invisible: la IA en nuestra vida. “Pero los LLM tienen grandes desafíos: pueden responder con información falsa o muy genérica, o desactualizada, o tomada de fuentes no autorizadas; lo que termina provocando sesgos, inconsistencias y desconfianza, particularmente en sectores donde no hay margen para el error, como la salud o la educación”, dice el CEO de RockingData.
Ahí es donde entra a tallar la arquitectura RAG, para optimizar la salida de las respuestas y volverlas más precisas, seguras y contextuales. La generación con recuperación aumentada permite armar bases con información específica de una empresa o de un sector sin modificar el modelo de lenguaje subyacente en sí. No necesita ser entrenada (lo que es un proceso costoso) y se puede actualizar permanentemente.
Elevar el valor de la IAEsta idea es relativamente nueva: surgió luego de un paper publicado en 2020, escrito por Patrick Lewis y un equipo de Facebook AI Research. A partir de allí, el concepto de RAG fue adoptado por muchos investigadores y programadores que lo ven como una forma de elevar significativamente el valor de los sistemas de IA generativa. La implementación de la RAG requiere de tecnologías como las bases de datos vectoriales que permiten la codificación rápida de la nueva información.
Un par de ejemplos concretos para saber de qué estamos hablando. Un bot conversacional de un club de fútbol puede tener charlas con los fanáticos sobre reglas del deporte, información histórica, etcétera. Pero, si sólo tiene LLM, no va a ofrecer información sobre cómo va a formar el equipo en el partido de mañana o cómo evoluciona la lesión de algún jugador en particular: esto sí se puede hacer con las nuevas “rampas de acceso”. En una plataforma de turismo se podría conversar con un potencial cliente que esté interesado en conocer el estado de las playas cercanas a un alquiler temporario de vacaciones, si hay bañero, si el mar está bravo en estos días, si hay cancha de voley, lugares para comer o lo que le interese con un alto nivel de especificidad y de actualización.
“RAG es sólo una de las tecnologías complementarias a los LLM que van a hacer que veamos muchas novedades en el campo de la inteligencia artificial generativa y los negocios en 2024″, cuenta a este diario David Cabrera, un especialista en IA que preside la empresa Wise CX desde Las Varillas, en Córdoba. Su firma compró este año Keepcon para trabajar mejor la experiencia del cliente con IA, con un equipo de más de 180 personas que incluye varios lingüistas.
Cabrera cree que las nuevas “rampas de acceso” como RAG permiten respuestas más robustas y controlables, y también van a sumar “explicabilidad” a estos procesos: la idea es que la inteligencia artificial deje de ser una “caja negra” y se convierta en un dispositivo más controlable y transparente. Las distintas capas que se van agregando al LLM permiten detectar mejor intenciones, tonos y especificidades de las conversaciones.
Las Varillas es una localidad de apenas 20.000 habitantes con una curiosidad: es el lugar del país con mayor cantidad de basquetbolistas que pasaron por la NBA por habitante: Fabricio Oberto y Leandro Bolmaro. Supera en esta estadística, en términos proporcionales, a Bahía Blanca, otra cuna de jugadores de básquet de elite.
Cabrera y Vivas coinciden en que estas nuevas tecnologías conversacionales son particularmente potentes para la cultura de los negocios y del consumo de América Latina, donde WhatsApp tiene mayor penetración que en ningún otro continente y es por lejos la interface más popular. En 2024, los nuevos celulares que se lanzan ya tienen todos IAG incorporado. Samsung, por caso, aceleró su carrera en esta vía con más de 3000 patentes de inteligencia artificial propias y una alianza con Google para complementar su sistema propio “Gauss”.
¿Qué implicancias tiene esta película para el mundo laboral? La combinación de modelos de lenguaje de gran tamaño más RAG y otras tecnologías complementarias que están creciendo a pasos agigantados cambiarán drásticamente la naturaleza del trabajo de intermediarios, gestores, personas que cobran por saber cómo llenar formularios. Si unimos las profecías de Minouche Shafik y la de Geoffrey Hinton, será un nuevo mundo de “plomeros con mucho corazón”.