(Global) El ámbito de la Inteligencia Artificial (IA) podría estar a punto de dar un salto transformador, pasando de los Grandes Modelos de Lenguaje (LLM) a un concepto innovador y expansivo, al que podríamos denominar «Grandes Modelos Mundiales (LWM)».
Estos sistemas encarnan concepciones fundamentalmente distintas de la inteligencia. El LLM deriva su poder de patrones estadísticos en datos textuales, mientras que el modelo del mundo busca emular la causalidad y las leyes de la física mediante simulaciones aprendidas. Cada uno ofrece una visión parcial, pero profunda, de la cognición.
Los programas LLM como GPT-3 y GPT-4 han revolucionado nuestra interacción con la información. Al procesar grandes cantidades de datos textuales, estos modelos se han vuelto expertos en la comprensión y generación de textos con un diseño similar al humano, lo que facilita avances en áreas que van desde la creación de contenido hasta la atención al cliente. Sin embargo, su dependencia del texto como única fuente de información limita su comprensión del mundo a una perspectiva textual.
Los LWM podrían representar el futuro de la IA, extendiéndose más allá del texto, el audio y las imágenes para abarcar todo el espectro de nuestras realidades físicas y digitales. Los LWM procesarán datos del mundo real provenientes de diversas fuentes, como dispositivos IoT, sensores, cámaras y más, para comprender e interactuar con el mundo de una manera que refleje la percepción y la cognición humanas.
El pasado agosto Google anunció Genie 3, un avance de lo que podrían llegar a ser estos sistemas. Por ahora es un generador de entornos virtuales, que se materializan en tiempo real a medida que el usuario se mueve como en un videojuego. Poco antes, Meta había lanzado su propio modelo de mundo, V-JEPA 2, con una comprensión visual de entornos reales.
También proliferan las startups con ese enfoque. La prestigiosa investigadora Fei Fei Li, conocida como la madrina de la IA, ha conseguido una inversión de 230 millones de dólares para World Labs, que desarrolla un sistema capaz de comprender cómo funciona el mundo físico. Skild AI, apoyada por Amazon, Nvidia y Samsung, ha recibido más de 400 millones de dólares y ya ha presentado un modelo capaz de controlar tanto a máquinas de una línea de producción como a robots humanoides.
“Lo que persiguen estos sistemas es básicamente preentrenar un modelo, ya no de lenguaje sino de información global, por decirlo de alguna manera”, puntualiza Pablo Martínez Olmos, profesor del Departamento de Teoría de la Señal y Comunicaciones de la Universidad Carlos III de Madrid y especializado en modelos probabilísticos. “A partir de un montón de tokens [unidades básicas utilizadas para representar datos] que concatenamos —que pueden ser texto con audio, con imagen y con un montón de tipos de datos que están vinculados—, podemos predecir el siguiente token”.
Nvidia lanzó a principios de 2025 su plataforma Cosmos, que ofrece herramientas para favorecer el desarrollo de modelos de mundo, destinados a robots y vehículos autónomos. Cuando Meta anunció su V-JEPA 2 destacó que su sistema permitía a robots interactuar con objetos desconocidos y moverse en un entorno al que no habían estado expuestos antes.
El auge del traductor en la Inteligencia Artificial: un nuevo rol clave en la era digital
Aplicaciones de los LWM
Planificación urbana y ciudades inteligentes: en el ámbito del desarrollo urbano, los LWM podrían desempeñar un papel fundamental en la creación de ciudades más inteligentes y eficientes. Al analizar datos de diversas fuentes, como patrones de tráfico, uso de servicios públicos y sensores ambientales, los LWM podrían ayudar a los urbanistas a tomar decisiones más informadas. Podrían simular el impacto de los proyectos urbanos en el flujo vehicular, los niveles de contaminación y el consumo energético, lo que se traduciría en entornos urbanos más sostenibles y habitables.
Atención médica: los LWM prometen revolucionar la atención médica al integrar una amplia gama de fuentes de datos, como historiales médicos de pacientes, biometría en tiempo real, datos genómicos e incluso factores ambientales más amplios. Este enfoque holístico podría conducir a diagnósticos más precisos y planes de tratamiento personalizados.
Monitoreo Ambiental y Sostenibilidad: los modelos de monitoreo ambiental (LMA) podrían desempeñar un papel importante en el monitoreo y la gestión de los recursos ambientales. Al analizar datos satelitales, estaciones meteorológicas y sensores ambientales, estos modelos podrían brindar información sobre los patrones del cambio climático, contribuir a la predicción y gestión de desastres y orientar la utilización sostenible de los recursos. Por ejemplo, podrían optimizar el uso del agua en la agricultura o predecir el impacto de la deforestación en los ecosistemas locales.
Inteligencia Artificial: Google lanza resultados de búsqueda del modo IA en idioma español
Educación y Formación: los LWM tienen el potencial de transformar el panorama educativo al ofrecer experiencias de aprendizaje altamente personalizadas. Estos modelos pueden adaptarse a los estilos y ritmos de aprendizaje individuales, ofreciendo contenido educativo personalizado que evoluciona en función del rendimiento y la participación de los estudiantes. En la formación profesional, los LWM podrían crear simulaciones realistas para la práctica en campos como la medicina, la ingeniería y la aviación, mejorando la adquisición y el dominio de habilidades.
Los LWM pueden integrar a la perfección los mundos digital y físico. Al aprovechar los datos de dispositivos de realidad virtual y aumentada, estos modelos ofrecerán experiencias inmersivas que trascienden las interfaces tradicionales como smartphones, televisores y monitores de ordenador. Esta integración no solo mejorará la experiencia del usuario, sino que también proporcionará a la IA una comprensión más completa del comportamiento humano y el entorno.
tynmagazine.com