Gemini genera texto, código, video, imagen y audio

(Global) Un modelo multimodal es un modelo de AA (aprendizaje automático) capaz de procesar información de diferentes modalidades, como imágenes, videos y texto. Por ejemplo, el modelo multimodal de Google, Gemini, puede recibir una foto de un plato de galletas y generar una receta escrita como respuesta, y viceversa. Esto significa que los usuarios no … Sigue leyendo Gemini genera texto, código, video, imagen y audio