Google lleva el potencial de Gemini al corazón de Android, Worskspace y Buscador

shadow

 

Google presentó las novedades que la inteligencia artificial (IA) de Gemini introduce en su sistema operativo Android, donde se convierte en un asistente, pero también en sus servicios tanto para ayudar a los usuarios a ser más productivos como para obtener resultados de búsqueda más precisos.

Android, el sistema operativo móvil de Google, no queda al margen de las novedades que introduce Gemini. Para la compañía es el mejor lugar en el que se puede probar la inteligencia artificial, y lo demuestra reimaginando este SO con la IA en su núcleo, como ha compartido este martes en su evento anual de desarrolladores Google IO.

Un ejemplo de ello es la experiencia ‘Rodea para Buscar’, que permite al usuario buscar cualquier cosa que aparezca en la pantalla de su teléfono con solo rodearlo o tocarlo. Actualmente está disponible en más de 100 millones de dispositivos Pixel y Galaxy de Samsung, pero Google estima que a finales de año la cifra crecerá hasta los 200 millones.

‘Rodea para Buscar’ también tiene nuevas capacidades. Desde este martes, puede ayudar a los estudiantes a resolver problemas de matemáticas o física, y más adelante incorporará problemas más complejos, como cálculo algebraico, diagramas y gráficos.

OpenAI presentó su nuevo y sorprendente modelo de Inteligencia Artificial, GPT-4o

Gemini en Android también ofrece un asistente avanzado, que próximamente será accesible sobre la aplicación que el usuario esté usando. De esta forma, podrá, por ejemplo, preguntar información específica sobre el vídeo que se esté reproduciendo o sobre un documento PDF, aunque esa última opción está disponible en la suscripción Gemini Advanced.

Android también integra el modelo Gemini Nano, que está diseñado para ejecutarse de manera local en el dispositivo, lo que contribuye a mantener la información privada, ya que no se envía a un servidor externo.

Próximamente Nano incorporará funciones multimodales en los teléfonos Pixel, de tal forma que podrá procesar entradas de texto así como comprender información en contextos como imágenes, sonido y lenguaje hablado.

Estas funciones de Nano mejorarán la herramienta Talkback, diseñada para que personas ciegas o con visión reducida puedan interactuar con el dispositivo. También impulsará una nueva función de ciberseguridad, que notificará al usuario en caso de detectar una llamada estafa.

GOOGLE WORKSPACE

La inteligencia artificial también tiene novedades en los servicios de Google, en concreto, en Workspace, donde la compañía ha incorporado su modelo Gemini para impulsar la siguiente generación de características inteligentes.

En concreto, ha añadido Gemini 1.5 Pro en el panel lateral de Gmail, Drive, Documentos, Hojas de Cálculo y Presentaciones, de tal forma que desde este martes empezará a estar disponible para más usuarios, que podrán interactuar con él en un formato conversacional.

Inteligencia Artificial en el mundo del trabajo: conozca sus posibilidades y perspectivas

Gemini podrá responder a una mayor variedad de preguntas gracias a su mayor capacidad de razonamiento y de comprensión de textos largos, que admite una ventana de contexto de hasta un millón de tokens que le permite procesar grandes cantidades de información de una sola vez.

El objetivo de esta implementación es ofrecer un nexo de conexión entre los distintos servicios de Google y las tareas y los flujos de trabajo que están impulsados por inteligencia artificial, como ha destacado la compañía.

Gemini también amplía las características disponibles en Gmail, que en las próximas semanas incorporará tres nuevas herramientas: resumen de ‘email’, para obtener la información más relevante de un correo electrónico; Contextual Smart Replay, que sugerirá respuestas más matizadas y contextualizadas; y Gmail Q&A, para realizar a Gemini preguntas más específicas.

Inteligencia Artificial: superordenador Aurora “rompe barrera exaescala” con 1.012 exaflops

A estas novedades se añaden la incorporación de soporte a español y portugués de la herramienta ‘Help me write’ en Gmail y Documentos en la versión de escritorio.

BÚSQUEDA Y FOTOS

Aparte de Workspace, Google también ha incorporado Gemini en Fotos para impulsar la función experimental ‘Pregunta a Fotos’. Con ella, en lugar de realizar búsquedas en la galería con palabras clave, los usuarios podrán preguntar directamente por estas imágenes para localizarlas, incluso aportando datos concretos como una matrícula de coche.

La Búsqueda, el servicio principal de Google que la compañía lanzó hace 25 años, también incorpora nuevas capacidades con la IA generativa para que sea una herramienta más útil para el usuario.

En este sentido, Google ha presentado AI Overview, unas respuestas rápidas con resúmenes creados por IA que este martes empiezan a estar disponibles en Estados Unidos, y que llegarán más adelante a otros países.

También ha presentado Multi-Step Reasoning, para hacer una pregunta compleja que reúna todas las cuestiones sobre las que el usuario quiere hacer una consulta. Es decir, en lugar de preguntar por separado qué es el pilates, qué se necesita para practicarlo y dónde se puede asistir a clases, el usuario puede unir en una sola pregunta todas las dudas.

Inteligencia Artificial: TikTok alista herramienta para clonar la voz en solo diez segundos

La IA también podrá planificar. El usuario podrá solicitar al Buscador que cree un plan, por ejemplo, de comidas para los próximos tres días que incluya platos veganos. Además de recetas, también se podrán incluir los ingredientes en una lista de la compra.

Para esos casos en los que el usuario no tiene claro qué preguntar, Gemini permite explorar una página de resultados para inspirarse. Estará disponible primero en inglés para búsquedas sobre restaurantes y recetas y más adelante películas, canciones, libros, hoteles y compras.

Por último, con Pregunta con vídeo, el usuario puede iniciar una búsqueda interactiva a través de la cámara del teléfono. El usuario puede preguntar en voz alta mientras apunta con la cámara a algo concreto, como un tocadiscos estropeado, y el procesamiento visual avanzado ofrecerá una respuesta.

Europa Press- Foto Google