22 de noviembre de 2024

Los anuncios destacados de Google I/O 2024 enfocados en IA

Escucha este Artículo

Google celebró hoy una nueva edición de su evento anual Google I/O, donde anunció nuevos productos y servicios potenciados por la Inteligencia Artificial (IA). Desde la expansión del modelo de lenguaje Gemini a nuevas áreas, hasta la creación de nuevas experiencias de búsqueda y la integración de Gemini en Workspace para facilitar respuestas inteligentes y resúmenes, entre otras novedades.

Recap del evento en 10 Minutos

Google se encuentra totalmente inmerso en la era de Gemini. En la conferencia, Sundar Pichai, CEO de Google y Alphabet, destacó que el propósito de Google es que todos se beneficien de los avances de Gemini, subrayando además los esfuerzos de la empresa en este ámbito.

llevamos más de una década  priorizando la Inteligencia Artificial e invirtiendo en todas las capas del proceso: investigación, producto e infraestructura. Creemos que es una herramienta que tiene muchos desafíos por delante. Por eso, todos nuestros anuncios representan lo que bautizamos como un “I/O” para una nueva generación”. En este blogpost en Esto es Google o en The Keyword -en inglés- se encuentra el discurso completo del CEO.

👇 A continuación, lo más importante de esta edición:

Actualizaciones del modelo de lenguaje Gemini

Google ha anunciado la nueva versión Gemini 1.5 Pro, que ofrece una mayor utilidad en su ventana de contexto, capacidades de razonamiento multimodal mejoradas y un rendimiento general superior. Asimismo, tras las pruebas con clientes y desarrolladores, se ha introducido Gemini 1.5 Flash: una versión más ligera que la 1.5 Pro, diseñada para ser rápida y eficiente en aplicaciones a gran escala.

Ambos modelos se encuentran en versión preliminar con una ventana de contexto de un millón de tokens en Google AI Studio y Vertex AI. A su vez, a partir de hoy estará disponible una ventana de contexto de 2 millones de tokens tanto para desarrolladores que utilicen la API como para los clientes de Google Cloud, a través de la lista de espera. Además, estamos integrando Gemini 1.5 Pro en los productos de Google, incluyendo Gemini Advanced y en las aplicaciones de Workspace.

También se lanzó la próxima generación de modelos abiertos Gemma 2, y compartieron los avances en el futuro de los asistentes de Inteligencia Artificial con Proyecto Astra. Esta última iniciativa propuso asistentes basados en el modelo Gemini y otros modelos específicos de tarea, diseñados para procesar la información más rápidamente mediante la codificación continua de fotogramas de imágenes, la combinación de video y voz en una línea temporal de acontecimientos y el almacenamiento en caché de esta información para una reproducción más eficaz. Al aprovechar los modelos de voz de Google se optimiza el sonido, dotando a los asistentes de una gama más amplia de entonaciones. Así pueden entender mejor el contexto en el que se utilizan y responder rápidamente en una conversación.

Toda la información en este blog en Esto es Google o en The Keyword.

Avances para reimaginar la búsqueda en línea con IA generativa

Se anunció hoy la integración de un nuevo modelo de Gemini en el Buscador, lo que continúa ampliando las posibilidades de búsqueda en Google. Este modelo no solo permitirá realizar consultas, sino que también las simplificará, facilitará la investigación y planificación, y estimulará la generación de ideas, entre otros beneficios.

Lo más destacado es que, para quienes necesiten respuestas rápidas en Internet debido a la falta de tiempo, el Buscador ahora podrá generar un “Resumen Creado con IA” para preguntas tanto simples como complejas. Además, asistirá en la creación de planes de alimentación o viajes; por ejemplo, al consultar “crear plan (…)”, se proporcionará información sobre recetas o destinos turísticos con solo un clic. Esta información podrá ser exportada a Gmail o Documentos si es necesario. Además, el Buscador ofrecerá la opción de buscar con videos y acceder a páginas personalizadas de las fuentes más relevantes para cada consulta.

Toda la información en este blog post en Esto es Google o en The Keyword.

Realizar más tareas diarias con Gemini

Por primera vez, los suscriptores de Gemini Advanced tendrán acceso a Gemini 1.5 Pro: el modelo de lenguaje más avanzado que ofrece, entre otras características, una ventana de contexto ampliada, la más grande disponible en cualquier chatbot para consumidores en el mundo. Puede procesar múltiples documentos extensos, de hasta 1.500 páginas en total, o resumir 100 correos electrónicos en cuestión de segundos. Próximamente, podrá gestionar una hora de contenido en video o bases de código de más de 30.000 líneas.

Además, se lanzará una nueva experiencia de conversación móvil denominada «Gemini Live», que emplea la tecnología de voz más reciente para hacer la interacción con Gemini aún más natural. Asimismo, se ha introducido Gems: una función que permite a los suscriptores de Gemini Advanced personalizar Gemini a su gusto, ya sea como entrenador personal, asesor de estilo o mentor de escritura creativa. Gemini también sigue añadiendo más aplicaciones de Google mediante «Extensiones».

Más información en Esto es Google o en The Keyword.

Gemini para Workspace: “Ayúdame a escribir” ahora en español en Gmail y Documentos de Google

En las próximas semanas, todas las organizaciones que utilizan Google Workspace y los usuarios con Google One AI Premium tendrán acceso a la función «Ayúdame a escribir» integrada directamente en Gmail y Documentos de Google en español. Esta herramienta será útil para:

Crear un nuevo borrador con un comando libre. Por ejemplo, se podrá solicitar a Gmail que redacte una invitación de cumpleaños o una propuesta para un contacto comercial potencial.


Refinar un borrador existente. Por ejemplo, se podrá pedir que se reescriba un borrador para que sea más formal, conciso o ampliado.
Además, el modelo Gemini 1.5 Pro se integrará en las diversas herramientas de Workspace (Gmail, Presentaciones, Documentos y más) mediante un panel lateral. Las personas podrán hacer preguntas o consultas sobre el contenido o la información disponible en ese producto y obtener respuestas, resúmenes, sugerencias y más. Por ejemplo, en Documentos se podrá solicitar un resumen enfocado en aspectos específicos de un informe contenido en el archivo.

Toda la información está disponible en español en Esto es Google y también en inglés en The Keyword.

IA al servicio de la sociedad y más formas para proteger el uso indebido

Durante el evento, Google desveló nuevas maneras de mejorar sus modelos de lenguaje, como Gemini, y de proteger a las personas contra su mal uso. Esto incluye prácticas de investigación innovadoras, como la implementación de marcas de agua en textos y vídeos generados por IA, así como la colaboración con otras organizaciones.

Además, introdujo «LearnLM», un nuevo modelo de lenguaje derivado de Gemini diseñado para potenciar una experiencia de aprendizaje personalizada según las necesidades de cada persona. Este se integrará con Gemini, el Buscador, YouTube y Google Classroom. Asimismo, lanzó «Illuminate», una herramienta experimental concebida para facilitar el acceso y la comprensión del conocimiento. Por ejemplo, puede crear una conversación con dos voces generadas por IA que proporcionan un resumen y un debate conciso sobre los puntos clave de una investigación específica.

Toda la información en Esto es Google o en The Keyword.