Inteligencia artificial es la palabra del momento y esto no cambió en la conferencia de desarrolladores Google I/O 2024, dónde el gigante tecnológico habló extensamente de sus iniciativas de IA como su nuevo modelo de lenguaje Gemini y su su integración con otros productos de la compañía como sus celulares Android y sus servicios Gmail, Google Docs y Search. Aquí revivimos algunos momentos cruciales del evento.
Gracias por acompañarnos en este en vivo.
Google I/O termina con Sundar Pichai utilizando IA para determinar cuántas veces se utilizó la palabra inteligencia artificial durante la presentación. La respuesta es 121.
Google también presentó su programa LearnLM, un asistente de aprendizaje que no solo proporciona respuestas, sino da los pasos para aprender diversos temas. Estará disponible en Gemini en los próximos meses.
Google señala que para evitar el uso de su tecnología de inteligencia artifical para la expansión de desinformación, están extendiendo el uso de SynthID, una marca de agua invisible. Antes solo era usada en imágenes y audios, pero ahora estará presente en textos y videos generados utilizando sus programas.
El ejecutivo de Google Josh Woodward detalló los precios de Gemini 1.5 Pro y Flash. Gemini 1.5 Flash tiene un precio de 35 céntimos por 1 millón de tokens, más barato que la tarifa de competidores como GPT-4o de 5 dólares por 1 millón de tokens. Ambos programas están disponibles en 200 países.
Entre los avances que mostraron estaba un sistema de descripción de imágenes para personas con dificultades de visión e incluso un sistema de protección de posibles engaños que interpreta incluso llamadas y lanza advertencias sobre pedidos sospechosos.
Google planea implemantar funciones de inteligencia artificial directamente sobre el sistema operativo con Gemini Nano, lo cual permitirá utilizar los servicios de IA incluso cuando no se tenga conexión con el internet.
Ahora pasamos a los smartphones, pero todavía se habla de inteligencia artificial. Google habló de la opción Circle to Search, que permite hacer un círculo en imágenes, texto y hasta problemas matemáticos para obtener una respuesta. La opción ya estaba disponible en teléfonos Galaxy, pero ahora estará disponible en más modelos equivaliendo a100 millones de dispositivos.
Google señala que Gemini Advance será el chatbot con mayor capacidad en el mercado, con capacidad de hasta un millón de tokens, equivalente a 1.500 páginas, hasta 30 mil líneas de código o una hora de video. Indicaron que para finales del año esto se duplicará a dos millones de tokens.
En un paso más para hacer realidad la película "Her", Google indicó que este año expandirán las capacidades de Gemini para poder tener complejas conversaciones con el app. La experiencia se llama Gemini Live.
Gemini también llega a Drive y permitirá, entre otras cosas, utilizar las Hojas de cálculo para hacer un recuento de tus gastos mensuales. La idea es que todos los programas de Google estén conectados para darte la mayor cobertura y ayuda basada en tu información.
Google también está integrando la inteligencia artificial a su servicio de correo Gmail, permitiendo realizar resúmenes de largas cadenas de correos e incluso hacer preguntas basándose en información presente en estas comunicaciones. ¿Me permitirá borrar automáticamente el spam? ¡Ojalá!
Las búsquedas de Google pronto ya no tendrán que estar basadas solo en texto. Así lo demostró la ejecutiva de Google Rose Yao, que utilizó un video tomado en el escenario para hacer una búsqueda de por qué su tocadiscos estaba fallando, con el programa identificando el problema y enviándole enlaces a sitios con una posible solución.
Durante la conferencia ya habían mencionado las mejoras a Search utilizando inteligencia artificial como AI Overviews, pero ahora están explicando el proceso. Según indicaron, el buscador ahora utiliza un proceso llamado 'multi-step reasoning' (razonamiento en varios pasos) en el que analiza tus preguntas para determinar la prioridad y organizar la información en la manera más conveniente para tí, salvándote de tiempo de investigación.
Pichai regresa al escenario para hablar de infraestructura, más relevante ahora gracias a la enorme demanda de poder de procesamiento generada por las iniciativas de inteligencia artificial. Queriendo asegurar qué preparados están, el CEO resalta innovaciones como su nuevo chip Trillium, especializado para centros de datos de nueva generación y con un rendimiento 4.7 veces mejor, así como la inversiones en centros de datos con refrigeración líquida.
También presentarón Veo, un modelo de generación de videos que puede generar cortos de 60 segundos a una calidad de 1080p a partir de instrucciones textuales (prompts) o de otros cuadros de videos.
Luego su programa de generación de música Music AI Sandbox, el cual permite a creadores en YouTube a crear nuevas melodías mezclando diferentes estilos.
Doug Eck, director de investigación de Google Research, continúa demostrando las iniciativas basadas en la inteligencia artificial de Google. Primero presentaron Imagen 3, la nueva versión de su generador de imágenes que presenta cualidades más fotorrealistas.
Un video de muestra de Project Astra lo ve identificando un parlante, haciendo asociaciones de palabras, identificando código y resolviendo problemas en una pizarra.
También presentan a Project Astra, un agente de IA que es útil en la vida diaria.
Ahora presentan un nuevo modelo de Gemini más rápido y eficiente. Llamado Gemini 1.5 Flash, estará disponible en Google AI Studio y Vertex AI por un millón de tokens.
Pinchai reitera que la meta de Google es "hacer que la IA sea útil para todos." En ese aspecto señala que el propósito de sus esfuerzos es "Organizar la información mundial y hacerla universalmente accesible y útil."
Gemini 1.5 Pro también trabajará con Workspace, permitiéndote pedir el resumen de reuniones en Google Meets, así como ordenar la información de tu inbox.
Comienzan los primeros ejemplos entre Gemini y el resto de servicios de Google. Sundar Pichai habló de la integración de Gemini con su servicio de fotos con el programa Ask Photos, dónde permite hacer preguntas complejas basadas en tu archivo fotográfico cómo cuál es el número de mi placa o cuándo mi hija aprendió a nadar.
El ejecutivo también habló de la nueva opción de Google Search, su reconocido buscador, empoderada por IA llamada AI Overviews, la cual estará disponible para usuarios de los Estados Unidos a partir de hoy. El resto del mundo tendrá que esperar un poco.
El CEO de Google y Alphabet, Sundar Pichai, comienza la conferencia Google I/O. "Llevamos más de una década invirtiendo en AI. (...) Estamos en los primeros días de la AI, pero vemos muchas oportunidades por delante.", indicó el ejecutivo.
Marc Rebillet termina su intervención revelando que MusicFX DJ está disponible para probar en el url https://labs.google/MusicFX-DJ
Marc Rebillet muestra cómo el programa de Google Music FX DJ puede combinar los sonidos de varios instrumentos para generar una nueva melodía.
Marc Rebillet presenta Music FX DJ, un programa de inteligencia artificial que permite crear música a partir de prompts. "Esto solo es el comienzo. Lo van a escuchar bastante en esta conferencia", asegura el 'youtuber'.
Qué esperamos de la conferencia:
Gemini: Se espera que Google presente un nuevo modelo de su inteligencia artificial Gemini, presentada en diciembre del 2023, así como nueva integración con otros productos de la compañía. También hay rumores de que Gemini será la base para el nuevo asistente virtual de Google, proyecto que llevaría el nombre de Pixie.
Android 15: el nuevo sistema operativo de Android ya se encuentra en versión beta con miras a una salida en la segunda mitad del 2024. Sería curioso si la compañía no reserva un tiempo de su conferencia para hablar sobre sus avances y las novedades del OS.
Se tratará de una conferencia crucial para la compañía detrás del buscador más popular del mundo, ya que la carrera por sobresalir en cuestiones de inteligencia artificial la enfrenta a poderosos rivales como OpenAI, Facebook, X y más.
Aquí la fecha de comienzo en otros países:
Estados Unidos: 10 a.m. (hora del Pacífico), 1 p.m. (hora del este)
México: 11 a.m.
Perú: 12 p.m.
Colombia: 12 p.m.
Chile: 1 p.m.
Argentina: 2 p.m.
España: 7 p.m.
La conferencia Google I/O 2024 será transmitida gratuitamente mediante YouTube en el siguiente enlace. El evento comenzará el 14 de mayo a las 10 a.m. hora del Pacífico, lo que se traduce como las 12 p.m. hora peruana.
Falta menos de una hora para el comienzo de la conferencia Google I/O 2024, donde el gigante tecnológico presentará todas sus novedades del año.
TE PUEDE INTERESAR
- Apple quiere potenciar Siri, su asistente virtual, con ChatGPT en iOS 18
- Expertos alertan: los sistemas de IA actuales ya son capaces de engañar a los humanos
- Los celulares más vendidos en los primero meses del 2024
- Estos son los celulares que emiten menos radiación
- El Galaxy A55 es la mejor carta de Samsung para la gama media, ¿qué tal funciona?
Las búsquedas de Google cambiarán para siempre: ahora serán impulsadas por su IA, Gemini