GPT-4, la versión más potente de OpenAI, ya cuenta con capacidad para analizar imágenes

10/04/2024 08H22

OpenAI ha lanzado su modelo de inteligencia artificial (IA) mejorado GPT-4 Turbo con Vision, que ya está disponible para los desarrolladores a través de la interfaz de programación de aplicaciones (API) y que permite analizar imágenes y responder preguntas sobre ellas.

La compañía liderada por Sam Altman presentó su modelo de IA GPT-4 Turbo en el marco del evento de desarrolladores que celebró la compañía en noviembre de 2023, cuando lo definió como un modelo “más capaz” y “más económico” que su predecesor, GPT-4.

Newsletter El Comercio MedIA

Alicia Rojas presenta una guía clara para entender (y aprovechar) la inteligencia artificial, cada jueves.

MIRA: Inteligencia artificial en español: IBM acuerda ampliar los modelos de lenguaje de esta herramienta

Esto se debe a que GPT-4 Turbo incluye una ventana de contexto mejorada -esto es, las instrucciones o ‘prompts’ que insertan los usuarios-, pasando de los 32K de GPT-4 a 128k, lo que equivale a “más de 300 páginas de texto en un solo mensaje”. Además, GPT-4 Turbo está actualizado con información nueva hasta abril de 2023.

Ahora, OpenAI ha anunciado que GPT-4 Turbo ya está disponible para los desarrolladores a través de la API con las capacidades de Vision, tal y como ha compartido a través de una publicación de la cuenta de desarrolladores en X (antigua Twitter).

En concreto, GPT-4 Turbo con Vision es un modelo multimodal grande (LMM, por sus siglas en inglés) que puede analizar imágenes y proporcionar respuestas textuales a preguntas sobre ellas. Esto se debe a que incorpora tanto el procesamiento del lenguaje natural como la comprensión visual.

Según explica OpenAI en su guía sobre como utilizar GPT-4 con Vision, el modelo responde a preguntas generales sobre lo que está presente en las imágenes. Por ejemplo, este modelo es capaz de ofrecer ideas para una cena en base a una fotografía de los alimentos que hay en la nevera, ya que es capaz de comprender qué elementos aparecen en la imagen y ofrecer información relacionada con ello.

Asimismo, la compañía también ha detallado a través de su página de actualizaciones que, ahora, las solicitudes para utilizar las capacidades de análisis y reconocimiento de Vision del modelo se pueden llevar a cabo a través del formato de intercambio de datos JSON -basado en el lenguaje de programación JavaScript- y la llamada de función.

Con esta mejora implementada en el modelo, los desarrolladores pueden disponer de un flujo de trabajo mejorado, así como crear aplicaciones con el modelo de forma más eficiente.

Igualmente, OpenAI también ha compartido algunas aplicaciones de las capacidades de GPT-4 Turbo en casos reales de desarrolladores. En este sentido, según ha detallado la compañía, la aplicación fitness Healthify utiliza GPT-4 Turbo con Vision para, a partir de fotografías de las comidas de los usuarios, ofrecer información nutricional.

Siguiendo esta línea, la aplicación Make It Real de Tldraw, utiliza GPT-4 Turbo con Vision para generar un sitio web impulsado por código real, a partir de dibujos de interfaz creados por los usuarios.

Con todo ello, los desarrolladores ya pueden comenzar a implementar las capacidades de GPT-4 Turbo con Vision a través de la API, igualmente, OpenAI ha señalado que el modelo también se está desplegando a través del ‘chatbot’ ChatGPT.

TE PUEDE INTERESAR

Lista de actores y personajes de “María la caprichosa”: quién es quién en el elenco de la serie colombiana de Netflix

MAG.

Advertencia de tormenta invernal en EE.UU.: los 4 estados que pueden presentar problemas en viajes y desplazamientos peligrosos por acumulación de nieve

MAG.

Tensión y gestos reveladores: así captaron a Nicolás Maduro y Cilia Flores en su primer cara a cara con la justicia de EE.UU.

MAG.

EE.UU. impone fianzas de $15,000 para visas de turismo: estos son los países que deberán pagarlas

MAG.

Primera tormenta transnacional de 2026 se acerca a EE.UU.: para cuándo se espera lluvia, nieve y clima severo

MAG.

Casarse no garantiza la Green Card: abogado alerta a parejas sobre lo que puede poner en riesgo tu solicitud

MAG.

GPT-4, la versión más potente de OpenAI, ya cuenta con capacidad para analizar imágenes

TAGS

OpenAI

ChatGPT

IA

GPT-4 Turbo

inteligencia artificial

TE PUEDE INTERESAR

Contenido sugerido

Lista de actores y personajes de “María la caprichosa”: quién es quién en el elenco de la serie colombiana de Netflix

Advertencia de tormenta invernal en EE.UU.: los 4 estados que pueden presentar problemas en viajes y desplazamientos peligrosos por acumulación de nieve

Tensión y gestos reveladores: así captaron a Nicolás Maduro y Cilia Flores en su primer cara a cara con la justicia de EE.UU.

EE.UU. impone fianzas de $15,000 para visas de turismo: estos son los países que deberán pagarlas

Primera tormenta transnacional de 2026 se acerca a EE.UU.: para cuándo se espera lluvia, nieve y clima severo

Casarse no garantiza la Green Card: abogado alerta a parejas sobre lo que puede poner en riesgo tu solicitud

GPT-4, la versión más potente de OpenAI, ya cuenta con capacidad para analizar imágenes

TAGS

OpenAI

ChatGPT

IA

GPT-4 Turbo

inteligencia artificial

TE PUEDE INTERESAR

Precio del dólar en el Perú: cierre del tipo de cambio hoy, martes 6 de enero

Tras la caída de Maduro, Estados Unidos define su jugada: Delcy Rodríguez al poder y transición postergada en Venezuela

Así fue la operación para capturar y sacar a Maduro de Venezuela en la que participaron 200 militares y se usaron 150 aeronaves

Contenido sugerido

Lista de actores y personajes de “María la caprichosa”: quién es quién en el elenco de la serie colombiana de Netflix

Advertencia de tormenta invernal en EE.UU.: los 4 estados que pueden presentar problemas en viajes y desplazamientos peligrosos por acumulación de nieve

Tensión y gestos reveladores: así captaron a Nicolás Maduro y Cilia Flores en su primer cara a cara con la justicia de EE.UU.

EE.UU. impone fianzas de $15,000 para visas de turismo: estos son los países que deberán pagarlas

Primera tormenta transnacional de 2026 se acerca a EE.UU.: para cuándo se espera lluvia, nieve y clima severo

Casarse no garantiza la Green Card: abogado alerta a parejas sobre lo que puede poner en riesgo tu solicitud