OpenAI finalmente lanzó GPT-5. Aquí tienes todo lo que necesitas saber.

OpenAI ha comenzado a implementar GPT-5, la última versión de su modelo de lenguaje insignia, para todos los usuarios de ChatGPT.
El director ejecutivo de la compañía, Sam Altman, calificó a GPT-5 como "un paso significativo en el camino hacia la IAG " durante una conferencia de prensa el miércoles. Si bien no llegó a afirmar que el modelo alcance la inteligencia artificial general, Altman señaló que la última versión es "claramente un modelo con inteligencia general". Añadió que GPT-5 aún carece de las características clave que le permitirían alcanzar la IAG, un término bastante impreciso que se define en los estatutos de OpenAI como "un sistema altamente autónomo que supera a los humanos en la mayor parte del trabajo económicamente valioso". Por ejemplo, el modelo aún carece de la capacidad de aprendizaje continuo tras su implementación.
OpenAI afirma que GPT-5 es más inteligente, rápido, útil y preciso, con una menor tasa de alucinaciones que los modelos anteriores. Con su habitual altivez, Altman comparó el salto de GPT-4 a GPT-5 con la transición del iPhone de una pantalla pixelada a una pantalla Retina. «Con GPT-5, por primera vez, uno se siente realmente como si hablara con un experto en cualquier tema, como si fuera un doctor», afirmó Altman.
Como parte del lanzamiento del jueves, OpenAI anunció dos nuevas variantes del modelo: un GPT-5-mini ligero y un GPT-5-nano aún más rápido y económico (que solo está disponible en la API). Según OpenAI, los usuarios gratuitos tendrán acceso a GPT-5 y GPT-5-mini, mientras que la suscripción Plus incluye los mismos modelos con límites de uso significativamente mayores. OpenAI afirma que el plan Pro de $200 al mes ofrece acceso ilimitado a GPT-5, junto con GPT-5-pro, una versión más potente del modelo, y GPT-5-thinking, que permite que el modelo procese una consulta durante más tiempo del habitual. Los usuarios Pro seguirán teniendo acceso para elegir entre los modelos heredados. La mayoría de los usuarios ya no tendrán que elegir entre modelos, ya que la interfaz de chat ahora redirige automáticamente a la versión correcta según la complejidad de la consulta y el nivel de suscripción del usuario.
Según el blog de lanzamiento para desarrolladores, GPT-5 costará a quienes usen la API $1.25/1 millón de tokens de entrada y $10/1 millón de tokens de salida. "GPT-5 mini tiene un precio de $0.25/1 millón de tokens de entrada y $2/1 millón de tokens de salida, y GPT-5 nano tiene un precio de $0.05/1 millón de tokens de entrada y $0.40/1 millón de tokens de salida", añade. A modo de comparación, los desarrolladores suelen usar Gemini 2.5 Flash y Flash-Lite por su bajo coste; GPT-5 nano ahora es más económico.
A partir de la próxima semana, los usuarios Pro podrán conectar su Gmail, Contactos de Google y Calendario de Google a ChatGPT, y los demás niveles tendrán acceso en una fecha aún no especificada. "ChatGPT sabe automáticamente cuándo es más relevante consultarlos, así que no es necesario seleccionarlos antes de chatear", explicó la compañía en un correo electrónico.
Los usuarios también pueden elegir un color de chat y seleccionar entre cuatro personalidades predefinidas: Cínico, Robot, Oyente y Nerd. Esta función, según informó el boletín de WIRED "Model Behavior", estaba en desarrollo la semana pasada. Según el anuncio del blog de OpenAI, se planea integrar estas personalidades en el Modo de Voz Avanzado .
La API de la compañía ofrecerá a los usuarios los tres modelos, junto con controles opcionales para alternar entre respuestas detalladas o directas. GPT-5 puede retener más información que los modelos anteriores: cuenta con una ventana de contexto de 256 000 tokens, superior a la ventana de contexto de 200 000 tokens disponible en el modelo o3 anterior de la compañía. Esto significa que puede comprender mejor conversaciones, documentos o código extensos sin perder el contexto.
La publicación del blog de OpenAI afirma que GPT-5 supera a sus modelos anteriores en varios puntos de referencia de codificación, incluidos SWE-Bench Verified (con una puntuación del 74,9 por ciento), SWE-Lancer (GPT-5-thinking obtuvo una puntuación del 55 por ciento) y Aider Polyglot (con una puntuación del 88 por ciento), que prueban la capacidad del modelo para corregir errores, completar tareas de codificación de estilo independiente y trabajar en múltiples lenguajes de programación.
Durante la rueda de prensa del miércoles, Yann Dubois, responsable de post-capacitación de OpenAI, instó a GPT-5 a "crear una aplicación web atractiva y altamente interactiva para mi pareja, angloparlante, para que aprendiera francés". Encargó a la IA que incluyera funciones como el progreso diario y diversas actividades como tarjetas didácticas y cuestionarios, y señaló que quería que la aplicación tuviera un tema muy atractivo. Tras aproximadamente un minuto, apareció la aplicación generada por la IA. Aunque solo se trataba de una demo sobre raíles, el resultado fue un sitio web elegante que ofrecía exactamente lo que Dubois pedía.
“Es un excelente colaborador de programación y también destaca en tareas de agencia”, afirma Michelle Pokrass, responsable de post-capacitación. “Ejecuta cadenas largas y llamadas a herramientas con eficacia [lo que significa que comprende mejor cuándo y cómo usar funciones como navegadores web o API externas], sigue instrucciones detalladas y ofrece explicaciones claras de sus acciones”.
OpenAI también afirma en su blog que GPT-5 es "nuestro mejor modelo hasta la fecha para cuestiones relacionadas con la salud". En tres pruebas de referencia LLM de OpenAI relacionadas con la salud (HealthBench, HealthBench Hard y HealthBench Consensus), la tarjeta del sistema (un documento que describe las capacidades técnicas del producto y otros hallazgos de investigación) afirma que el pensamiento de GPT-5 supera a los modelos anteriores "por un margen sustancial". La versión de pensamiento de GPT-5 obtuvo una puntuación del 25,5 % en HealthBench Hard, frente al 31,6 % de o3. Estas puntuaciones son validadas por dos o más médicos, según la tarjeta del sistema.
Según Pokrass, el modelo también alucina menos, un problema común en la IA que proporciona información falsa. Alex Beutel, responsable de investigación de seguridad de OpenAI, añade que han «reducido significativamente las tasas de engaño en GPT-5».
“Hemos tomado medidas para reducir la propensión del pensamiento GPT-5 a engañar, estafar o piratear problemas, aunque nuestras mitigaciones no son perfectas y se necesita más investigación”, dice la tarjeta del sistema. “En particular, hemos entrenado al modelo para que falle con elegancia cuando se le plantean tareas que no puede resolver”.
La tarjeta del sistema de la compañía indica que, tras probar los modelos GPT-5 sin acceso a la navegación web, los investigadores descubrieron que su tasa de alucinaciones (definida como el "porcentaje de afirmaciones factuales con errores menores o mayores") era un 26 % menor que la del modelo GPT-4o. El pensamiento GPT-5 presenta una tasa de alucinaciones un 65 % menor en comparación con el modelo o3.
Para las indicaciones que podrían tener un doble uso (potencialmente perjudiciales o benignas), Beutel afirma que GPT-5 utiliza "finalizaciones seguras", lo que induce al modelo a "ofrecer una respuesta lo más útil posible, pero dentro de los límites de la seguridad". OpenAI realizó más de 5000 horas de trabajo en equipo rojo, según Beutel, y realizó pruebas con organizaciones externas para garantizar la robustez del sistema.
OpenAI afirma que ahora cuenta con casi 700 millones de usuarios activos semanales de ChatGPT, 5 millones de usuarios comerciales que pagan y 4 millones de desarrolladores que utilizan la API.
“Este modelo tiene muy buena onda, y creo que la gente lo va a notar”, afirma Nick Turley, director de ChatGPT. “Sobre todo la gente común y corriente que no ha dedicado tiempo a pensar en modelos”.
wired