A OpenAI finalmente lançou o GPT-5. Aqui está tudo o que você precisa saber

A OpenAI começou a implementar o GPT-5, a mais recente iteração do seu principal modelo de linguagem, para todos os usuários do ChatGPT.
O CEO da empresa, Sam Altman, chamou o GPT-5 de "um passo significativo no caminho para a IA (AGI) " durante uma coletiva de imprensa na quarta-feira. Embora não tenha chegado a afirmar que o modelo alcança a inteligência artificial geral, Altman observou que o lançamento mais recente é "claramente um modelo que é geralmente inteligente". Ele acrescentou que o GPT-5 ainda carece de características-chave que o levariam a atingir a IA (AGI), um termo notavelmente vago que é definido no estatuto da OpenAI como "um sistema altamente autônomo que supera humanos na maioria das tarefas economicamente valiosas". Por exemplo, o modelo ainda não tem a capacidade de aprender continuamente após a implantação.
A OpenAI afirma que o GPT-5 é mais inteligente, mais rápido, mais útil e mais preciso, com uma taxa de alucinações menor do que os modelos anteriores. Em termos tipicamente arrogantes, Altman comparou a transição do GPT-4 para o GPT-5 à mudança do iPhone de uma tela pixelada para uma tela Retina. "O GPT-5 é a primeira vez que realmente sentimos como se estivéssemos conversando com um especialista em qualquer assunto, como um especialista com nível de doutorado", disse Altman.
Como parte do lançamento de quinta-feira, a OpenAI anunciou duas novas variantes de modelo: um GPT-5-mini leve e um GPT-5-nano ainda mais rápido e barato (que está apenas na API). De acordo com a OpenAI, usuários gratuitos terão acesso ao GPT-5 e ao GPT-5-mini, enquanto a assinatura Plus inclui os mesmos modelos com limites de uso "significativamente maiores". A OpenAI afirma que o nível Pro de US$ 200 por mês oferece acesso ilimitado ao GPT-5, juntamente com o GPT-5-pro, uma versão mais poderosa do modelo, e o GPT-5-thinking, que permite que o modelo processe uma consulta por mais tempo do que o normal. Usuários Pro ainda terão acesso para escolher entre modelos legados. A maioria dos usuários não precisará mais escolher entre os modelos, pois a interface de bate-papo agora encaminha automaticamente para a versão correta, dependendo da complexidade da consulta e do nível de assinatura do usuário.
De acordo com o blog de lançamento do desenvolvedor, o GPT-5 custará aos desenvolvedores que usam a API US$ 1,25/1 milhão para tokens de entrada e US$ 10/1 milhão para tokens de saída. "O GPT-5 mini custa US$ 0,25/1 milhão para tokens de entrada e US$ 2/1 milhão para tokens de saída, e o GPT-5 nano custa US$ 0,05/1 milhão para tokens de entrada e US$ 0,40/1 milhão para tokens de saída", acrescenta. Para efeito de comparação, os desenvolvedores costumam usar o Gemini 2.5 Flash e o Flash-Lite, já que são muito baratos — o GPT-5 nano agora está mais barato.
A partir da próxima semana, usuários Pro poderão conectar seus serviços do Gmail, Contatos do Google e Google Agenda ao ChatGPT, enquanto os demais terão acesso em uma data ainda não especificada. "O ChatGPT sabe automaticamente quando é mais relevante consultá-los, então você não precisa selecioná-los antes de conversar", informou a empresa em um e-mail.
Os usuários também podem escolher uma cor para o chat e selecionar entre quatro personalidades predefinidas — Cínico, Robô, Ouvinte e Nerd — um recurso que o boletim informativo Model Behavior da WIRED relatou estar em desenvolvimento na semana passada. De acordo com o anúncio do blog da OpenAI, a empresa planeja incorporar essas personalidades ao Modo de Voz Avançado .
A API da empresa oferecerá aos usuários todos os três modelos, juntamente com controles opcionais para alternar entre respostas detalhadas ou diretas. O GPT-5 pode reter mais informações do que os modelos anteriores — possui uma janela de contexto de 256.000 tokens, um aumento em relação à janela de contexto de 200.000 tokens disponível no modelo o3 anterior da empresa. Isso significa que ele pode compreender melhor conversas, documentos ou códigos longos sem perder o contexto.
A postagem do blog da OpenAI afirma que o GPT-5 supera seus modelos anteriores em vários benchmarks de codificação, incluindo SWE-Bench Verified (pontuação 74,9%), SWE-Lancer (GPT-5-thinking pontuou 55%) e Aider Polyglot (pontuação 88%), que testam a capacidade do modelo de corrigir bugs, concluir tarefas de codificação no estilo freelancer e trabalhar em várias linguagens de programação.
Durante a coletiva de imprensa na quarta-feira, Yann Dubois, líder de pós-treinamento da OpenAI, sugeriu ao GPT-5 que "criasse um aplicativo web bonito e altamente interativo para meu parceiro, que fala inglês, aprender francês". Ele encarregou a IA de incluir recursos como progresso diário, uma variedade de atividades como flashcards e questionários, e observou que queria que o aplicativo tivesse um "tema altamente envolvente". Depois de cerca de um minuto, o aplicativo gerado pela IA apareceu. Embora fosse apenas uma demonstração on-rails, o resultado foi um site elegante que entregou exatamente o que Dubois pediu.
“É um ótimo colaborador de codificação e também se destaca em tarefas de agente”, diz Michelle Pokrass, líder pós-treinamento. “Ele executa cadeias longas e chamadas de ferramentas com eficiência [o que significa que entende melhor quando e como usar funções como navegadores da web ou APIs externas], segue instruções detalhadas e fornece explicações antecipadas de suas ações.”
A OpenAI também afirma em sua publicação no blog que o GPT-5 é "nosso melhor modelo até o momento para questões relacionadas à saúde". Em três benchmarks de LLM relacionados à saúde da OpenAI — HealthBench, HealthBench Hard e HealthBench Consensus — o cartão do sistema (um documento que descreve as capacidades técnicas do produto e outras descobertas de pesquisa) afirma que o pensamento baseado no GPT-5 supera os modelos anteriores "por uma margem substancial". A versão "pensante" do GPT-5 obteve uma pontuação de 25,5% no HealthBench Hard, acima dos 31,6% do o3. Essas pontuações são validadas por dois ou mais médicos, de acordo com o cartão do sistema.
O modelo também supostamente alucina menos, de acordo com Pokrass, um problema comum para IA que fornece informações falsas. O líder de pesquisa de segurança da OpenAI, Alex Beutel, acrescenta que eles "reduziram significativamente as taxas de engano no GPT-5".
“Tomamos medidas para reduzir a propensão do pensamento GPT-5 a enganar, trapacear ou hackear problemas, embora nossas mitigações não sejam perfeitas e mais pesquisas sejam necessárias”, diz o cartão do sistema. “Em particular, treinamos o modelo para falhar graciosamente quando confrontado com tarefas que ele não consegue resolver.”
O cartão de sistema da empresa afirma que, após testar modelos GPT-5 sem acesso à navegação na web, os pesquisadores descobriram que sua taxa de alucinações (que eles definiram como "porcentagem de alegações factuais que contêm erros menores ou maiores") era 26% menos comum do que o modelo GPT-4o. O pensamento baseado no GPT-5 apresenta uma taxa de alucinações 65% menor em comparação com o modelo O3.
Para prompts que podem ser de uso duplo (potencialmente prejudiciais ou benignos), Beutel diz que o GPT-5 usa "conclusões seguras", o que leva o modelo a "dar uma resposta tão útil quanto possível, mas dentro das restrições de permanecer seguro". A OpenAI fez mais de 5.000 horas de trabalho em equipe vermelha, de acordo com Beutel, e testes com organizações externas para garantir que o sistema fosse robusto.
A OpenAI afirma que agora conta com quase 700 milhões de usuários ativos semanais do ChatGPT, 5 milhões de usuários empresariais pagantes e 4 milhões de desenvolvedores utilizando a API.
“A vibe deste modelo é muito boa, e acho que as pessoas vão realmente sentir isso”, diz Nick Turley, chefe do ChatGPT. “Especialmente pessoas comuns que não têm dedicado tempo a pensar em modelos.”
wired