ChatGPT Recebe Geração de Imagens GPT-4o: Uma Grande Atualização

25/03/2025 Inteligência Artificial

O CEO da OpenAI, Sam Altman, anunciou recentemente uma atualização significativa para os recursos de geração de imagens do ChatGPT. Isso marca o primeiro grande aprimoramento em mais de um ano, trazendo criação e modificação de imagens nativas para a plataforma.

O ChatGPT agora pode aproveitar o poder do modelo GPT-4o da OpenAI para gerar e modificar imagens e fotos diretamente na interface do chatbot. Anteriormente, embora o GPT-4o alimentasse a plataforma, suas capacidades eram limitadas à geração e edição de texto.

Altman afirmou que a geração de imagens nativas do GPT-4o está imediatamente disponível no ChatGPT e no Sora, o produto de geração de vídeo com IA da OpenAI, para usuários com a assinatura Pro de US$ 200 por mês. O recurso será lançado em breve para usuários Plus e gratuitos do ChatGPT, bem como para desenvolvedores que utilizam o serviço de API da empresa.

Qualidade de Imagem e Edição Aprimoradas

A OpenAI afirma que o GPT-4o "pensa" mais do que seu antecessor, DALL-E 3, resultando em imagens mais precisas e detalhadas. Além disso, o GPT-4o pode editar imagens existentes, incluindo aquelas com pessoas, permitindo que os usuários as transformem ou "preencham" detalhes como objetos de primeiro e segundo plano.

Dados de Treinamento e Considerações Éticas

Para alimentar esse novo recurso de imagem, a OpenAI treinou o GPT-4o em "dados disponíveis publicamente", juntamente com dados proprietários obtidos por meio de parcerias com empresas como a Shutterstock, conforme relatado pelo Wall Street Journal. A OpenAI enfatiza seu compromisso em respeitar os direitos dos artistas e implementou políticas para impedir a geração de imagens que imitem diretamente o trabalho de artistas vivos.

A OpenAI também oferece um formulário de exclusão para criadores que desejam que seu trabalho seja removido dos conjuntos de dados de treinamento. A empresa respeita as solicitações para impedir que bots de web-scraping coletem dados de treinamento, incluindo imagens, de sites.

Concorrência no Cenário de Geração de Imagens de IA

Esta atualização nos recursos de geração de imagens do ChatGPT segue a recente saída experimental de imagem nativa do Google para o Gemini 2.0 Flash. No entanto, o Gemini 2.0 Flash enfrentou desafios com proteções insuficientes, levando à remoção de marcas d'água e à criação de imagens que retratam personagens protegidos por direitos autorais.

Fonte: TechCrunch