Gemini 2.5

Gemini 2.5 do Google: Revolucionando a IA com Raciocínio Aprimorado

O Google acaba de lançar o Gemini 2.5, uma nova família de modelos de IA projetados com capacidades de raciocínio aprimoradas. Isso significa que a IA pausa e "pensa" antes de fornecer uma resposta, visando respostas mais precisas e perspicazes.

Gemini 2.5 Pro Experimental: O Modelo Mais Inteligente do Google Até Agora

Liderando a carga está o Gemini 2.5 Pro Experimental, um modelo de IA multimodal que o Google afirma ser sua criação mais inteligente até agora. Já está disponível no Google AI Studio, sua plataforma de desenvolvedores, e através do aplicativo Gemini para assinantes do Gemini Advanced.

O Google enfatiza que todos os futuros modelos de IA incorporarão essas capacidades de raciocínio avançadas. Esta mudança segue a tendência iniciada pelo o1 da OpenAI em setembro de 2024, que desencadeou uma corrida para desenvolver IA com habilidades de raciocínio semelhantes ou superiores. Empresas como Anthropic, DeepSeek e xAI se juntaram à briga desde então.

Esses modelos de raciocínio utilizam poder de computação e tempo extras para verificar os fatos e analisar minuciosamente os problemas antes de fornecer uma resposta. Essa abordagem levou a melhorias significativas no desempenho da IA, particularmente em áreas como matemática e codificação.

Muitos acreditam que os modelos de raciocínio são cruciais para o desenvolvimento de agentes de IA, sistemas autônomos capazes de realizar tarefas com mínima intervenção humana. No entanto, vale a pena notar que esses modelos também vêm com custos aumentados devido às maiores demandas computacionais.

O Gemini 2.5 Pro foi projetado para se destacar na criação de aplicativos da web visualmente atraentes e aplicativos de codificação agentes. De acordo com o Google, o Gemini 2.5 Pro obteve uma pontuação de 68,6% no Aider Polyglot, que é uma avaliação que mede a edição de código, superando os principais modelos de IA da OpenAI, Anthropic e do laboratório chinês de IA DeepSeek. No entanto, no SWE-bench Verified, o Gemini 2.5 Pro obteve uma pontuação de 63,8%, superando o o3-mini da OpenAI e o R1 da DeepSeek, mas com desempenho inferior ao Claude 3.7 Sonnet da Anthropic, que obteve uma pontuação de 70,3%.

O lançamento inicial do Gemini 2.5 Pro apresenta uma janela de contexto de 1 milhão de tokens, permitindo que a IA processe aproximadamente 750.000 palavras de uma só vez. O Google planeja dobrar este comprimento de entrada para 2 milhões de tokens em breve. Os detalhes de preços para a API do Gemini 2.5 Pro devem ser anunciados nas próximas semanas.

Fonte: TechCrunch