Google Avança Modelos de IA para Soluções Empresariais

09/04/2025 Inteligência Artificial

O Google anunciou atualizações significativas para seu conjunto de modelos de IA, visando solidificar sua posição no mercado empresarial. Essas melhorias abrangem vários formatos de mídia, incluindo geração de **música**, **vídeo**, **voz** e **imagem**, todos acessíveis através de sua plataforma de nuvem Vertex AI.

Lyria: Modelo de Texto para Música

Lyria, o modelo de texto para música do Google, está agora disponível em versão de demonstração para clientes selecionados. Este modelo oferece uma alternativa às bibliotecas de música isentas de royalties, permitindo aos usuários criar músicas em diversos estilos e gêneros, desde **solos de piano jazzísticos** até **faixas lo-fi**.

Veo 2: Criação de Vídeo Aprimorada

O Veo 2, o modelo de criação de vídeo do Google, recebeu atualizações focadas na edição e personalização de efeitos visuais. Os novos recursos incluem a capacidade de remover imagens de fundo, logotipos e objetos de vídeos existentes. Além disso, o Veo 2 pode estender quadros de vídeo (por exemplo, converter paisagem em retrato), ajustar ângulos de câmera e criar timelapses e clipes estilo drone. Ele também pode interpolar entre quadros de início e fim especificados. Esses recursos estão atualmente disponíveis em versão de demonstração.

Chirp 3: Tecnologia de Clonagem de Voz

O Chirp 3, o modelo de compreensão de áudio do Google, agora alimenta um recurso de clonagem de voz chamado Instant Custom Voice. Este recurso, agora geralmente disponível, pode clonar uma voz usando apenas 10 segundos de áudio. O Chirp 3 também sustenta uma nova ferramenta chamada Transcription with Diarization, disponível em versão de demonstração, que separa e identifica os oradores em gravações com vários participantes. O Google enfatiza um processo de "diligência" para verificar as permissões de uso de voz adequadas para o Instant Custom Voice, evitando abusos.

Imagen 3: Geração de Imagem Aprimorada

O Imagen 3, o gerador de imagens do Google, agora oferece um desempenho significativamente melhor, particularmente na remoção de objetos e na reconstrução de partes de imagens danificadas ou em falta. Esta melhoria aumenta a utilidade do modelo em tarefas de edição e restauração de imagens.

Medidas de Segurança e Marca d'Água

Toda a mídia gerada por Imagen, Veo e Lyria (excluindo Chirp) é marcada com a tecnologia SynthID do Google. O Google enfatiza que todos os seus modelos de IA generativos têm salvaguardas integradas para proteger contra a criação de conteúdo prejudicial. A empresa também oferece mecanismos de exclusão para treinamento de modelos e uma política de indenização para proteger os clientes do Google Cloud e Vertex AI de disputas de direitos autorais relacionadas à IA.

Essas atualizações demonstram o compromisso do Google em fornecer ferramentas de IA abrangentes e poderosas para o mercado empresarial, competindo diretamente com plataformas como o Bedrock da Amazon.

Fonte: TechCrunch