
Gemini Robotics On-Device do Google: IA Impulsiona Robôs Localmente
E aí, pessoal! Tenho notícias empolgantes da Google DeepMind. Eles acabaram de apresentar o Gemini Robotics On-Device, um novo modelo de linguagem projetado para permitir que robôs operem de forma independente, sem precisar de uma conexão constante com a internet. Bem legal, né?
Pensem nisso: este modelo pode realmente controlar os movimentos de um robô, e os desenvolvedores podem ajustá-lo usando linguagem simples e natural. Imaginem as possibilidades! Estamos falando de robôs que podem dobrar roupas e fazer algumas coisas interessantes. O Google afirma que ele tem um desempenho quase tão bom quanto seu modelo Gemini Robotics baseado na nuvem e melhor do que outros modelos no dispositivo. Embora não tenham citado nomes, ainda assim é uma afirmação ousada!
O que é ainda mais interessante é que este modelo, inicialmente treinado para robôs ALOHA, foi adaptado para funcionar em outros robôs, como o Franka FR3 de dois braços e o robô humanoide Apollo da Apptronik. O Franka FR3 até conseguiu lidar com tarefas e objetos que não havia encontrado antes, como montagem em uma esteira industrial.
Para facilitar ainda mais as coisas para os desenvolvedores, o Google DeepMind também está lançando um Gemini Robotics SDK. Isso permitirá que eles treinem robôs em novas tarefas, mostrando a eles apenas 50 a 100 demonstrações no simulador de física MuJoCo. Ou seja, ele permitirá que o robô execute as tarefas conforme solicitado pelo usuário!
Parece que todo mundo está entrando no jogo da robótica. A Nvidia está trabalhando em uma plataforma para criar modelos de fundação para humanoides, a Hugging Face está desenvolvendo modelos abertos e conjuntos de dados para robótica e até mesmo construindo robôs, e a RLWRLD também está criando modelos de fundação. Este é um momento emocionante para IA e robótica, e mal posso esperar para ver o que o futuro reserva!
1 Imagem de Robótica On-Device:

Fonte: TechCrunch