O Toyota Research Institute tem feito um trabalho incrível ensinando robôs a aprender rapidamente e executar tarefas de forma autônoma – agora, está trazendo sua tecnologia Large Behavior Model para o extraordinário humanóide Atlas em parceria com a Boston Dynamics.

O hardware do robô humanóide, acredite ou não, provavelmente já é bom o suficiente. Mais de uma década de trabalho na Boston Dynamics resultou não apenas em um robô hidráulico Atlas incrivelmente atlético e capaz, mas também em uma série de concorrentes comerciais emergentes como Tesla, Figure, Agility, Sanctuary, Fourier e muitos outros. Esses notáveis ​​​​corpos robóticos continuarão a melhorar, mas já são bons o suficiente para realizar todo tipo de trabalho útil.

O software é o problema. Se você precisa de uma equipe de codificação para ensinar um novo comportamento a um robô, ela dificilmente será melhor do que os robôs de produção convencionais de hoje. Mas desenvolver um robô humanóide de uso geral que entenda o mundo e saiba interagir com ele de maneira flexível e adaptável é uma tarefa enorme.

O velho Atlas: um sujeito amplamente extravagante e altamente ginástico

Dinâmica de Boston

A resposta é IA, claro, assim como em breve será a resposta para tudo – mas a IA precisa ser treinada com base em muitos dados. ChatGPT, Grok, Llama e Claude se beneficiam da quantidade insana de dados (em grande parte escritos) que a humanidade acumulou ao longo dos séculos. Os Grandes Modelos de Linguagem (LLMs) avançaram tão rapidamente, porque a linguagem é uma representação altamente comprimida da realidade, reduzida a tamanhos de arquivo tão pequenos que grandes quantidades dela podem ser processadas.

Há muito menos dados disponíveis para ajudar os robôs a aprender os fundamentos do movimento – além do vídeo, que não conta toda a história sobre por que alguém fez determinado movimento. E eles realmente precisam aprender as coisas desde o início. Daí a ideia de um “Grande Modelo de Comportamento”, ou LBM – uma forma de os robôs construírem lentamente os movimentos básicos que podem usar para interagir com o mundo e combiná-los em movimentos mais complexos a serviço de uma tarefa ou objetivo, em de uma forma semelhante à forma como os LLMs desenvolveram uma “compreensão” da linguagem humana e aprenderam a interagir connosco.

Se você ainda não viu o trabalho do LBM que o Toyota Research Institute (TRI) estava fazendo no ano passado, reserve um momento para se atualizar:

Ensinando novos comportamentos aos robôs

Em essência, a equipe TRI desenvolveu um sistema de telepresença que permite aos pilotos humanos “dirigir” braços robóticos, olhando através de óculos VR alimentados pelas câmeras do robô para ver exatamente o que o robô vê, e equipados com luvas hápticas para permitir que eles também sintam o que o robô está vendo. sensores táteis podem sentir.

Então, com o piloto humano limitado ao conjunto exato de “sentidos” que o robô possui, eles começaram a realizar uma série de tarefas, muitas delas na cozinha. Eles passariam algumas horas fazendo a mesma tarefa repetidamente a partir de diferentes pontos de partida, corrigindo seus erros se os cometessem e marcando cada tentativa como um sucesso ou um fracasso.

A partir daí, os robôs passariam algum tempo “pensando” sobre o problema, executando efetivamente milhões de simulações diferentes da tarefa enquanto adicionavam variáveis ​​aleatórias e pontos de partida, classificando seu próprio desempenho a cada vez de acordo com sua própria compreensão dos modos de sucesso e fracasso.

E funcionou. A equipe do TRI havia ensinado aos seus braços robóticos mais de 60 comportamentos complexos até setembro do ano passado, quando vimos o vídeo acima pela primeira vez. Os pesquisadores relataram que muitas vezes passavam uma tarde fazendo o treinamento piloto, depois voltavam para casa enquanto o sistema de aprendizagem comportamental executava suas simulações durante a noite, e então apareciam pela manhã para descobrir que os robôs agora eram capazes de realizar a tarefa por eles mesmos e de uma maneira bastante flexível.

Foi algo notável, e estamos fascinados em saber até que ponto isso avançou nos últimos 12 meses, dada a rapidez surpreendente com que as coisas estão progredindo em todos os campos da IA. Mas também foi uma pesquisa bastante limitada, feita com pares de braços robóticos em vez de corpos inteiros.

Adeus ao HD Atlas

Bem, isso está prestes a mudar. A Boston Dynamics é o padrão ouro absoluto em pesquisa robótica há décadas. O antigo humanóide hidráulico Atlas será considerado uma das máquinas mais inovadoras e significativas da história da robótica.

E o novo Atlas totalmente eléctrico, que poderá ter visto no Novo Atlas, fez a sua estreia pública há apenas cinco meses. Esta evolução notável perdeu parte do poder explosivo que fez do Atlas original um ginasta tão extraordinário – mas compensou-o com articulações totalmente giratórias em todo o corpo, permitindo a rotação livre nos quadris, ombros, cintura, pescoço, bíceps e coxas, de modo que qualquer seção de seu corpo pode estar voltada para qualquer direção. De ginasta a contorcionista… Confira:

Todos os novos Atlas | Dinâmica de Boston

É um robô de aparência verdadeiramente notável, já arranhado, amassado e parecendo muito usado no típico estilo Boston Dynamics, mas curiosamente vimos pouco do novo Atlas nos últimos cinco meses para determinar exatamente onde ele está e quais são suas capacidades atuais. são. Bem, fora isso: sabemos que pode destruir uma série de flexões.

Portanto, as notícias de hoje são muito emocionantes; os grandes mestres indiscutíveis do hardware de robôs humanóides, unindo-se a uma equipe líder no desenvolvimento de AI LBM para aprimorar as capacidades úteis dos robôs humanóides.

“Nunca houve um momento mais emocionante para a indústria robótica e estamos ansiosos para trabalhar com a TRI para acelerar o desenvolvimento de humanóides de uso geral”, disse Robert Playter, CEO da Boston Dynamics, em um comunicado à imprensa. “Esta parceria é um exemplo de duas empresas com uma forte base de pesquisa e desenvolvimento que se unem para trabalhar em muitos desafios complexos e construir robôs úteis que resolvem problemas do mundo real.”

“Avanços recentes em IA e aprendizado de máquina apresentam um enorme potencial para o avanço da inteligência física”, acrescenta Gill Pratt, cientista-chefe da Toyota e CEO da TRI. “A oportunidade de implementar a tecnologia de IA de última geração da TRI no hardware da Boston Dynamics é uma mudança de jogo para cada uma de nossas organizações enquanto trabalhamos para amplificar as pessoas e melhorar a qualidade de vida.”

A parceria visa desenvolver rapidamente modelos de comportamento de corpo inteiro para o robô Atlas, mas também para outras plataformas humanóides com as quais o TRI possa continuar a trabalhar. Será interessante ver quais diferentes tipos de hardware de treinamento de telepresença serão usados ​​para resolver o problema, já que o Atlas é muito mais complexo do que as configurações bimanuais simples com as quais o TRI estava trabalhando originalmente.

Boston não é gentil com seus robôs; até o novo Atlas parece que já passou por guerras
Boston não é gentil com seus robôs; até o novo Atlas parece que já passou por guerras

Dinâmica de Boston

Em última análise, porém, ainda não está claro se Boston pretende transformar o Atlas em um produto comercial. E a escala pode ser crucial aqui; empresas como Tesla e Figure estão projetando seus humanóides tendo em mente a fabricação em massa, com o objetivo de implantar centenas, e depois milhares deles, no mundo, realizando tarefas pequenas, simples e úteis. Lá, eles verão uma variedade extraordinária de coisas acontecendo, coletarão grandes quantidades de dados do mundo real e usarão esses dados para impulsionar o aprendizado baseado em enxame.

Essa é a abordagem que a Tesla afirma que a torna líder mundial em carros autônomos; já existem milhões dessas coisas na estrada, constantemente observando e contribuindo para o conhecimento do todo. A IA é um jogo de big data, e quem reunir mais dados e os utilizar de forma mais eficiente vencerá, de acordo com este modelo. E o prémio, segundo pessoas como Elon Musk, é possivelmente o maior produto da história, uma máquina transformacional de substituição do trabalho que poderia eventualmente assumir basicamente qualquer trabalho físico.

Embora a Boston Dynamics esteja quilômetros à frente de todos em humanóides há pelo menos uma década, o Atlas foi especificamente designado como uma plataforma de pesquisa. A empresa restringiu suas atividades comerciais a quadrúpedes menores e práticos, como sua plataforma Spot e seu manipulador de caixa Stretch de braço único e de levantamento pesado.

Talvez seja revelador que esta empresa pioneira não pareça pensar que os humanóides ainda estão prontos para trabalhar e precisarão de mais alguns anos no laboratório, reunindo meticulosamente os blocos de construção do comportamento físico.

A promessa de humanóides de uso geral é tão grande e o desafio tão grande que certamente haverá muitas surpresas no caminho. Parece um campo onde observamos a história do futuro acontecer em tempo real.

Fonte: Dinâmica de Boston





Source link