Quando Ananye Agarwal levou seu cachorro para passear subindo e descendo os degraus do parque perto da Carnegie Mellon University (EUA), outros cães pararam perplexos no meio do caminho para observar.
Isso porque o cachorro de Agarwal era um robô — e um bastante especial. Ao contrário de outros, que tendem a depender profundamente de um mapa interno para se locomover, o robô de Agarwal usa uma câmera embutida. Agarwal é estudante de doutorado na Carnegie Mellon e faz parte de um grupo de pesquisadores responsáveis pelo desenvolvimento de uma técnica que permite que robôs caminhem em terrenos complicados usando visão computacional e reinforcement learning. Os pesquisadores esperam que seu trabalho ajude a tornar mais fácil a utilização de robôs no mundo real.
Ao contrário dos robôs existentes no mercado, como o Spot da Boston Dynamics, que se move usando mapas internos, este usa apenas câmeras para guiar seus movimentos ao ar livre, diz Ashish Kumar, aluno de pós-graduação da UC Berkeley (EUA), que é um dos autores de um artigo que descreve o trabalho e que deve ser apresentado na Conference on Robot Learning, em dezembro. Outras tentativas de usar sugestões de câmeras para guiar o movimento do robô foram limitadas a terrenos planos, mas dessa vez eles conseguiram fazer com que a máquina subisse escadas, escalasse pedras e pulasse buracos.
O robô de quatro patas é treinado primeiro em um simulador para se movimentar em diferentes ambientes. Assim, ele consegue ter uma ideia geral de como é caminhar em um parque ou subir e descer escadas. Quando colocado no mundo real, seu movimento é guiado por imagens captadas de uma única câmera na frente do robô. Ele aprende a ajustar seu passo para transpassar coisas como escadas e terrenos irregulares usando o reinforcement learning, uma técnica de Inteligência Artificial (IA) que permite que os sistemas se aprimorem por meio de tentativa e erro.
Eliminar a necessidade de um mapa interno torna o robô mais eficiente já que tira dele a possibilidade de se limitar por possíveis equívocos em um mapa, diz Deepak Pathak, professor assistente da Carnegie Mellon, membro da equipe de Agarwal.
É extremamente difícil para um robô traduzir pixels brutos de uma câmera para o tipo de movimento preciso e equilibrado necessário para navegar ao seu redor, diz Jie Tan, cientista pesquisador do Google, que não participou do estudo. Ele diz que é a primeira vez que vê um robô pequeno e de baixo custo demonstrar uma mobilidade tão impressionante.
A equipe alcançou um “avanço no aprendizado e autonomia de robôs”, diz Guanya Shi, pesquisador da Universidade de Washington (EUA) que estuda machine learning e controle robótico, que também não participou da pesquisa.
Akshara Rai, uma cientista pesquisadora da Facebook AI Research, que trabalha com machine learning e robótica, e não esteve envolvida neste trabalho, concorda.
“É um passo promissor para construir robôs, com pernas, perceptivos do mundo ao seu redor e implantá-los na natureza”, diz Rai.
No entanto, de acordo com Rai, embora o trabalho da equipe seja útil para melhorar a forma como o robô anda, isso não o ajudará a descobrir para onde ir com antecedência. “A navegação é importante para implantar robôs no mundo real”, complementa.
Mais trabalho é necessário antes que o cão-robô seja capaz de passear pelos parques ou buscar coisas em casa. Embora ele possa entender a profundidade por meio de sua câmera frontal, ele não consegue lidar com situações como terreno escorregadio ou grama alta, diz Tan. Ele pode pisar em poças ou ficar preso na lama.