Anne Wilson | Departamento de Engenharia Mecânica
As máquinas pick-and-place são um tipo de equipamento automatizado usado para colocar objetos em locais estruturados e organizados. Essas máquinas são usadas para uma variedade de aplicações, desde a montagem de eletrônicos até a embalagem, separação de caixas e até mesmo inspeção, mas muitas das soluções atuais de pick-and-place são limitadas. As soluções atuais carecem de “generalização precisa”, ou seja, a capacidade de resolver muitas tarefas sem comprometer a precisão.
“No setor, é comum ver que [os fabricantes] acabam com soluções muito personalizadas para o problema específico que têm, portanto, muita engenharia e pouca flexibilidade em termos de solução”, Maria Bauza Villalonga PhD ’22, cientista de pesquisa sênior do Google DeepMind, onde trabalha com robótica e manipulação robótica. “O SimPLE resolve esse problema e fornece uma solução para o pick-and-place que é flexível e ainda fornece a precisão necessária.”
Um novo artigo de pesquisadores do MechE publicado na revista Science Robotics explora soluções de pick-and-place com mais precisão. No pick-and-place preciso, também conhecido como kitting, o robô transforma um arranjo não estruturado de objetos em um arranjo organizado. A abordagem, denominada SimPLE (Simulation to Pick Localize and placE), aprende a pegar, reter e posicionar objetos usando o modelo de design auxiliado por computador (CAD) do objeto, e tudo isso sem nenhuma experiência prévia ou encontros com objetos específicos.
“A promessa do SimPLE é que podemos resolver muitas tarefas diferentes com o mesmo hardware e software usando simulação para aprender modelos que se adaptam a cada tarefa específica”, diz Alberto Rodriguez, um cientista visitante do MIT que é ex-membro do corpo docente do MechE e agora diretor associado de pesquisa de manipulação da Boston Dynamics. O SimPLE foi desenvolvido por membros do Laboratório de Manipulação e Mecanismos do MIT (MCube) sob a direção de Rodriguez.
“Neste trabalho, mostramos que é possível atingir os níveis de precisão posicional necessários para muitas tarefas industriais de coleta e posicionamento sem nenhuma outra especialização”, diz Rodriguez.
Usando um robô de braço duplo equipado com sensoriamento visuotátil, a solução SimPLE emprega três componentes principais: preensão consciente da tarefa, percepção pela visão e pelo tato (percepção visuotátil) e planejamento de regrasp. As observações reais são comparadas a um conjunto de observações simuladas por meio de aprendizado supervisionado, de modo que uma distribuição de poses prováveis de objetos possa ser estimada e o posicionamento realizado.
Em experimentos, o SimPLE demonstrou com sucesso a capacidade de pegar e posicionar diversos objetos, abrangendo uma ampla gama de formas, obtendo posicionamentos bem-sucedidos em mais de 90% das vezes para 6 objetos e em mais de 80% das vezes para 11 objetos.
“Há um entendimento intuitivo na comunidade de robótica de que a visão e o tato são úteis, mas [até agora] não houve muitas demonstrações sistemáticas de como isso pode ser útil para tarefas complexas de robótica”, diz a estudante de doutorado em engenharia mecânica Antonia Delores Bronars SM ’22. Bronars, que agora está trabalhando com Pulkit Agrawal, professor assistente do departamento de Engenharia Elétrica e Ciência da Computação (EECS), continua seu trabalho de doutorado investigando a incorporação de recursos táteis em sistemas robóticos.
“A maior parte do trabalho sobre a preensão ignora as tarefas posteriores”, diz Matt Mason, cientista-chefe da Berkshire Grey e professor emérito da Universidade Carnegie Mellon, que não participou do trabalho. “Este artigo vai além do desejo de imitar os seres humanos e mostra, de um ponto de vista estritamente funcional, a utilidade da combinação de detecção tátil, visão e duas mãos.”
Ken Goldberg, William S. Floyd Jr. Distinguished Chair em Engenharia da Universidade da Califórnia em Berkeley, que também não participou do estudo, diz que a metodologia de manipulação de robôs descrita no artigo oferece uma alternativa valiosa para a tendência de IA e métodos de aprendizado de máquina.
“Os autores combinam algoritmos geométricos bem fundamentados que podem atingir alta precisão de forma confiável para um conjunto específico de formas de objetos e demonstram que essa combinação pode melhorar significativamente o desempenho em relação aos métodos de IA”, diz Goldberg, que também é cofundador e cientista-chefe da Ambi Robotics e da Jacobi Robotics. “Isso pode ser imediatamente útil no setor e é um excelente exemplo do que chamo de ‘boa e velha engenharia’ (GOFE).”
Bauza e Bronars afirmam que esse trabalho foi informado por várias gerações de colaboração.
“Para realmente demonstrar como a visão e o tato podem ser úteis juntos, é necessário construir um sistema robótico completo, o que é algo muito difícil de ser feito por uma única pessoa em um curto período de tempo”, diz Bronars. “A colaboração entre nós e com Nikhil [Chavan-Dafle, PhD ’20] e Yifan [Hou, PhD ’21, CMU], e entre várias gerações e laboratórios, realmente nos permitiu criar um sistema completo.”
Reproduzido com permissão do MIT News.