FUENTE: www.venturebeat.com
AUTORA: KYLE WIGERS
Los avances en el aprendizaje automático han dado lugar a una variedad de capacidades robóticas, que incluyen agarrar, empujar, tirar y otras habilidades de manipulación de objetos. Sin embargo, los algoritmos de propósito general hasta la fecha han sido extremadamente ineficaces con las muestras, lo que limita su aplicabilidad al mundo real. Estimulado por esto, los investigadores de la Universidad de California, Berkeley desarrollaron Framework for Efficient Robotic Manipulation (FERM) – que aprovecha técnicas de vanguardia para lograr lo que afirman es un entrenamiento de algoritmos de manipulación robótica “extremadamente” eficiente en la muestra. Los coautores dicen que, con solo 10 demostraciones que equivalen a 15 a 50 minutos de tiempo de entrenamiento en el mundo real, un solo brazo robótico puede aprender a alcanzar, agarrar, mover y tirar de objetos grandes o accionar un interruptor y abrir un cajón usando FERM.
McKinsey fija el potencial de automatización robótica para las ocupaciones de producción en alrededor del 80%, y es probable que la pandemia acelere este cambio. Un informe del Manufacturing Institute y Deloitte encontró que 4,6 millones de puestos de trabajo de fabricación deberán cubrirse durante la próxima década, y los desafíos provocados por las medidas de distanciamiento físico y un repunte sostenido en la actividad del comercio electrónico han llevado al límite algunas operaciones logísticas. La Asociación Nacional de Fabricantes (EE.UU.) dice que el 53,1% de los fabricantes anticipan un cambio en las operaciones debido a la crisis de salud, y el 35,5% dice que ya se enfrentan a interrupciones en la cadena de suministro.
FERM podría ayudar a acelerar el cambio hacia la automatización al hacer que el aprendizaje por refuerzo «basado en píxeles», un tipo de aprendizaje automático en el que los algoritmos aprendan a completar tareas a partir de demostraciones grabadas, sea más eficiente en cuanto a datos. Como explican los investigadores en un artículo, FERM primero recopila una pequeña cantidad de demostraciones y las almacena en un «búfer de reproducción». Un algoritmo de aprendizaje automático del codificador se entrena previamente con los datos de demostración contenidos en el búfer de reproducción. Luego, un algoritmo de aprendizaje por refuerzo en FERM entrena imágenes «aumentadas» con datos generados tanto por el codificador como por las demostraciones iniciales.
Según los investigadores, FERM es fácil de ensamblar porque solo requiere un robot, una tarjeta gráfica, dos cámaras, un puñado de demostraciones y una función de recompensa que guía el algoritmo de aprendizaje por refuerzo hacia un objetivo. En experimentos, dicen que FERM permitió que un xArm aprendiera seis tareas dentro de los 25 minutos de tiempo de entrenamiento (que corresponden a 20 a 80 episodios de entrenamiento) con una tasa de éxito promedio del 96,7%. El brazo podría incluso generalizar a objetos no vistos durante el entrenamiento y lidiar con obstáculos que bloquean su camino hacia las posiciones de destino.
«Hasta donde sabemos, FERM es el primer método para resolver un conjunto diverso de tareas de manipulación robótica de recompensa escasa directamente desde píxeles en menos de una hora«, escribieron los investigadores. “Debido a la cantidad limitada de supervisión requerida, nuestro trabajo presenta interesantes vías para aplicar el aprendizaje por refuerzo a robots reales de una manera rápida y eficiente”.
Los marcos de código abierto como FERM prometen avanzar en el estado del arte en manipulación robótica, pero quedan preguntas sobre cómo medir el progreso . Como escribe mi colega Khari Johnson, las métricas utilizadas para medir el progreso en el agarre robótico pueden variar según la tarea. Para los robots que operan en un entorno de misión crítica como el espacio, por ejemplo, la precisión importa sobre todo.
«En determinadas circunstancias, si tienes un robot muy rápido, puedes llegar a tasas de recolección humana]«, dijo el roboticista Ken Goldberg a VentureBeat en una entrevista anterior. “Pero dicen que los humanos logran alrededor de 650 objetos por hora; ese es un nivel asombroso. Es muy difícil vencer a los humanos. Somos muy buenos. Hemos evolucionado durante millones de años «.