Na passada segunda-feira os pesquisadores da OpenAI, empresa de pesquisa de IA sem fins lucrativos co-fundada por Elon Musk, apresentaram o Dactyl, um sistema de inteligência artificial treinado para controlar uma mão robotizada.

Segundo os pesquisadores, o sistema pode manipular objetos físicos na mão com destreza nunca antes possível para a IA. No vídeo do Youtube que apresenta o Dactyl, vê-se o robot executar uma tarefa de reconhecimento de letras, justamente como se ensina a uma criança. O robot consegue rodar o cubo por forma a deixar voltado para a camera de filmar a letra que lhe foi solicitada.

Conseguir programar a Inteligência Artificial para concretizar tarefas complexas como esta, que obrigam a uma diversidade grande de movimentos (para rodar o cubo correctamente), e para chegar à resposta correcta, deveria ter demorado muito mais tempo… Contudo, e porque foram utilizados computadores poderosos nesta experiência, para carregarem para dentro da sua base de dados todo o processo de “aprendizagem”, a fim de ensinar o robot a fazer estes movimentos, surpreendentemente conseguiu-se fazer tudo isto em 50 horas.

Em concreto, o processo de aprendizagem que foi “carregado” para dentro da IA, treinando-a em ambiente simulado, ou seja através de uma mão virtual gerada dentro de um computador, chama-se randomização de domínio. Em resumo, são determinados parâmetros em ambiente simulado, como o tamanho do cubo ou o ângulo de gravidade, e depois randomiza-se as variáveis. A questão é que resultou, pelo que se pode ensinar muito mais tarefas ou procedimentos a esta mão, randomizando variáveis diferentes…

Surpreendentemente, a mão robotizada acertou nos resultados 50 vezes de seguida, o que dá uma certa margem de segurança sobre se foi ou não um verdadeiro sucesso. Principalmente porque as expectativas eram baixas: pretendia-se que o Dactyl não deixasse cair o cubo e que não demorasse mais de 80 segundos a concluir a tarefa. O sucesso é óbvio, mas há ainda mais:

Qualquer Geek, Nerd, ou Tech Fan conhece o jogo Dota 2. Os pesquisadores da OpenAI Five resolveram testar o Dactyl numa tarefa de aprendizagem completamente diferente (como é jogar este jogo com resultados efectivos), mas usando o mesmo algoritmo.

Este algoritmo foi utilizado em 5 RNA’s ou Redes Neuronais treinadas para jogar este jogo de estratégia, e os resultados foram também um sucesso. Veja-se aqui:

O algoritmo do Dactyl para jogar Dota 2 tem que escolher entre 1.000 movimentos potenciais a cada um oitavo de segundo. É portanto impressionante que neste jogo em que se defrontam 5 jogadores contra outros 5, o algoritmo do Dactyl tenha conseguido cooperar com os jogadores humanos, para conseguirem chegar à vitória…

O Dota 2 é um jogo que corre a 30 FPS (frames per second), com uma duração em média de 45 por jogo. Com 5 jogadores de cada lado (num total de 10 jogadores), estima-se que entre clicks apontando a direcção, clicks para atacar, fugir e defender, os 10 jogadores introduzam cerca de 80.000 novas ordens no jogo, irrepetíveis, ao longo da duração do embate. Isso significa que a AI tem que analisar todas estas ordens e perceber de que forma poderá cooperar para a vitória.

Para pôr as coisas em perspectiva, por exemplo o xadrez “normalmente” acaba antes da jogada número 40, e o GO antes da jogada número 150…

Resumidamente, o conjunto de testes do Dactyl demonstra 2 coisas: o mesmo algoritmo é capaz aprender várias tarefas diferentes usando o mesmo algoritmo, e que para ensinar a inteligência artificial os programadores não têm que começar sempre do zero.

Nota: Aceite a sugestão do BIt2Geek e leia Pode a Inteligência Artificial criar Arte? Os robots pintores mostram-nos como.