Oferecido por
Uma Inteligência Artificial que completa missões em um jogo de aventura baseado em texto conversando com os personagens aprendeu não apenas como fazer as coisas, mas como persuadir os outros a realizarem as tarefas. O sistema é um passo em direção às máquinas que podem usar a linguagem como forma de atingir seus objetivos.
Prosa sem sentido: modelos de linguagem como o GPT-3 são brilhantes em imitar frases escritas por humanos, produzir histórias, blogs falsos e postagens no Reddit. Mas há pouco sentido para essa produção prolífica além do próprio texto. Quando as pessoas usam a linguagem, ela é manejada como uma ferramenta: nossas palavras convencem, comandam e manipulam; elas fazem as pessoas rirem e chorarem.
Misturando as coisas: para construir uma Inteligência Artificial que usasse palavras com intenção, os pesquisadores do Instituto de Tecnologia da Geórgia em Atlanta e o Facebook AI Research combinaram técnicas de processamento de linguagem natural (PLN) e aprendizado por reforço, onde modelos de machine learning aprendem como se comportar para alcançar determinados objetivos. Ambos os campos tiveram um enorme progresso nos últimos anos, mas houve pouca troca entre os dois.
Jogos de palavras: para testar sua abordagem, os pesquisadores treinaram seu sistema em um jogo multiplayer baseado em texto chamado LIGHT, desenvolvido pelo Facebook no ano passado para estudar a comunicação entre jogadores humanos e de IA. O jogo é ambientado em um mundo com tema de fantasia cheio de milhares de objetos, personagens e locais colaborativos que podem ser interagidos por meio de texto na tela. Os jogadores (humanos ou computador) agem digitando comandos como “abraçar mago”, “bater no dragão” ou “remover o chapéu”. Eles também podem falar com os personagens controlados pelo chatbot.
A missão do dragão: Para dar à sua IA razões para fazer as coisas, os pesquisadores adicionaram cerca de 7.500 missões colaborativas, não incluídas na versão original do LIGHT. Finalmente, eles também criaram um gráfico de conhecimento (um banco de dados de relações sujeito-verbo-objeto) que deu à IA informações de senso comum sobre o mundo do jogo e as conexões entre seus personagens, como o princípio de que um comerciante só confia em um guarda se eles são amigos. O jogo agora tinha ações (como “Vá para as montanhas” e “Coma o cavaleiro”) para realizar a fim de completar missões (como “Construir o maior tesouro já obtido por um dragão”).
Fala mansa: juntando tudo isso, eles treinaram a IA para completar missões apenas usando a linguagem. Para realizar ações, ele pode digitar o comando para aquela ação ou atingir o mesmo fim conversando com outros personagens. Por exemplo, se a IA precisava de uma espada, ele poderia escolher roubar uma ou convencer outro personagem a entregá-la.
Por enquanto, o sistema é uma brincadeira. E o seu modo de se expressar pode ser direto: a certa altura, precisando de um balde, ele simplesmente diz: “Dê-me aquele balde ou eu você será a comida do meu gato!” Mas misturar PNL com aprendizado por reforço é um passo animador que pode levar não apenas a melhores chatbots que podem argumentar e persuadir, mas também àqueles que têm uma compreensão muito mais rica de como funciona nosso mundo orientado pela linguagem.