Por que isso importa: a visão computacional é essencial para muitas aplicações de Inteligência Artificial (IA) – de carros sem motorista e robôs industriais a sensores inteligentes que agem como nossos olhos em locais remotos – e as máquinas se tornaram muito boas em responder ao que veem. Mas a maioria dos softwares de reconhecimento de imagem precisa de muito poder computacional para funcionar. Parte do problema é um obstáculo encontrado nos sensores tradicionais, que capturam uma enorme quantidade de dados visuais, independentemente de serem úteis ou não para classificar uma imagem. O processamento de todos esses dados torna as coisas mais lentas.
Um sensor que captura e processa as imagens simultaneamente, sem converter ou repassar os dados, faz com que o uso do reconhecimento de imagem seja muito mais rápido e consuma muito menos energia. O projeto, publicado no dia 4 de março na Nature pelos pesquisadores do Institute of Photonics de Viena, imita a forma que os olhos de animais pré-processam as informações visuais antes de repassá-las para o cérebro.
Como funciona: A equipe construiu o chip a partir de uma lâmina de disseleneto de tungstênio com apenas alguns átomos de espessura, entalhada com diodos sensores de luz. Os pesquisadores então conectaram os diodos para formar uma rede neural. O material usado para fabricar o chip fornece propriedades elétricas únicas, de modo que a fotossensibilidade dos diodos – os nós da rede – pode ser ajustada externamente. Isso significava que a rede poderia ser treinada para classificar as informações visuais, adequando a sensibilidade dos diodos até que se conseguisse as respostas corretas. Dessa maneira, o chip inteligente foi treinado para reconhecer versões estilizadas e pixelizadas das letras “n”, “v” e “z”.
Visão limitada: Este novo sensor é outro passo emocionante do caminho para começar a incluir mais IA para as máquinas, tornando-as mais rápidas e eficientes. Mas ainda há um longo percurso pela frente. Para começar, o olho consiste em apenas 27 detectores e não pode lidar com muito mais do que imagens compactadas 3×3. Mesmo pequeno, o chip pode executar várias tarefas básicas de machine learning supervisionadas e não supervisionadas, incluindo a classificação e codificação de letras. Os pesquisadores argumentam que expandir a rede neural em tamanhos muito maiores seria simples.