Gary Marcus me encontra do lado de fora da agência dos correios da Granville Island, em Vancouver, usando tênis coral neon e uma jaqueta azul da Arc’teryx. Estou na cidade para um evento familiar e Marcus mora nela desde 2018, depois de 20 anos em Nova York. “Acho que é o paraíso”, ele me diz, enquanto o acompanho em sua caminhada diária pela Granville Island e por Kitsilano Beach. Combinamos de caminhar e conversar sobre — o que mais poderia ser além de — o estado atual da IA.
“Estou deprimido com isso”, ele me diz. “Quando entrei nessa área, não foi para que pudéssemos ter uma grande transferência de riqueza dos artistas para as grandes corporações.” Tomo um grande gole de meu café preto de torra escura. Vamos lá.
Marcus, professor emérito da NYU, é um proeminente pesquisador de IA e cientista cognitivo que se posicionou como um crítico vocal da aprendizagem profunda e da IA. Ele é uma figura que divide opiniões. Talvez você o reconheça pelas disputas acirradas no X com nomes importantes da IA, como Yann LeCun e Geoffrey Hinton. (“Todas as tentativas de me socializar fracassaram”, ele brinca.) São em passeios como esse que Marcus costuma tuitar.
O final de fevereiro foi uma época de grandes notícias sobre Inteligência Artificial. O Google DeepMind lançou a próxima geração de seu poderoso modelo de Inteligência Artificial Gemini, que tem uma capacidade aprimorada de trabalhar com grandes quantidades de vídeo, texto e imagens. E a OpenAI criou um novo e impressionante modelo de vídeo generativo chamado Sora, que pode pegar uma breve descrição de texto e transformá-la em um clipe de filme detalhado e de alta definição com até um minuto de duração.
A geração de vídeo por IA já existe há algum tempo, mas o Sora parece ter melhorado as coisas. Minha linha do tempo do X foi inundada com clipes impressionantes que as pessoas criaram usando o software. A OpenAI afirma que seus resultados sugerem que o dimensionamento de modelos de geração de vídeo como o Sora “é um caminho promissor para a criação de simuladores de uso geral do mundo físico”. Você pode ler mais sobre o Sora em Will Douglas Heaven aqui.
Mas — surpresa — Marcus não está impressionado. “Se você olhar [os vídeos] por um segundo, você pensa: ‘Uau, isso é incrível’. Mas se você os observar com cuidado, [o sistema de IA] ainda não entende o senso comum”, diz ele. Em alguns vídeos, a física está claramente errada, e animais e pessoas aparecem e desaparecem espontaneamente, ou coisas voam para trás, por exemplo.
Para Marcus, o vídeo generativo é mais um exemplo do modelo de negócios explorador das empresas de tecnologia. Muitos artistas e escritores, e até mesmo o New York Times, processaram empresas de IA alegando que sua prática de raspar indiscriminadamente a internet em busca de dados para treinar seus modelos viola sua propriedade intelectual. As questões de direitos autorais estão no topo da mente de Marcus. Ele conseguiu fazer com que geradores de imagens de IA populares gerassem cenas de filmes da Marvel ou de personagens famosos, como os Minions, Sonic e Darth Vader. Ele começou a fazer lobby para obter regras mais claras sobre o que entra nos modelos de IA.
“A geração de vídeo não deve ser feita com materiais protegidos por direitos autorais obtidos sem consentimento, em sistemas que são opacos, onde não podemos entender o que está acontecendo”, diz ele. “Isso não deveria ser uma questão legal. Certamente não é uma questão ética.”
Paramos em um ponto panorâmico. É uma rota linda, com vista para a cidade, as montanhas e a praia. Uma mancha de sol atinge o pico de uma montanha do outro lado da baía. Não poderíamos estar mais longe do Vale do Silício, o epicentro do atual boom da IA. “Não sou uma pessoa religiosa, mas esses tipos de quadros… continuam a me impressionar”, diz Marcus.
Mas, apesar da tranquilidade do ambiente, é em caminhadas como essa que Marcus costuma usar o X para criticar as estruturas de poder do Vale do Silício. No momento, diz ele, ele se identifica como ativista.
Quando pergunto o que o motiva, ele responde sem perder o ritmo: “As pessoas que estão administrando a IA não se importam muito com o que se pode chamar de IA responsável e que as consequências para a sociedade podem ser graves”.
No final do ano passado, ele escreveu um livro chamado Taming Silicon Valley (Domando o Vale do Silício), que será lançado no segundo semestre. É seu manifesto sobre como a Inteligência Artificial deve ser regulamentada, mas também um chamado à ação. “Precisamos envolver o público na luta para tentar fazer com que as empresas de IA se comportem de forma responsável”, diz ele.
Há uma série de coisas que as pessoas podem fazer, desde boicotar alguns dos softwares até que as pessoas limpem suas ações, até escolher candidatos eleitorais de acordo com suas políticas tecnológicas, diz ele.
Ações e políticas de IA são necessárias com urgência, ele argumenta, porque estamos em uma janela muito estreita durante a qual podemos consertar as coisas na IA. O risco é cometermos os mesmos erros que os reguladores cometeram com as empresas de mídia social.
“O que vimos com a mídia social será apenas um aperitivo comparado ao que vai acontecer”, diz ele.
Cerca de 12 mil passos depois, estamos de volta ao Granville Island’s Public Market. Estou morrendo de fome, então Marcus me indica um lugar que serve bons bagels. Nós dois pedimos o lox com cream cheese e o comemos sob o sol antes de nos separarmos.
Mais tarde, naquele dia, Marcus enviaria uma enxurrada de tweets sobre o Sora, tendo visto evidências suficientes para afirmar: “Sora é fantástico, mas é semelhante a transformar e dividir, em vez de ser um caminho para o raciocínio físico que precisaríamos para a AGI“, ele escreveu. “Veremos mais falhas sistêmicas à medida que mais pessoas tiverem acesso. Muitas serão difíceis de remediar.”
Não diga que ele não avisou.