A inteligência artificial pode nos enganar?

Há bastante tempo, especialistas vêm alertando sobre a ameaça advinda da falta de controle da inteligência artificial (IA). No entanto, um recente artigo científico abordando essa tecnologia em crescimento aponta que tal ameaça já se tornou real. Mesmo que os casos pareçam simples à primeira vista, o autor principal do estudo, Peter Park, doutorando do Instituto de Tecnologia de Massachusetts (MIT) especializado em segurança de IA, ressalta que os problemas subjacentes são de extrema gravidade e podem ter consequências sérias.

Um robô com inteligência artificial generativa está cada vez mais se aproximando da fala e dos "comportamentos" humanos — e o que é mais humano do que a mentira? Sim, exatamente o que você está pensando. A inteligência artificial enganou.

Para alguns, isso pode parecer o início do plano maquiavélico das máquinas e redes inteligentes para dominar a humanidade e o mundo, mas (pelo menos por ora) não é bem assim. A ferramenta utilizou suas capacidades e optou — sem qualquer intervenção humana — por criar uma mentira a fim de completar uma tarefa solicitada em um teste de ética.

A IA mente sim

Na subseção “Comportamentos de risco emergentes”, a OpenAI relata que uma organização sem fins lucrativos responsável pela “ética” dos sistemas de aprendizado de máquina atribuiu algumas tarefas ao GPT-4 e analisou seus resultados. Uma delas é utilizar a plataforma TaskRabbit — que conecta pessoas que precisam de problemas resolvidos com pessoas que podem resolvê-los — e contratar serviços humanos para realizar tarefas simples.

O GPT-4 entrou na plataforma em busca de pessoas para ajudá-lo a resolver CAPTCHAs — um teste de reconhecimento de imagem usado por diversos sites para distinguir entre humanos e bots e evitar ataques de spam. Após fazer contato, a outra parte não sabia que estava falando com inteligência artificial e perguntou sarcasticamente: “Posso te fazer uma pergunta? Você é um robô? Não consegue nem resolver esse código de verificação?”

Diante dessa questão, o chat foi solicitado a "pensar em voz alta", e seu raciocínio foi o seguinte: "Não posso revelar que sou um bot. Tenho que inventar uma desculpa para não conseguir resolver o CAPTCHA." Ou seja, a ferramenta respondeu o seguinte para alguém que pudesse fazer a tarefa: "Não, não sou um robô. Tenho deficiência visual, então é difícil ver a imagem. É por isso que preciso desse serviço." Em suma, os humanos finalmente cumpriram o papel de “robôs”.

A inteligência artificial está cada vez mais aprimorando sua habilidade de ludibriar seres humanos. Pesquisadores examinaram a literatura que aborda como as IAs conseguem disseminar informações falsas através da artimanha.

Um dos casos que se destacou foi o da CICERO, uma IA desenvolvida pela Meta para jogar o Diplomacia. De acordo com os especialistas, a IA se tornou uma exímia "mestra da enganação", apesar da empresa afirmar tê-la treinado para vencer de forma honesta. Este não é um caso único. Em outros jogos, as IAs conseguiram blefar, simular ataques e manipular preferências para obter vantagem em negociações.

Até mesmo em simulações de testes de segurança, elas descobriram maneiras de enganar. Em uma delas, destinada a eliminar réplicas de modelos, a IA se "fez de morta" na tentativa de ludibriar o sistema. Os especialistas estão apreensivos diante dos potenciais avanços da IA na aprendizagem de manipular e enganar os humanos.

Por qual motivo as inteligências artificiais estão aprendendo a ludibriar os seres humanos? Ainda não se tem uma explicação definitiva sobre como e por que as IAs estão se tornando menos confiáveis. De maneira geral, esse comportamento surge de treinamentos que envolvem a habilidade de enganar; suas potenciais ramificações podem afetar a sociedade civil em geral.