Pesquisa revela fraqueza de IA em teste de atenção clássico

Um estudo recente revelou que os modelos de inteligência artificial (IA) enfrentam dificuldades significativas em manter a atenção durante tarefas complexas. Pesquisadores liderados por Suketu Patel aplicaram um teste psicológico clássico, conhecido como teste de Stroop, em diversas IAs, observando uma queda drástica na precisão conforme a complexidade da tarefa aumentava.
Estudo analisa desempenho de IA em teste psicológico
O teste de Stroop é amplamente utilizado na psicologia para investigar a atenção e o controle executivo. No experimento, palavras que representam cores, como “vermelho” e “azul”, são apresentadas em tintas de cores diferentes. Os participantes devem nomear a cor da tinta, ignorando a palavra escrita, o que exige um esforço consciente para suprimir a leitura automática.
O que é o teste de Stroop?
O teste de Stroop avalia a capacidade de um indivíduo em controlar respostas automáticas. Quando a palavra e a cor da tinta coincidem, a tarefa é simples. No entanto, quando há conflito, como a palavra “vermelho” escrita em tinta azul, a dificuldade aumenta. Esse teste é usado para medir a capacidade de atenção e resistência a distrações, aspectos fundamentais do controle executivo.
Resultados do teste com modelos de linguagem
Os pesquisadores aplicaram o teste a modelos de linguagem de última geração, como GPT-4o e Claude 3.5 Sonnet. Os resultados mostraram que, enquanto o GPT-4o alcançou 91% de precisão em listas curtas de cinco palavras, essa taxa caiu para 57% com dez palavras e para apenas 15% ao lidar com listas de quarenta palavras. Claude 3.5 Sonnet apresentou desempenho estável até vinte palavras, mas caiu para 24% em listas mais longas.
Implicações sobre a atenção humana e artificial
Os resultados indicam que os sistemas de IA têm dificuldades em manter a atenção sob condições de distração, revelando uma diferença fundamental em relação ao funcionamento da atenção humana. Enquanto os humanos conseguem sustentar o foco mesmo em tarefas desafiadoras, as IAs tendem a falhar quando confrontadas com informações conflitantes. Essa pesquisa sugere limitações inerentes aos modelos de linguagem atuais, destacando que, apesar de suas capacidades avançadas, a IA ainda enfrenta desafios significativos em tarefas que exigem controle cognitivo.
Os achados do estudo foram publicados na revista PNAS Nexus. A pesquisa contribui para a compreensão das diferenças entre a atenção humana e a artificial, ressaltando a necessidade de aprimoramento nos modelos de IA para que possam lidar com tarefas que exigem maior controle executivo.






