Estudo faz comparação entre agentes de IA e humanos. Quem ganhou?

Agentes de IA e humanos

Em um confronto direto quem venceria – os homens ou os robôs? Os pesquisadores da Carnegie Mellon e da Stanford NLP se uniram para encaminhar esta questão e os resultados foram surpreendentes (fique até o final para saber quem ganhou).

O estudo entendeu como os agentes de IA (leia-se, os robôs) realizam o trabalho humano, apresentando a primeira comparação direta entre trabalhadores humanos e agentes em múltiplas habilidades essenciais relacionadas ao trabalho como análise de dados, engenharia, computação, redação e design.

Este foi um estudo tipo força-tarefa e reuniu pesquisadores das duas instituições. A Universidade Carnegie Mellon é referência em estudos sobre IA, ciência da computação e robótica e a Universidade Stanford mantem o Stanford NLP, laboratório de linguística computacional. Eles analisaram as principais estruturas de agentes de IA, ChatGPT, Claude’s Manus e OpenHands.

Uma constatação é que os agentes de IA são ideais (“otimizados”) para tarefas que envolvem engenharia de software e redação profissional, realizadas pelos humanos e sinalizam uma tendência que terá impactos significativos na força de trabalho humana. O problema é que os agentes não têm uma compreensão clara de como os humanos executam o trabalho.

O estudo demonstrou que agentes e humanos apresentam vantagens respectivas em diferentes tipos de tarefas: agentes podem resolver etapas facilmente programáveis (linguagem de programação) de forma eficiente e com qualidade razoável enquanto os humanos são mais precisos em tarefas menos programáveis, onde os agentes frequentemente falharam.

Agentes de IA versus humanos no design

O pessoal da The Neuron, publicação especializada em IA, diz que em tarefas como um trabalho de webdesign e design, por exemplo, os agentes de IA são “viciados” em código ao passo que os humanos realizam tarefas começando pelo visual e dão um exemplo: “a maioria dos humanos abre o Figma e começa a arrastar elementos. Já os agentes de IA escrevem scripts em Python ou HTML para gerar imagens programaticamente. É como ver alguém resolver um quebra-cabeça escrevendo um algoritmo em vez de simplesmente usar as mãos”.

O estudo “concluiu que os agentes de IA atuais abordam o trabalho humano por meio de uma perspectiva puramente programática: eles traduzem até mesmo tarefas abertas e visualmente fundamentadas em código, divergindo acentuadamente dos fluxos de trabalho humanos orientados pela percepção e pela interface”.

“Esse viés interrompe e torna mais lentos os fluxos de trabalho humanos quando a IA é usada para automação, embora seu impacto seja muito menor em cenários de aumento da capacidade humana. Apesar de problemas sistemáticos de qualidade, como fabricação de dados e uso indevido de ferramentas, o trabalho dos agentes demonstra um grande potencial de eficiência que se estende a diversos domínios. Maximizar esse potencial requer a integração de etapas humanas e de agentes com base em uma compreensão mais profunda de suas forças complementares”

“Olhando para o futuro, os pesquisadores defendem o desenvolvimento de agentes inspirados em fluxos de trabalho que estendam o raciocínio programático para além dos domínios da engenharia, ao mesmo tempo que fortalecem a fundamentação visual, a memória de fluxo de trabalho e a calibração de ações dos agentes. Ancorar o design futuro de agentes no estudo dos fluxos de trabalho humanos pode fomentar sistemas que operem com rigor e compreensão em todo o cenário em constante evolução do trabalho humano”.

Em resumo: 1) os agentes de IA são mais rápidos (concluíram as tarefas 88% mais rápido do que os humanos) e os humanos têm mais qualidade – alcançaram taxas de sucesso significativamente maiores em todos os tipos de tarefas; 2) Os agentes de IA custam de 90 a 96% menos que os trabalhadores humanos.

Este site usa cookies para lhe oferecer uma melhor experiência de navegação. Ao navegar neste site, você concorda com o uso de cookies.
Mais Info