×

Teste de Inteligência Artificial (IA): Desafios e Novas Métricas para AGI

Teste de Inteligência Artificial (IA): Desafios e Novas Métricas para AGI

temp_image_1742915985.463933 Teste de Inteligência Artificial (IA): Desafios e Novas Métricas para AGI


Novo Teste Desafia a Inteligência Artificial: ARC-AGI-2 Coloca Modelos à Prova

A Arc Prize Foundation, co-fundada pelo renomado pesquisador de IA François Chollet, lançou um novo e desafiador teste para avaliar a inteligência geral dos principais modelos de IA. O ARC-AGI-2 tem se mostrado um obstáculo para a maioria dos sistemas de IA, revelando lacunas em sua capacidade de raciocínio e adaptação.

O Que Torna o ARC-AGI-2 Tão Difícil?

Ao contrário de testes anteriores, o ARC-AGI-2 foca na eficiência e na capacidade de aprender novas habilidades fora do conjunto de dados de treinamento. Os modelos de IA precisam identificar padrões visuais complexos e gerar soluções criativas, sem depender de ‘força bruta’ ou memorização. Os problemas apresentados são projetados para forçar a IA a se adaptar a situações inéditas.

  • Foco na Eficiência: Avalia a rapidez com que a IA adquire e aplica novas habilidades.
  • Padrões Dinâmicos: Exige interpretação em tempo real, sem memorização.
  • Desafio à ‘Força Bruta’: Impede o uso excessivo de poder computacional.

Resultados Surpreendentes: Humanos Superam a IA

Em testes com humanos, ‘painéis’ de pessoas alcançaram uma média de 60% de acertos no ARC-AGI-2, superando significativamente o desempenho dos modelos de IA. Modelos de raciocínio como o1-pro e R1 marcaram entre 1% e 1.3%, enquanto modelos poderosos como GPT-4.5, Claude 3.7 Sonnet e Gemini 2.0 Flash ficaram em torno de 1%.

Por Que Este Teste é Importante?

A chegada do ARC-AGI-2 ocorre em um momento em que a indústria de tecnologia clama por novos padrões de referência para medir o progresso da IA. Testes tradicionais muitas vezes não conseguem capturar características cruciais da inteligência artificial geral (AGI), como criatividade e adaptabilidade.

Arc Prize 2025: O Desafio Lançado

Juntamente com o novo padrão de referência, a Arc Prize Foundation anunciou o concurso Arc Prize 2025, desafiando desenvolvedores a alcançar 85% de precisão no ARC-AGI-2, gastando apenas $0.42 por tarefa. Este concurso promete impulsionar a inovação e o desenvolvimento de modelos de IA mais eficientes e inteligentes.


Compartilhar isso: