GPT-4 | Tech & AI

Novo Benchmark de Matemática Olímpica Expõe Limites de Raciocínio em Modelos de Linguagem

Novo benchmark de matemática olímpica testa LLMs com problemas avançados e revela limites no raciocínio simbólico e resolução lógica.

há 4 horas2 min de leitura

Novo teste desafia limites da inteligência artificial geral. Modelos como GPT-4 e Claude 3 ainda falham em raciocínio verdadeiramente generalista.

há 1 dia2 min de leitura

Grok 3, da xAI, supera líderes como GPT-4 e Claude 3 e assume o topo dos rankings globais de modelos de linguagem em 2025.

há 1 dia2 min de leitura