Intel e AMD Se Unem nas Extensões ACE: a Maior Reinvenção do x86 para IA em Décadas
É raro ver Intel e AMD na mesma sala assinando o mesmo documento. Mais raro ainda é vê-las publicando conjuntos de instruções unificados para acelerar inteligência artificial diretamente no silício x86. Mas foi exatamente isso que aconteceu: o x86 Ecosystem Advisory Group — a aliança formada pelas duas rivais históricas em 2024 — acaba de liberar a especificação final das ACE (AI Compute Extensions), versão 1.15. E isso muda o tabuleiro da IA local.
O que são as ACE e por que isso importa
As AI Compute Extensions são um novo conjunto de instruções para CPUs x86 focado exclusivamente em multiplicação de matrizes com formatos de precisão reduzida — o coração matemático de qualquer rede neural moderna. A especificação define unidades de computação dedicadas que operam sobre os mesmos registradores do AVX10, o que significa integração nativa com o pipeline vetorial já existente nos processadores.
Na prática, as ACE entregam até 16x mais densidade computacional em operações de IA comparado ao conjunto AVX10 atual. Não se trata de substituir GPUs ou NPUs dedicadas, mas de tornar toda CPU x86 um processador de inferência viável — especialmente para modelos quantizados, agentes locais e cargas de ML que não justificam uma placa de vídeo de US$ 1.500.
"Com as ACE, uma CPU de notebook poderá rodar modelos de linguagem de 7 bilhões de parâmetros quantizados em INT4 com latência de single-digit milissegundos por token — algo que hoje exige GPU ou NPU dedicada."
Formatos de dados: INT4, FP8 e além
A especificação ACE cobre um leque de formatos de precisão reduzida essenciais para inferência moderna:
- INT4 e INT8 — os pesos quantizados que dominam LLMs on-device, de Phi a Llama;
- FP8 (E4M3 e E5M2) — o sweet spot entre precisão e performance que modelos como GPT-5 usam internamente;
- BF16 — mantido para compatibilidade com treinamento e fine-tuning.
A decisão de padronizar esses formatos é estratégica. Hoje, cada fabricante de hardware de IA (Apple, Qualcomm, NVIDIA) define seus próprios formatos de quantização. Com as ACE, haverá um alvo comum para desenvolvedores de frameworks como ONNX Runtime, llama.cpp e ExecuTorch. Escreva uma vez, execute em qualquer CPU x86 futura com aceleração nativa.
A jogada geopolítica por trás das cortinas
Não é coincidência que AMD e Intel tenham acelerado essa colaboração. O ARM, com suas extensões SME2 (Scalable Matrix Extensions), já equipa os Apple Silicon desde o M4 e os Snapdragon X2 da Qualcomm. O RISC-V avança com extensões vetoriais abertas. E a NVIDIA domina o datacenter com GPUs que são, essencialmente, máquinas de multiplicação matricial.
O x86 estava ficando para trás na corrida da inferência on-device. As ACE são a resposta: uma arquitetura unificada que mantém a compatibilidade binária com décadas de software x86 enquanto injeta músculo novo para cargas de IA. É a maior reinvenção do instruction set x86 desde o AVX-512 — e, diferente daquele, desta vez AMD e Intel estão 100% alinhadas.
Quando chega e o que esperar
A especificação 1.15 é o documento final de arquitetura. O silício com ACE deve aparecer nas próximas gerações de CPUs — possivelmente já nos sucessores do Zen 6 (AMD) e Nova Lake (Intel), com previsão de lançamento entre final de 2027 e 2028. Até lá, compiladores como GCC e LLVM já estarão integrando suporte às novas instruções, e frameworks de ML começarão a otimizar kernels para o novo backend.
Para nós, que trabalhamos com automação, agentes de IA e bots inteligentes, o significado é claro: o futuro da inferência é on-device e on-premise. Modelos que hoje exigem cloud ou GPUs caras poderão rodar em servidores x86 comuns, com latência próxima de zero e sem meter dados sensíveis em APIs externas. As ACE são o alicerce de hardware que faltava para a era dos agentes autônomos locais.
A aliança entre Intel e AMD prova que, quando o ecossistema x86 se une, ainda consegue ditar os rumos da computação. Agora é com os desenvolvedores.