Na conferência de clientes e parceiros Intel Vision 2024, a Intel apresentou o acelerador Intel Gaudi 3 para trazer desempenho, abertura e opções para IA generativa empresarial (GenAI), e revelou um conjunto de novos recursos abertos de sistemas escaláveis, produtos de última geração e colaborações estratégicas para acelerar a adoção da GenAI. Com apenas 10% das empresas passando com sucesso os projetos GenAI para produção no ano passado, as ofertas mais recentes da Intel abordam os desafios que as empresas enfrentam no dimensionamento de iniciativas de IA.
“A inovação está avançando em um ritmo sem precedentes, tudo possibilitado pelo silício – e cada empresa está rapidamente se tornando uma empresa de IA”, disse Pat Gelsinger, CEO da Intel. “A Intel está levando a IA para todos os lugares da empresa, desde o PC até o data center e a borda. Nossas mais recentes plataformas Gaudi, Xeon e Core Ultra oferecem um conjunto coeso de soluções flexíveis adaptadas para atender às necessidades em constante mudança de nossos clientes e parceiros e capitalizar as imensas oportunidades que temos pela frente.”
Mais: Intel Vision 2024 (Press Kit) | Intel Vision 2024 Keynote (Livestream) | Intel Tackles the GenAI Gap with Gaudi 3 (News)
As empresas estão buscando escalar a GenAI do piloto à produção. Para fazer isso, elas precisam de soluções prontamente disponíveis baseadas em processadores de alto desempenho e eficientes em termos de custos e energia, como o acelerador Intel Gaudi 3 AI. Gaudi 3 também aborda requisitos de complexidade, fragmentação, segurança de dados e compliance.
Apresentando Gaudi 3 para treinamento e inferência de IA
O acelerador Intel Gaudi 3 AI alimentará sistemas de IA com até dezenas de milhares de aceleradores conectados através do padrão comum de Ethernet. Intel Gaudi 3 promete 4x mais computação de IA para BF16 e um aumento de 1,5x na largura de banda de memória em relação ao seu antecessor. O acelerador proporcionará um salto significativo no treinamento e inferência em IA para empresas globais que buscam implantar GenAI em escala.
Em comparação com o Nvidia H100, o Intel Gaudi 3 foi projetado para fornecer um tempo de treinamento 50% mais rápido, em média, em todos os modelos Llama2 com parâmetros 7B e 13B e modelo de parâmetro GPT-3 175B. Além disso, a taxa de transferência de inferência do acelerador Intel Gaudi 3 é projetada para superar o H100 em 50% em média1 e 40% para a eficiência energética de inferência média entre os parâmetros Llama 7B e 70B e os modelos de parâmetros Falcon 180B.2
O Intel Gaudi 3 fornece software aberto e baseado na comunidade e rede Ethernet padrão do setor. E, além disso, permite que as empresas escalem com flexibilidade de um único nó para clusters, super clusters e mega clusters com milhares de nós, apoiando inferência, ajuste fino e treinamento em maior escala.
O Intel Gaudi 3 estará disponível para OEMs – incluindo Dell Technologies, HPE, Lenovo e Supermicro – no segundo trimestre de 2024.
Leia mais em Intel aborda gaps do GenAI com Gaudi 3.
Gerando valor para clientes com soluções de IA da Intel
A Intel definiu sua estratégia para sistemas de IA abertos e escaláveis, incluindo hardware, software, estruturas e ferramentas. A abordagem da Intel permite que um amplo ecossistema aberto de players de IA ofereça soluções que satisfaçam as necessidades da GenAI específicas das empresas. Isso inclui fabricantes de equipamentos, fornecedores de bancos de dados, integradores de sistemas, fornecedores de software e serviços e outros. Também permite que as empresas utilizem parceiros e soluções do ecossistema que já conhecem e confiam.
A Intel compartilhou um amplo impulso com clientes empresariais de todos os setores para implantar soluções de acelerador Intel Gaudi para aplicações de IA generativas novas e inovadoras:
- NAVER: para desenvolver um modelo LLM poderoso para a implantação de serviços avançados de IA em todo o mundo, da nuvem ao dispositivo. A NAVER confirmou a capacidade fundamental do Intel Gaudi na execução de operações computacionais para modelos de transformer em grande escala com excelente desempenho por watt.
- Bosch: para explorar novas oportunidades para produção inteligente, incluindo modelos fundamentais, gerando conjuntos de dados sintéticos de anomalias de produção para fornecer conjuntos de formação robustos e distribuídos uniformemente para (inspeção óptica automatizada).
- IBM: usando processadores Intel® Xeon® de 5ª geração para seu armazenamento de dados watsonx.data e trabalhando em estreita colaboração com a Intel para validar a plataforma watsonx para aceleradores Intel Gaudi.
- Ola/Krutrim: para treinamento prévio e ajuste em seu modelo fundamental na Índia com recursos geradores em 10 idiomas, produzindo desempenho/custo líder do setor (1,5-2x melhor) versus soluções de mercado. Krutrim está agora treinando um grande modelo fundamental em um cluster de Gaudi 2.
- Advent International/NielsenIQ: para avançar a GenAI em sua plataforma Discover, incluindo o treinamento de Modelos de Linguagem Grande (LLMs) específicos de domínio no maior banco de dados do mundo para o comportamento de compra do consumidor, melhorando seus serviços ao cliente.
- Seekr: líder em IA confiável, executa cargas de trabalho de produção em GPUs Intel Gaudi 2, GPUs Intel Max Series e processadores Intel Xeon na Intel Developer Cloud para desenvolvimento LLM e compatibilidade com a implantação de produção.
- IFF: Líder global em alimentos, bebidas, aromas e biociências, aproveitará a GenAI e a tecnologia de gêmeos digitais para estabelecer um fluxo de trabalho integrado de biologia digital para design avançado de enzimas e otimização do processo de fermentação.
- Grupo CtrlS: colaborando para construir um supercomputador de IA para clientes baseados na Índia e escalando serviços de nuvem CtrlS para a Índia com clusters Gaudi adicionais.
- Bharti Airtel: abraçando o poder da tecnologia de ponta da Intel, a Airtel planeja aproveitar seus ricos dados de telecomunicações para aprimorar seus recursos de IA e turbinar as experiências de seus clientes. As implantações estarão alinhadas com o compromisso da Airtel de permanecer na vanguarda da inovação tecnológica e ajudar a impulsionar novos fluxos de receita em um cenário digital em rápida evolução.
- Landing AI: modelo de visão ampla específico de domínio ajustado para uso na segmentação de células e detecção de câncer.
- Roboflow: execução de cargas de trabalho de produção dos modelos YOLOv5, YOLOv8, CLIP, SAM e ViT para sua plataforma de visão computacional de ponta a ponta.
- Infosys: líder global em serviços digitais de próxima geração e consultoria anunciou uma colaboração estratégica para trazer tecnologias Intel, incluindo processadores Intel Xeon de 4ª e 5ª geração, aceleradores Intel Gaudi 2 AI e Intel® Core™ Ultra para Infosys Topaz – um conjunto de serviços, soluções e plataformas de IA que aceleram o valor dos negócios usando tecnologias de IA generativas.
A Intel também anunciou colaborações com o Google Cloud, Thales e Cohesity para aproveitar os recursos de computação confidencial da Intel em suas instâncias de nuvem. Isso inclui Intel® Trust Domain Extensions (Intel® TDX), Intel® Software Guard Extensions (Intel® SGX) e o serviço de atestado da Intel. Os clientes podem executar seus modelos e algoritmos de IA em um ambiente de execução confiável (TEE) e aproveitar os serviços de confiança da Intel para verificar independentemente a confiabilidade desses TEEs.
O ecossistema se reúne para desenvolver uma plataforma aberta para IA empresarial
Em colaboração com Anyscale, Articul8, DataStax, Domino, Hugging Face, KX Systems, MariaDB, MinIO, Qdrant, RedHat, Redis, SAP, VMware, Yellowbrick e Zilliz, a Intel anunciou a intenção de criar uma plataforma aberta para IA corporativa. O esforço em todo o setor visa desenvolver sistemas GenAI abertos e de vários fornecedores que ofereçam a melhor facilidade de implantação, desempenho e valor da categoria, habilitados pela geração aumentada de recuperação. O RAG permite que as vastas fontes de dados proprietárias existentes das empresas rodando em infraestrutura de nuvem padrão sejam aumentadas com recursos de LLM aberto, acelerando o uso do GenAI nas empresas.
Como etapas iniciais desse esforço, a Intel lançará implementações de referência para pipelines GenAI em soluções seguras baseadas em Intel Xeon e Gaudí, publicará uma estrutura conceitual técnica e continuará a adicionar capacidade de infraestrutura no Intel Tiber Developer Cloud para desenvolvimento e validação de ecossistema de RAG e pipelines futuros. A Intel incentiva uma maior participação do ecossistema para unir forças neste esforço aberto para facilitar a adoção empresarial, ampliar a cobertura de soluções e acelerar os resultados de negócios.
Roadmap expandido de IA e abordagem de ecossistema aberto da Intel
Além do acelerador Intel Gaudi 3, a Intel forneceu atualizações sobre seus produtos e serviços de próxima geração em todos os segmentos de IA empresarial.
Novos processadores Intel® Xeon® 6: Os processadores Intel Xeon oferecem soluções eficientes em termos de desempenho para executar as soluções GenAI atuais, incluindo RAG, que produzem resultados específicos de negócios usando dados proprietários. A Intel apresentou a nova marca para sua próxima geração de processadores para data centers, nuvem e borda: Intel Xeon 6. Os processadores Intel Xeon 6 com novos núcleos eficientes (E-cores) oferecerão eficiência excepcional e serão lançados neste trimestre, enquanto os processadores Intel Xeon 6 com núcleos de desempenho (núcleos P) oferecerão maior desempenho de IA e serão lançados logo após os processadores E-core.
- Processadores Intel Xeon 6 com E-cores (codinome Sierra Forest):
- Melhoria de desempenho de 2,4x por watt4 e densidade de rack 2,7x melhor5 em comparação com os processadores Intel® Xeon® de 2ª geração.
- Os clientes podem substituir sistemas mais antigos em uma proporção de quase 3 para 1, reduzindo drasticamente o consumo de energia e ajudando a cumprir as metas de sustentabilidade6.
- Processadores Intel Xeon 6 com P-cores (codinome Granite Rapids):
- Incorpore suporte de software para o formato de dados MXFP4, que reduz a latência do próximo token em até 6,5x em comparação com os processadores Intel Xeon® de 4ª geração usando FP16, com a capacidade de executar modelos Llama-2® de 70 bilhões de parâmetros7.
Cliente, borda e conectividade: a Intel anunciou impulso para cliente e atualizações em seu roteiro para borda e conectividade, incluindo:
- Os processadores Intel® Core™ Ultra estão potencializando novos recursos para produtividade, segurança e criação de conteúdo, fornecendo uma grande motivação para as empresas atualizarem suas frotas de PCs. A Intel espera lançar 40 milhões de PCs de IA em 2024, com mais de 230 designs, de PCs ultrafinos a dispositivos portáteis para jogos.
- A próxima geração da família de processadores cliente Intel Core Ultra (codinome Lunar Lake), lançada em 2024, terá mais de 100 operações de plataforma por segundo (TOPS) e mais de 45 TOPS de unidade de processamento neural (NPU) para PCs de IA de próxima geração.
- A Intel anunciou um novo silício de borda nas famílias de produtos Intel Core Ultra, Intel® Core e Intel® Atom e unidades de processamento gráfico (GPU) Intel® Arc™, visando mercados-chave, incluindo varejo, manufatura™ industrial e saúde. Todas as novas adições ao portfólio de IA de borda da Intel estarão disponíveis neste trimestre e serão suportadas pela plataforma Intel® Tiber™ Edge este ano.
- Por meio do Ultra Ethernet Consortium (UEC), a Intel está liderando a rede Ethernet aberta para malhas de IA, introduzindo uma matriz de soluções Ethernet otimizadas para IA. Projetadas para transformar tecidos de IA em grande escala e scale-out, essas inovações permitem treinamento e inferência para modelos cada vez mais vastos, com tamanhos se expandindo em uma ordem de magnitude em cada geração. A linha inclui a Intel AI NIC, processadores de conectividade IA para integração em XPUs, sistemas baseados em Gaudi e uma variedade de designs de interconexão de IA de referência suave e rígida para Intel Foundry.
Portfólio de soluções empresariais Intel® Tiber™
A Intel revelou o portfólio de soluções empresariais Intel® Tiber™ para agilizar a implantação de software e serviços empresariais, inclusive para GenAI.
Uma experiência unificada torna mais fácil para clientes empresariais e desenvolvedores encontrar soluções que atendam às suas necessidades, acelerar a inovação e liberar valor sem comprometer a segurança, a conformidade ou o desempenho. Os clientes podem começar a explorar o portfólio Intel Tiber a partir de hoje, com lançamento completo planejado para o terceiro trimestre de 2024. Saiba mais em intel.com/tiber.
Os anúncios da Intel no Vision 2024 ressaltam o compromisso da empresa em tornar a IA acessível, aberta e segura para empresas em todo o mundo. Com essas novas soluções e colaborações, a Intel está preparada para liderar a revolução da IA, liberando valor sem precedentes para empresas em todo o mundo.
Para obter mais informações sobre as soluções de IA da Intel e os anúncios do Vision 2024, visite Intel Newsroom.
Letras pequenas
¹Comparação da Nvidia baseada em: https://developer.nvidia.com/deep-learning-performance-traininginference/training, 29 de janeiro de 2024 -> guia “Large Language Model” versus projeções G3. Em 28/03/2024. Os resultados podem variar.
²Comparação da Nvidia baseada em https://nvidia.github.io/TensorRT-LLM/performance.html#h100-gpus-fp8, 28 de março de 2024. Os números relatados são por GPU versus projeções G3. Em 28/03/2024. Software Intel Gaudi 1.14.0. Os resultados podem variar.
³ Com base em projeções arquitetônicas de 14 de fevereiro de 2023 em comparação com plataformas da geração anterior. Seus resultados podem variar.
4 Com base em projeções arquitetônicas de 14 de fevereiro de 2023 em comparação com plataformas da geração anterior. Seus resultados podem variar.
5 Com base em projeções arquitetônicas de 14 de fevereiro de 2023 em comparação com plataformas da geração anterior. Seus resultados podem variar.
6 Com base em projeções arquitetônicas de 21 de agosto de 2023, relativas aos processadores Intel Xeon de 4ª geração. Seus resultados podem variar.
7TBC
Declarações Prospectivas
Este comunicado contém declarações prospectivas, inclusive com relação a:
- nossos planos de negócios e estratégia e benefícios previstos a partir deles;
- nossa estratégia de IA e aceleradores de IA;
- nossa abordagem de plataformas abertas e suporte ao ecossistema em relação à IA; e
- outras caracterizações de eventos ou circunstâncias futuras.
Tais declarações envolvem muitos riscos e incertezas que podem fazer com que nossos resultados reais difiram materialmente daqueles expressos ou implícitos, incluindo aqueles associados a:
- o elevado nível de concorrência e a rápida evolução tecnológica na nossa indústria;
- os investimentos significativos de longo prazo e inerentemente arriscados que estamos fazendo em P&D e instalações de fabricação que podem não obter um retorno favorável;
- as complexidades e incertezas no desenvolvimento e implementação de novos produtos semicondutores e tecnologias de processo de fabricação;
- nossa capacidade de cronometrar e escalar nossos investimentos de capital adequadamente e garantir com sucesso arranjos de financiamento alternativos favoráveis e subsídios governamentais;
- implementar novas estratégias de negócios e investir em novos negócios e tecnologias;
- mudanças na demanda por nossos produtos;
- condições macroeconômicas e tensões geopolíticas e conflitos, incluindo tensões geopolíticas e comerciais entre os EUA e a China, os impactos da guerra da Rússia na Ucrânia, tensões e conflitos que afetam Israel e tensões crescentes entre a China continental e Taiwan;
- a evolução do mercado de produtos com recursos de IA;
- nossa complexa cadeia de suprimentos global, inclusive de interrupções, atrasos, tensões comerciais e conflitos, ou escassez;
- defeitos do produto, errata e outros problemas do produto, particularmente à medida que desenvolvemos produtos de próxima geração e implementamos tecnologias de processo de fabricação de próxima geração;
- potenciais vulnerabilidades de segurança em nossos produtos;
- aumento e evolução das ameaças à cibersegurança e dos riscos à privacidade;
- Riscos de PI, incluindo litígios relacionados e procedimentos regulatórios;
- a necessidade de atrair, reter e motivar talentos-chave;
- transações e investimentos estratégicos;
- riscos relacionados a vendas, incluindo a concentração de clientes e o uso de distribuidores e outros terceiros;
- nosso retorno de capital significativamente reduzido nos últimos anos;
- nossas obrigações de dívida e nossa capacidade de acessar fontes de capital;
- leis e regulamentos complexos e em evolução em muitas jurisdições;
- flutuações nas taxas de câmbio;
- alterações na nossa alíquota efetiva;
- eventos catastróficos;
- regulamentações ambientais, de saúde, segurança e produtos;
- nossas iniciativas e novos requisitos legais em matéria de responsabilidade corporativa; e
- outros riscos e incertezas descritos neste comunicado, nosso Relatório Anual mais recente no Formulário 10-K e nossos outros registros na Comissão de Valores Mobiliários dos EUA (SEC).
Todas as informações nesta versão refletem as expectativas do gerenciamento a partir da data desta versão, a menos que uma data anterior seja especificada. Nós não nos comprometemos, e nos isentamos expressamente, de atualizar tais declarações, seja como resultado de novas informações, novos desenvolvimentos ou de outra forma, exceto na medida em que a divulgação possa ser exigida por lei.