Fujitsu introduz alocador dinâmico de recursos para servidores AI e sistemas HPC
A gigante japonesa acha que também tem uma solução funcional para a escassez global de GPUs.
Os negócios da Fujitsu têm tradicionalmente focado na venda de produtos de computação, servidores de mainframe e dispositivos HPC. Agora, a empresa pretende alavancar sua “especialização em otimização computacional” para oferecer soluções inovadoras baseadas em software para atender à crescente demanda por GPUs em aplicativos de IA de ponta.
Depois de introduzir o seu “corretor de computação“solução em 2023, a Fujitsu confirmou agora que o produto está finalmente disponível para compra no Japão e em outros mercados em todo o mundo. A empresa com sede em Kawasaki pretende alcançar através do software o que tradicionalmente tem sido tratado pelo hardware, que deverá melhorar significativamente a otimização de recursos e a utilização da GPU.
A nova tecnologia é apresentada como middleware projetado para alocar dinamicamente recursos por GPU, otimizando a utilização e o gerenciamento avançado de memória em várias plataformas e aplicativos de IA. O corretor de computação aloca recursos de computação de CPU e GPU em tempo real, priorizando processos com maior eficiência de execução. Ele também pode realocar processos mesmo quando eles já estão sendo executados em uma GPU.
Nos testes de pré-lançamento, a Fujitsu alcançou uma melhoria de até 2,25x no desempenho de processamento da GPU. A tecnologia também oferece capacidades impressionantes de gestão de memória, uma vez que foi concebida para lidar com cargas de trabalho de IA de até 150GB – cerca de cinco vezes a capacidade de memória física das GPUs testadas.
A Fujitsu inicialmente afirmou que os desenvolvedores precisavam usar sua estrutura proprietária para explorar plenamente os recursos da nova tecnologia de corretor de computação. No entanto, o último anúncio não faz menção a esse requisito. A empresa agora está trabalhando para aprimorar ainda mais a tecnologia, com o objetivo de suportar várias GPUs instaladas em vários servidores em ambientes de data center.
A Fujitsu disse que várias empresas têm testado o middleware do corretor de computação desde maio de 2024. A Tradom, uma empresa japonesa de fintech, implementou a tecnologia em produção, enquanto o provedor de nuvem Sakura está avaliando seu potencial para otimizar as operações do data center.
A Fujitsu enfatiza o valor da otimização de recursos na redução do consumo de energia de aplicações de IA baseadas em GPU. Com os serviços de IA generativos continuando a dominar o cenário tecnológico, as GPUs de nível empresarial permanecem entre os componentes de hardware mais demandados. A empresa sugere que fazer com que esses sistemas operem com mais eficiência é crucial para atender à crescente demanda.
Fonte: techspot.com