Um servidor de GPU dedicado é um servidor com uma ou mais unidades de processamento gráfico (GPUs, Graphics Processing Units) que oferece mais potência e velocidade para executar tarefas com uso intensivo de computação, como renderização de vídeo, análise de dados e aprendizado de máquina. Os servidores dedicados de GPU também podem ter uma CPU especializada e vêm com grandes quantidades de RAM e armazenamento.
A arquitetura paralela de uma GPU, originalmente desenvolvida para lidar com processamento de gráficos e vídeos, permite que um servidor dedicado de GPU gerencie várias tarefas simultaneamente em velocidades além das capacidades de um servidor baseado em CPU.
O que é um servidor de rack de GPU?
Um servidor de rack de GPU é um servidor equipado com GPUs desenvolvidas para caber em um rack de servidor. Um rack de servidor é uma estrutura retangular com vários slots de montagem desenvolvidos para armazenar servidores de rack e outros componentes de rede. Os servidores são empilhados uns sobre os outros para minimizar o uso do espaço físico e são deslizados para dentro e para fora do rack conforme necessário.
Um servidor de rack de GPU oferece várias vantagens, incluindo melhor utilização do espaço, maior escalabilidade, fluxo de ar maximizado e manutenção mais fácil.
Razões para usar um servidor de GPU dedicado
As GPUs são as contrapartes para CPUs especializadas e otimizadas para taxa de transferência. Em vez de ter alguns núcleos pesados com altas velocidades de clock capazes de realizar uma grande variedade de tarefas computacionais, as GPUs empregam milhares de núcleos leves otimizados para processar a mesma operação em paralelo (ou seja, instrução única, vários dados [SIMD]).
Esses núcleos têm conjuntos de instruções otimizados para cálculos de ponto flutuante e aritmético de matriz dimensional, acelerando a álgebra linear. O resultado final é um sistema otimizado para computação paralela.
Os motivos pelos quais você pode querer usar um servidor de GPU dedicado incluem:
- Fluxos de análise de Big Data
- Transmissão de vídeo
- Processamento de imagens
- Animações e simulações em 3D (por exemplo, a modelagem do dobramento da cadeia proteica)
- Aplicativos de aprendizagem profunda (por exemplo, reconhecimento de fala)
- Rachadura de hash (por exemplo, recuperação de senha)
- Criptomoeda de mineração
Se você tem uma única operação que precisa ser acelerada e que pode se beneficiar da execução paralela em milhares de núcleos, um servidor de GPU dedicado pode ajudar.
Tipos de servidores de rack de GPU
Os servidores de rack de GPU se encaixam em servidores de rack ou gabinetes. Os racks de servidores e os equipamentos instalados neles são medidos em unidades de rack, gravados como “U” ou, às vezes, “RU”. Um “U” descreve a altura do equipamento (por exemplo, a altura de um servidor ou a altura e o número de prateleiras em um rack de servidores).
Um U é igual a 1,75 polegadas, de modo que a altura de um servidor 1U seria de 1,75 polegadas e um servidor 2U seria de 3,5 polegadas. Uma unidade de rack de 32U, por exemplo, pode comportar 32 servidores 1U, 4 servidores 8U ou 1 servidor 32U.
Leia “Um guia definitivo para tamanhos de rack de servidor de 19-Inch” para obter mais informações sobre o dimensionamento de rack.
Fatores de forma menores vs. fatores de forma maiores
As principais diferenças entre os fatores de forma de servidor de rack menor e maior são sua densidade e capacidade de expansão.
Servidores rack de GPU 1U e 2U
Fatores de forma menores, como servidores rack de GPU 1U e 2U, são desenvolvidos com a densidade de desempenho em mente, mas são menos potentes do que fatores de forma de servidor de GPU maiores. Eles são comumente usados devido aos custos mais baixos e à capacidade de economizar espaço no rack do servidor.
Os servidores rack de GPU 1U e 2U são fáceis de manter, altamente portáteis e fáceis de expandir (você pode expandir o desempenho usando vários deles). Um servidor 1U normalmente pode ter uma CPU ou dois, vários terabytes de memória e várias GPUs. Um servidor de 2U com o dobro da altura do servidor de 1U dará a você um pouco mais de espaço para poder de computação e armazenamento.
Em servidores de fator de forma menor, as GPUs normalmente são montadas horizontalmente devido a restrições de espaço. Também há menos espaço para slots e armazenamento PCIe, embora você possa expandi-los usando um kit de expansão PCIe ou um gabinete JBOD.
Servidores rack de GPU 8U e 16U
Servidores de rack de GPU maiores, como 8U e 16U, são voltados para cargas de trabalho que exigem recursos de desempenho mais abrangentes. Eles vêm com mais espaço para armazenamento e slots de expansão adicionais, permitindo que você conecte placas PCIe adicionais para aumentar o desempenho do processamento de dados. O espaço adicional também promove melhor circulação de ar para evitar superaquecimento.
Em um formato maior, as GPUs são instaladas verticalmente com espaço extra para conexões de energia localizadas na parte superior da placa, e não na parte traseira.
Como dimensionar um servidor de GPU dedicado
Ao dimensionar um servidor de GPU dedicado, você precisará considerar os recursos do produto que deseja, bem como suas necessidades de negócios atuais e futuras. A configuração ideal do servidor depende das cargas de trabalho de destino, dos casos de uso específicos desse servidor e da velocidade necessária.
Os servidores dedicados de GPU podem ser configurados para cargas de trabalho específicas, como renderização de vídeo, treinamento de aprendizagem profunda, inferência, análise de Big Data e computação de alto desempenho (HPC, High-Performance Computing). A configuração ideal do servidor depende das cargas de trabalho de destino, dos casos de uso específicos desse servidor e da velocidade necessária.
As GPUs usam muita energia e geram muito calor. Eles são maiores do que CPUs e precisam de espaço extra para conectores de energia. O rack do servidor não deve apenas ser grande o suficiente para se adequar à quantidade de GPUs que você deseja usar, mas também fornecer boa ventilação de ar para evitar superaquecimento e aceleração térmica.
Quanto custa um servidor de GPU dedicado?
É compreensível que os custos variem dependendo de você optar por criar seu próprio servidor de GPU dedicado, alugar um servidor ou usar serviços baseados em nuvem.
Se você for criar seu próprio servidor, precisará considerar o custo da GPU, bem como a fonte de alimentação, o rack, a CPU especializada, a RAM e o armazenamento. Você também pode precisar considerar os custos que acompanham a construção de datacenters locais, como custos de energia, espaço, refrigeração e manutenção.
As GPUs são classificadas em especializações e os preços variam de acordo com o caso de uso. Por exemplo, a NVIDIA oferece servidores V100-based adequados para aprendizagem profunda e cálculos de alta precisão. Uma GPU de vídeo de primeira linha, como a Nvidia GTX Titan Z da NVIDIA, pode custar cerca de US$ 3.000.
Se você optar por uma plataforma de nuvem, há vários provedores de serviços de nuvem que oferecem planos de servidor dedicados com tecnologia de GPU, incluindo os principais provedores de serviços de nuvem, como AWS V2 Cloud, Google Cloud Platform e Azure . A AWS, por exemplo, oferece preços sob demanda a partir de US$ 0,900 por hora para uma GPU e quatro núcleos virtuais.
Servidor de rack de GPU: Compra x aluguel
Escolher comprar ou alugar se resume a vários fatores. O orçamento e os casos de uso potenciais da sua empresa são os principais.
Comprar um servidor de rack de GPU envolve custos iniciais. As placas de vídeo com melhor classificação para cargas de trabalho de aprendizado de máquina podem ter um preço alto. Adicione isso aos custos de manutenção, energia e largura de banda do armazenamento do seu servidor de GPU no local, e seus custos iniciais de investimento podem ser astronômicos.
Com o ritmo das inovações tecnológicas modernas, comprar um servidor de GPU corre o risco de se tornar obsoleto antes que você possa obter um retorno sobre seu investimento. A atualização do sistema também incorrerá em custos adicionais.
Se você trabalha com grandes conjuntos de dados e planeja implantar seus modelos em um ambiente de produção, considere alugar a infraestrutura de GPU por meio de um provedor de serviços de nuvem. Esse modelo de assinatura permite que você pague por hora ou mensalmente, dependendo dos recursos usados e aumente ou diminua com base nas demandas atuais.
Obtenha infraestrutura de AI de última geração com a Pure Storage
Um servidor de GPU dedicado oferece várias vantagens em relação a um servidor baseado em CPU, incluindo melhor desempenho, maior flexibilidade e melhor utilização dos recursos da CPU. Os servidores dedicados de GPU podem ser adquiridos diretamente ou alugados de um provedor de serviços.
A AIRI.0 é uma infraestrutura de AI simples, altamente escalável e baseada em flash desenvolvida pela Pure Storage ® e pela NVIDIA . A AIRI conta com os sistemas NVIDIA DGX mais atuais com armazenamento FlashBlade//S® da Pure Storage, o sistema operacional Purity//FB da Pure Storage e o gerenciamento de nuvem Pure1®.
Experimente novos níveis de sucesso de AI com a Pure e a AIRI.