HPA com base na utilização de CPU e Memória

Neste post, irei falar sobre o HPA que significa “Horizontal Pod Autoscaler”. É um recurso no Kubernetes que ajusta automaticamente o número de réplicas (pods) em um deployment com base na utilização observada de CPU ou memória.

Objetivo em usar um HPA

O objetivo de um HPA é garantir que sua aplicação tenha recursos suficientes para lidar com a demanda. Se a utilização de recursos aumentar, o HPA aumentará o número de réplicas (aumenta a quantidade de pods em execução) para garantir que a carga seja distribuída adequadamente. Da mesma forma, se a utilização diminuir, o HPA reduzirá o número de réplicas, economizando recursos. Isso ajuda a manter a escalabilidade e o desempenho da sua aplicação de forma automática e eficiente.

Certifique-se de substituir o nome: “meu-hpa” pelo nome desejado para o HPA e meu-deployment pelo nome do seu deployment ao qual o HPA será aplicado. Isso garantirá que o HPA ajuste automaticamente o número de réplicas do seu deployment com base no uso de recursos de memória e CPU, mantendo-os em torno de 80% de utilização.