Resiliência Requer Contrapressão

A maioria dos sistemas falha por sobrecarga, não por "bugs". O Salesforce não é exceção.

ARQUITETURA

4/29/20261 min read

Quando o volume aumenta repentinamente (campanhas, migrações, automações acionadas por IA), a plataforma precisa de entrada controlada.

Padrões de contrapressão: enfileiramento, limitação de taxa, disjuntores e degradação gradual.

Pare de projetar como se o downstream estivesse sempre disponível; assuma interrupções parciais.

Crie buffers assíncronos e tente novamente com backoff exponencial + jitter; evite tempestades de tentativas.

Torne as falhas visíveis para os usuários por meio de painéis e filas de trabalho, não apenas em logs.

Resiliência é uma propriedade arquitetural que você constrói, não um recurso que você ativa/desativa.

Padrões
• Enfileiramento + concorrência controlada
• Limites de taxa + controle de fluxo
• Disjuntores + fallbacks
• Tentativa novamente com backoff + idempotência

Por que isso importa: Sobrecarga causa interrupções; a contrapressão evita falhas auto infligidas.
Medidas de segurança
• Enfileiramento + concorrência controlada
• Limites de taxa + controle de fluxo nos pontos de entrada
• Disjuntores + comportamento em modo degradado
• Retentativa com recuo exponencial + idempotência

Antipapamentos
• Distribuição ilimitada de sincronização
• Tempestades de retentativas
• Ausência do padrão "aceitar e atender"

Métrica a ser observada: Taxa de erros em horários de pico + profundidade da fila + eventos de controle de fluxo

Em resumo: Sem contrapressão, o "sucesso" se torna uma interrupção autoinfligida.

📌 A estabilidade é projetada.