A maioria dos publishers consegue dizer o eCPM até a segunda casa decimal. Eles conhecem seu fill rate por geo e por formato. Acompanham ARPDAU diariamente. Mas pergunte quanto tempo um anúncio leva para ser renderizado depois que o usuário o aciona, e você normalmente recebe um olhar vazio. A latência de anúncios é a métrica que quase ninguém mede — e é um dos problemas mais caros da monetização mobile.
O que é latência de anúncios?
Latência de anúncios é o tempo entre o momento em que o seu app solicita um anúncio e o momento em que esse anúncio está totalmente renderizado e visível para o usuário. Para um rewarded video, é o intervalo entre o toque do usuário em "Ver anúncio" e o vídeo efetivamente começar a tocar. Para um interstitial, é o atraso entre o evento de disparo e o anúncio de tela cheia aparecer. Para banners, é quanto tempo o slot do banner fica vazio antes do conteúdo carregar.
Em um mundo ideal, esse número é zero. Na realidade, ele vai de 200 milissegundos em configurações bem otimizadas até 3 segundos ou mais em waterfalls mal configurados — e cada milissegundo custa dinheiro.
Como a latência destrói receita
Impressões abandonadas
Quando um rewarded video leva três segundos para carregar, uma fatia relevante dos usuários desiste e fecha o prompt. Eles queriam a recompensa, mas não o bastante para ficar olhando um spinner de carregamento. Essa impressão valia dinheiro — o seu waterfall encontrou um comprador, o leilão foi vencido — mas o usuário nunca chegou a ver o anúncio. O fill rate parece bem no seu dashboard porque, tecnicamente, o anúncio foi servido. Mas a receita foi perdida porque o usuário abandonou antes do anúncio renderizar.
Taxas de completion mais baixas
Usuários que esperam um carregamento lento já estão frustrados antes do anúncio começar. Usuários frustrados tendem a achar formas de pular ou fechar o anúncio mais cedo, o que reduz a sua completion rate. Como muitos demand partners pagam com base em cost-per-completed-view, uma completion rate mais baixa derruba diretamente o seu eCPM efetivo — mesmo que o eCPM bruto no dashboard pareça inalterado.
Experiência de usuário degradada
A latência de anúncios não custa só a impressão imediata — ela ensina os usuários a evitar completamente os espaços publicitários. Se o seu rewarded video é consistentemente lento, os usuários aprendem que tocar em "Ver anúncio" significa esperar, e param de tocar. A sua taxa de engajamento cai de forma permanente, reduzindo o total de impressões disponíveis para monetizar.
De onde vem a latência
Muitos passos no waterfall
Em um waterfall tradicional, cada fonte de demanda é chamada sequencialmente. Se você tem oito fontes e cada uma demora 300 milissegundos para responder, são 2,4 segundos antes de sequer começar a renderizar o anúncio vencedor. Esse é o argumento mais forte em favor do header bidding e do Open Bidding — eles chamam todas as fontes simultaneamente, comprimindo a latência sequencial em um único round-trip.
Inicialização de SDK
Alguns SDKs são lazy-initialized, ou seja, só começam a carregar na primeira requisição de anúncio. A primeira impressão vinda desses SDKs pode demorar bem mais do que as seguintes. Pré-inicializar os seus principais SDKs no launch do app — mesmo que isso acrescente um pouco ao tempo de inicialização — costuma trazer um saldo líquido positivo ao eliminar a latência da primeira impressão.
Criativos pesados
Um criativo de vídeo que pesa 15 megabytes vai levar um tempo nitidamente maior para fazer download e buffer do que um de 3 megabytes, especialmente em conexões mais lentas comuns em mercados emergentes. Você não controla o tamanho do criativo diretamente, mas pode definir thresholds de timeout que descartam criativos lentos em favor de alternativas mais leves.
Como medir a latência de anúncios
A maioria das plataformas de mediation não expõe métricas de latência por padrão. É preciso instrumentá-la por conta própria. Registre o timestamp quando o seu app faz a chamada de requisição do anúncio, e registre novamente quando o callback de impressão do anúncio for disparado. A diferença é a sua latência real. Acompanhe como distribuição, não como média — a mediana pode ser 400 milissegundos, mas se o seu percentil 95 for 4 segundos, você tem um problema de cauda relevante afetando 5 por cento de todas as impressões.
Se você não mede a latência de anúncios, está voando às cegas em uma das variáveis de maior impacto em todo o seu stack de monetização. Comece a medir hoje — é quase certo que vai encontrar receita que nem sabia estar perdendo.
Reduzindo a latência
Faça pre-load agressivo
Solicite o próximo anúncio assim que o atual terminar. Para rewarded video, tenha o próximo anúncio pronto antes do usuário sequer ver o botão "Ver anúncio". Para interstitials, faça pre-load nos pontos naturais de transição do fluxo do seu app.
Defina timeouts
Configure um tempo máximo de espera para cada fonte de demanda — tipicamente de 1 a 2 segundos. Se uma fonte não respondeu dentro do timeout, avance para a próxima. Perder algumas impressões de eCPM alto, mas lentas, vale a pena se isso significar que os outros 95 por cento das impressões carregam instantaneamente.
Migre para bidding
Substitua chamadas sequenciais de waterfall por bidding simultâneo sempre que possível. O Open Bidding via GAM e o header bidding via sua plataforma de mediation reduzem drasticamente a latência em comparação aos waterfalls tradicionais.
Trabalhe com um parceiro gerenciado
Um parceiro de managed monetization monitora a latência em todo o seu ad stack e otimiza continuamente tanto velocidade quanto receita. Eles conseguem identificar quais fontes de demanda estão adicionando latência desproporcional e ajustar a sua configuração para eliminar gargalos — muitas vezes recuperando receita que você nem sabia estar perdendo.