SEO Técnico

Guia de canibalização de keywords, auditoria e fix

Duas ou três URLs do seu site competindo pela mesma query e nenhuma rankeando direito. Como detectar com GSC + crawl + Semrush, a árvore de decisão pra consolidar, fundir, reescrever ou usar canonical, e o que NÃO é canibalização.

· 10 min de leitura

Canibalização de keyword é o jeito mais silencioso de perder tráfego. Você publica mais conteúdo, seu site tem mais URLs, mais backlinks, aparentemente está fazendo tudo certo. E mesmo assim o gráfico de tráfego no Search Console fica plano ou cai. Quando você investiga, descobre que duas ou três URLs do próprio site estão brigando pela mesma query, e nenhuma rankeia tão bem quanto uma só rankearia.

Esse guia é pra identificar, decidir e resolver. Com foco em não inventar canibalização onde não tem, que é o erro mais comum depois de ignorar o problema.

O que é (e o que não é) canibalização

Canibalização acontece quando duas ou mais URLs do seu site competem pela mesma intenção de busca, e o Google não consegue decidir com confiança qual rankear pra uma query específica. O sintoma clássico, o rank da query oscila entre duas URLs ao longo das semanas, e o CTR agregado é pior do que uma URL teria.

O que NÃO é canibalização, e esse é o ponto que mais gente erra:

  • Duas URLs rankeando pra queries diferentes mas com overlap de palavras. "Como fazer pão" e "receita de pão francês" têm palavras em comum, mas são intenções diferentes. O Google entende. Não é canibalização, é cobertura de long tail.
  • Uma URL rankeando pra N queries diferentes. É a URL fazendo seu trabalho. Não mexa.
  • Ranking oscilando normalmente. Toda URL oscila ±3 posições sem razão aparente. Pânico por 2 posições de queda é receita pra mudança prematura.

Como detectar com confiança

Três fontes cruzadas. Nenhuma resolve sozinha.

1. Google Search Console, a fonte da verdade

No GSC, vá em Performance, filtre por Query, escolha uma query suspeita, clique na aba Pages. Se aparecem 2+ URLs com impressões relevantes (não só uma com 1000 e outra com 3), é um candidato.

Pra scan em massa, exporte os dados via API do GSC. Um script simples que agrupa por query e conta URLs com >= 5% do share de impressões da query faz o trabalho.

2. Crawl do site pra confirmar estrutura

Screaming Frog ou Sitebulb roda crawl completo. Exporte title, h1, meta_description, canonical. Onde o title ou h1 é idêntico entre URLs diferentes, canibalização é quase certa. Onde o canonical aponta pra uma URL consistente, o Google provavelmente já entende.

3. Rank tracker histórico

Semrush, Ahrefs ou equivalente. Pegue a query suspeita e veja o histórico de 90 dias. Se o rank alterna entre URLs diferentes semanas sim, semanas não, é canibalização. Se está estável numa URL só, relaxa.

A árvore de decisão

Árvore de decisão para canibalização de keywords Dado um grupo de URLs competindo pela mesma intenção de busca, quatro saídas possíveis. Consolidar com 301 quando uma página cobre, reescrever uma delas quando as intenções divergem, fundir em pilar quando há muitos spokes, e manter as duas com canonical explícito quando a intenção é a mesma mas público diferente. CANIBALIZAÇÃO · ÁRVORE DE DECISÃO POR CLUSTER DE URL ENTRADA Cluster de URLs competindo detectado via GSC + crawl As URLs respondem à mesma intenção de busca? SIM, e uma é melhor Consolidar com 301 mantém a forte redireciona as outras SIM, várias iguais Fundir em pilar uma página-hub absorve os spokes NÃO, intenções diferentes Reescrever uma diferenciar ângulos informacional vs comercial MESMA, público diferente Canonical explícito ex.: B2B vs B2C um é canônico ANTES DE DECIDIR, CONFIRME 3 COISAS 1. O Google está de fato alternando qual rankeia (GSC, aba Páginas filtrada pela query) 2. O CTR agregado do cluster é inferior ao que uma URL só teria (a canibalização dói em CTR antes de dói em posição) 3. Existe link equity concentrado em uma URL do cluster (essa é a candidata a ficar)

Antes de aplicar a árvore, confirme as três coisas do painel inferior: o Google está alternando URLs (não só uma ganhando devagar da outra), o CTR agregado está abaixo do que uma URL só teria, e existe link equity concentrado em alguma URL do cluster. Sem essas três, você pode estar transformando variação natural em projeto de refactoring.

A árvore tem quatro saídas:

Consolidar com 301

A saída mais comum. Uma URL do cluster é objetivamente melhor (mais tráfego histórico, mais backlinks, melhor CTR). Mantém ela, redireciona as outras com 301, atualiza links internos pra apontar pra nova canônica.

Truque importante: antes de redirecionar, mescla o conteúdo útil das URLs que vão sumir na URL que fica. Se a "URL perdedora" tinha uma seção boa que a vencedora não tem, copia antes de apagar. O 301 passa link equity mas não passa conteúdo.

Fundir em pilar

Quando há 5+ URLs pequenas cobrindo o mesmo tema em fragmentos. Cria uma página-hub (pilar) que cobre o tema de ponta a ponta, move o conteúdo das pequenas pra seções da pilar, e redireciona as pequenas com 301 pra pilar (ou pra anchors específicas dela).

Resultado, uma página com autoridade agregada em vez de cinco diluídas. Esse é o movimento clássico de reorganização de blog antigo.

Reescrever uma

Quando descobre que as URLs estavam competindo por acidente, mas na verdade deveriam cobrir intenções diferentes (ex.: uma informacional e outra comercial). Em vez de consolidar, reescreve uma pra deixar claro o ângulo diferente. Título, H1, primeiro parágrafo, schema, tudo ajustado pra sinalizar pro Google o que é cada página.

Demora mais que consolidar, mas preserva a cobertura de duas intenções.

Canonical explícito

A saída menos comum. Você tem duas URLs pra mesma intenção, mas servindo públicos diferentes (por exemplo, página B2B em /empresa/solucao e B2C em /solucao). O Google não precisa decidir, você decide, colocando <link rel="canonical"> explícito apontando uma pra outra.

Só usa canonical se realmente não dá pra consolidar, porque canonical não transmite todo o link equity que um 301 transmite.

Padrões comuns de canibalização

Nove em cada dez casos que audito caem num destes padrões:

  1. Tag archives vs categoria vs post. WordPress cria /tag/seo e /category/seo pra o mesmo tópico, e se o post se chama "guia de SEO", três URLs competem. Solução padrão, noindex nos tag archives.
  2. Paginação competindo com página 1. /blog/page/2/ rankeando pro mesmo termo do /blog/. Use rel="next" e rel="prev" corretamente, e o canonical de todas as paginadas aponta pra página 1.
  3. URLs com e sem trailing slash / com e sem www. Canonical resolve. Config do servidor resolve melhor.
  4. Duplicação por parâmetros. ?sort=price, ?category=x. Todas servem conteúdo praticamente igual. Canonical pra URL sem parâmetros.
  5. Versão móvel em subdomínio (m.site.com). Era padrão em 2013, hoje é dívida. Consolida em responsive, redireciona m. com 301.
  6. Autor de blog com bio rankeando pro mesmo tema. /autor/fulano lista posts dele, e um desses posts se chama "Fulano Silva é o especialista em X". As duas URLs competem. Ajusta o title da página de autor pra ser explicitamente de autor ("Posts de Fulano Silva"), não do tópico.

Como consolidar sem perder tráfego

Checklist do movimento de consolidação:

  1. Identifique a URL vencedora. A que tem mais backlinks e mais tráfego histórico na query-alvo.
  2. Mescle conteúdo útil. Traga as seções boas das URLs perdedoras pra vencedora. Atualize a data de publicação pra hoje se fizer sentido (trigger de "novo" no Google).
  3. Atualize internal links. Todos os links do seu site que apontavam pras URLs perdedoras agora apontam pra vencedora direto. Não dependa do 301.
  4. Aplique 301. Só agora. As perdedoras redirecionam pra vencedora.
  5. Monitore por 30 dias. GSC na query-alvo, Page que está impressionando, CTR. O sucesso é a vencedora absorvendo o tráfego das perdedoras + um pouco a mais (porque o Google agora confia).

O que medir pra provar que funcionou

  • Impressões agregadas na query-alvo. Devem ficar estáveis ou subir. Queda forte é bandeira vermelha.
  • CTR. Melhora sempre. Antes, múltiplos resultados da mesma query dilutivam o CTR. Depois, concentrado numa URL, clique sobe.
  • Rank médio da URL vencedora. Sobe 2 a 5 posições em média na query-alvo.
  • Sessões orgânicas na URL vencedora. Sobe proporcionalmente.

Se todas as quatro melhoram em 30 dias, a consolidação foi bem feita. Se alguma piora, volta nos logs, olha se o 301 está direito, e verifica se não destruiu nenhum anchor interno importante.

Ferramentas que ajudam

  • GSC API + script em Python pra pegar todas as queries com >1 URL impressionando. Saída em CSV.
  • Screaming Frog pra crawl + comparação de title/h1/canonical.
  • Semrush ou Ahrefs pro histórico de rank por URL.
  • Sheets pra matriz de decisão. Cada cluster vira uma linha com URLs, tráfego, backlinks, saída escolhida.

Canibalização é problema comum mas diagnosticável. O erro real é diagnosticar de mais, porque "tem palavras em comum" vira projeto gigante de reestruturação que não precisava acontecer. Olha o sintoma (rank oscilando, CTR baixo), confirma com dados, age cirurgicamente.

Projeto relacionado: Linkagem semântica por embeddings em 5 propriedades Sanar, onde o engine previne canibalização desde o desenho do ecossistema.