SEO Técnico

Como estruturar conteúdo pra ser citado por LLM

Como o Perplexity, o ChatGPT e o AI Overview do Google escolhem quem citar, e o que mudar no seu conteúdo pra entrar nessa lista. Sete erros comuns que deixam seu site invisível pra IA e três formas práticas de medir se o trabalho está funcionando.

· 11 min de leitura

Tráfego em 2026 vem de dois caminhos bem diferentes. O Google e o Bing, que o mercado aprendeu a otimizar nos últimos vinte anos. E os buscadores com IA, Perplexity, ChatGPT Search, Claude, o "AI Overview" do próprio Google, que funcionam por citação em vez de lista de links azuis. O primeiro caminho quase todo mundo conhece. O segundo, quase ninguém estruturou o site pra disputar de verdade.

O ponto que confunde gerente de marketing é que ranquear bem no Google não garante citação nesses buscadores novos. Sua página pode estar em primeiro lugar pra "consent mode v2" e nunca aparecer como fonte no Perplexity pra mesma pergunta. A IA avalia o conteúdo de um jeito diferente, olha outras coisas, e descarta trechos que o Google indexou sem problema. Este post é o que eu faço na prática pra aumentar a chance de um pedaço do seu conteúdo virar citação.

O que "ser citado por IA" realmente quer dizer

Um buscador com IA não lê a internet na hora em que alguém pergunta. Ele tem um índice próprio, um "caderno de anotações" com pedaços de texto que já leu antes. Quando chega uma pergunta, ele escolhe alguns desses pedaços e monta a resposta em cima deles. Sua disputa deixa de ser por página inteira e passa a ser por pedaço. Cada parágrafo (ou bloco curto de parágrafos) precisa fazer sentido sozinho, desconectado do resto da página.

Isso muda a forma de trabalhar. No Google, a página é a unidade que você otimiza. Na IA, o parágrafo é. Muda também o que você mede. Não existe mais "impressões" e "CTR", o que você acompanha é taxa de citação num conjunto de perguntas que importa pro seu negócio.

Os três filtros invisíveis entre seu conteúdo e a citação

Entre publicar uma página e a IA citar você, existem três filtros que ninguém documenta. Eu observei cada um funcionando em dezenas de perguntas de cliente ao longo de 2025.

  1. O robô da IA precisa conseguir ler seu site. Cada buscador com IA tem o próprio robô, parecido com o Googlebot. Se o conteúdo principal do seu site só aparece depois que o navegador processa JavaScript, o robô não enxerga e o seu texto fica de fora do índice. Site que depende de framework moderno sem "renderização no servidor" tende a cair nesse buraco.
  2. Quantidade de informação por parágrafo. O sistema dá preferência a pedaços que contam muita coisa em pouco espaço. Dois parágrafos com número, nome próprio e data concretos ganham de dez parágrafos de introdução romantizada.
  3. O parágrafo precisa fazer sentido sozinho. Se ele começa com "Essa técnica" ou "Como vimos acima", no momento em que o sistema recorta a página em pedaços aquele parágrafo fica órfão e é descartado. Parágrafo que depende dos anteriores pra ser entendido nunca vira citação.

Estrutura da página, o que mudou

Algumas regras que valiam em 2016 pra SEO continuam de pé. Outras mudam de peso. E algumas práticas que eram opcionais viraram determinantes.

1. Comece com a resposta, não com o aquecimento

A velha regra de jornalismo (resposta primeiro, contexto depois) voltou com força. Os dois primeiros parágrafos da página precisam conter a resposta mais direta possível pra pergunta central. A IA costuma puxar abertura como resumo, então introdução que dá duas voltas ("Há anos a comunidade debate…") é suicídio de citação.

Revise conteúdo antigo com essa régua. Pega o título, identifica a pergunta embutida nele, e garante que os primeiros 300 caracteres respondam essa pergunta de forma autônoma.

2. Um parágrafo, uma ideia, zero pronomes soltos

Parágrafo que começa com "Isso" ou "Essa técnica" só faz sentido no contexto da página inteira. Quando o sistema corta a página em pedaços menores, metade dos parágrafos fica sem referência e é descartada. Repete o sujeito. Escreve "O Consent Mode v2 funciona em dois estágios…" em vez de "Ele funciona em dois estágios…", mesmo que tenha mencionado no parágrafo anterior.

Pro humano fica um pouco mais repetitivo. O ganho em citação compensa com folga. Em testes que rodei em 2025, o mesmo conteúdo com pronomes substituídos foi citado 2 a 4 vezes mais que a versão original.

3. Datas e versões visíveis no texto, não só no rodapé

A IA, quando avalia se o conteúdo está atualizado, olha pra datas escritas dentro do texto, não só pra data de publicação do sistema. Frases como "a partir de março de 2026", "na versão 4.2 do plugin", "após a política de 2023 do Google" servem de âncora temporal clara. Datas relativas ("recentemente", "nos últimos meses") envelhecem mal e confundem o modelo.

4. Listas com frase completa em cada item

Item de lista que é uma palavra só ("Rápido", "Escalável", "Seguro") não é citável, o sistema não tem contexto pra entender. Item que é uma frase inteira ("O pipeline reduz o tempo de ingestão de 40 minutos pra 6 minutos em benchmark de 10 mil URLs") é ouro, a IA recupera aquele item sozinho e cita.

Densidade de fatos, a régua que quase ninguém usa

Chamo de densidade de fatos a quantidade de informação concreta (número, data, nome próprio, versão, referência externa) por 100 palavras. Artigo médio de blog tem 1 a 2 fatos. Artigo que funciona bem em IA tem 4 a 8.

Comparação direta:

Baixa densidade (1 fato em 35 palavras): Otimizar Core Web Vitals é importante porque impacta a experiência do usuário e também é um fator de ranqueamento considerado pelo Google nos últimos anos em praticamente todos os tipos de site.

Alta densidade (6 fatos em 38 palavras): LCP abaixo de 2.5s, INP abaixo de 200ms, CLS abaixo de 0.1 são os três limites verdes definidos pelo Google em março de 2024 como critério de Core Web Vitals em navegação mobile.

O segundo tem números citáveis, fonte (Google) e data (março 2024). Quando a IA recebe uma pergunta do tipo "qual o limite bom de LCP", vai puxar o segundo parágrafo e ignorar o primeiro, sem concorrência.

Checklist que uso antes de publicar, parágrafo a parágrafo: tem pelo menos um número, uma data ou um nome próprio? Se não tem, reescrevo ou removo.

Cada seção precisa se sustentar sozinha

Pensa em cada seção de 200 a 500 palavras como um mini-post. Tem que ter, sozinha:

  • Um título que já afirma algo. Título explícito ("Densidade de fatos se mede por 100 palavras") vence título genérico ("Como medir densidade de fatos").
  • Uma abertura que não depende do que veio antes. Evita "continuando", "além disso", "como vimos". Reintroduz o conceito em uma frase.
  • Um exemplo ou número nas primeiras linhas. Se a seção fica abstrata por meia página antes do primeiro exemplo, o pedaço central não tem nada citável.
  • Um fechamento que não precisa de conclusão externa. A seção resolve a própria afirmação.

Fiz esse exercício em três posts de um cliente no trimestre passado. Antes da revisão, zero citações no Perplexity em 15 perguntas-alvo. Depois, oito citações consistentes ao longo de seis semanas de acompanhamento. Mesma URL, mesma autoridade de domínio, mesmos backlinks. A diferença foi só estrutural.

Marcação de schema que ainda importa

Tem muita conversa sobre schema pra ser citado por IA. Metade é placebo. Separando o que move o ponteiro do que não move:

Schema com impacto real

  • Article com autor e datas de publicação e atualização. Identifica quem escreveu. Sem isso, seu conteúdo fica anônimo pros buscadores com IA, o que reduz a confiança no trecho.
  • Organization no domínio, com links pra Wikipedia, Wikidata e LinkedIn. Amarra seu site a entidades que o modelo já reconhece. Faz diferença real em marcas já estabelecidas.
  • FAQPage. O Google deixou de mostrar esse formato como destaque em 2023, mas os buscadores com IA continuam extraindo pares de pergunta e resposta desse formato com altíssima precisão. É o schema com melhor custo-benefício específico pra citação em IA hoje.
  • BreadcrumbList. Ajuda o robô a entender a hierarquia do site, o que influencia como cada seção é contextualizada.

Schema que é só ritual

  • HowTo. Descontinuado pelo Google em 2023, sem sinal de que os buscadores com IA tratem diferente. Emite se te agrada, mas não conta como trabalho útil.
  • ImageObject sem imagem correspondente. Os modelos visuais de hoje entendem imagem direto, esse schema cosmético agrega pouco.
  • AggregateRating sem reviews visíveis na página. Além de não ajudar a IA, é risco de penalização pelo Google sob a política de snippet de avaliações.

Sete erros que deixam seu conteúdo invisível pra IA

  1. Conteúdo principal que só aparece depois do JavaScript. Se o texto só carrega depois que o navegador processa o código do site, o robô da IA não enxerga. O teste rápido é desligar JavaScript no navegador e ver o que sobra.
  2. Parede de introdução. Quinhentas palavras antes da primeira afirmação concreta. Os primeiros pedaços da página são os mais puxados pela IA, se estão vazios você perde a disputa.
  3. Pronomes soltos. "Ele", "ela", "isso", "essa abordagem" atravessando parágrafos. Quebra no momento em que o sistema recorta a página.
  4. Afirmação sem número. "Rápido", "econômico", "escalável" sem medida. A IA prefere "reduz latência em 34%" mil vezes a "reduz latência de forma significativa".
  5. Fonte em nota de rodapé, longe da afirmação. O sistema não liga o parágrafo a uma referência que está duas mil palavras abaixo. Atribui a fonte dentro do próprio parágrafo ("segundo o estudo X de 2025").
  6. Robô da IA bloqueado sem querer. Revisa o robots.txt e as regras de firewall. Muitos sites bloqueiam os robôs do ChatGPT ou do Claude sem perceber, por herança de plugin de segurança ou configuração antiga.
  7. Republicar sem atualizar a data. Página com data de 2022 falando de "Consent Mode v2" é descartada como inconsistente. Atualiza a data de modificação toda vez que edita de verdade.

Como medir hoje

Não existe Search Console pra IA. Mas dá pra montar medição em três camadas, da mais barata à mais cara.

Camada 1, teste manual semanal

Define 20 a 30 perguntas que representam as dores que o seu negócio resolve. Toda sexta, alguém do time roda essas perguntas no Perplexity, ChatGPT Search, Claude e AI Overview do Google, e registra numa planilha:

  • A resposta citou o site? Sim ou não.
  • Se não, quem citou? Concorrente, Wikipedia, publicação do setor.
  • Qual trecho da resposta parece ter vindo do seu conteúdo?

Três meses dessa disciplina já mostram tendência clara.

Camada 2, referência no Google Analytics

Separa o tráfego que vem das IAs. No GA4, cria um segmento que filtra referenciadores como chatgpt.com, perplexity.ai, claude.ai, gemini.google.com. O volume absoluto ainda é pequeno na maior parte dos setores, mas a tendência vale muito. Cliente em nicho técnico B2B já vê 3 a 8% do tráfego vindo de IA em 2026, e esse número vem dobrando a cada dois trimestres.

Camada 3, automação

Se o volume justifica, monta um script que roda semanalmente, dispara as perguntas direto nas APIs das IAs, detecta menções ao seu domínio ou marca, e alimenta um painel. Custo operacional fica em torno de US$ 20 a US$ 50 por mês pra 100 perguntas × 4 ferramentas. Um pipeline parecido aparece no case de linkagem semântica, onde monitorei share of voice em nicho de educação médica.

Três tentações caras

  1. Assinar ferramenta de "dashboard de IA" sem ter linha de base. A ferramenta entrega relatório bonito. Se você ainda não sabe quais são suas perguntas-alvo, o relatório é decoração.
  2. Encher o site de FAQ genérico gerado por IA. Perguntas fracas baixam a qualidade média do conteúdo. Melhor 15 FAQs reais que 150 automáticas.
  3. Tentar enganar a IA repetindo palavra-chave. Os buscadores com IA já são bem resistentes a isso e punem via baixa recuperação. Densidade de fatos não é a mesma coisa que densidade de palavra-chave.

Fechando

Essa área ainda é nova e parte do que escrevi aqui vai precisar de revisão em doze meses. Mas três coisas não vão mudar: seu conteúdo tem que ser lido sem JavaScript, cada parágrafo tem que se sustentar sozinho, e densidade de fatos vence prosa. Comece por aí.

Pra conectar com o resto da trilha, o guia de ligação semântica entre páginas mostra como aplicar o mesmo raciocínio de recuperação por trechos no seu próprio site, e o guia de data layer bem modelado aplica o princípio de "pedaço autocontido e rico em fatos" a dados em vez de texto.