Confundimento na lente moderna

Definição moderna, direção do viés e estratégias de controle

A definição moderna

Em um estudo, comparam-se dois grupos — expostos e não expostos — para isolar o efeito de uma exposição sobre um desfecho. A comparação só é válida se os grupos forem iguais em tudo, exceto na exposição. Quando algum outro fator que afeta o desfecho difere entre eles, parte da diferença observada vem desse fator, e não da exposição. Esse problema é o confundimento.

A idade é o exemplo mais comum. Pacientes mais velhos costumam receber certos tratamentos com mais frequência — porque acumulam comorbidades, porque preenchem mais indicações clínicas — e, ao mesmo tempo, têm mais chance de morrer ou de ter eventos. Se a comparação ignora a idade, parte do que parece efeito do tratamento é, na verdade, efeito de ser mais velho. Para recuperar o efeito do tratamento, é preciso separar a contribuição da idade — ajustar por ela na análise, parear por ela no desenho do estudo ou restringir o estudo a uma faixa etária.

Tradicionalmente, confundidor é definido como “uma variável associada à exposição e ao desfecho, que não está na via causal entre eles”. A definição é intuitiva e amplamente usada — e leva, com frequência, a ajustes errados. O problema é que três tipos diferentes de variável satisfazem, ou parecem satisfazer, esse critério, e cada um exige tratamento estatístico oposto: confundidor, mediador e colisor.

Confundidor é a causa comum da exposição e do desfecho, como a idade no exemplo acima. Ajustar por ele reduz o viés.

Mediador está dentro da via causal entre exposição e desfecho: a exposição age sobre o desfecho passando por ele. Estatinas reduzem eventos cardiovasculares principalmente por reduzirem o LDL; LDL é mediador do efeito da estatina. Ajustar por LDL não controla confundimento — controla o próprio efeito que se queria estimar. A análise passa a capturar apenas a parte do efeito da estatina que age por outras vias e perde a parte que age pela redução do LDL. Sob a definição clássica, o mediador parece satisfazer o critério: está associado à exposição (estatina reduz LDL) e ao desfecho (LDL alto causa evento). Mas não é confundidor.

Colisor é variável que é consequência tanto da exposição quanto do desfecho, ou de causas comuns de ambos. Hipertensão grave e infarto, cada um por seu lado, aumentam a chance de hospitalização; hospitalização é colisor de hipertensão e infarto. Ajustar por um colisor — restringir a análise a pacientes hospitalizados, por exemplo — cria associação onde não havia. Sob a definição clássica, o colisor também parece satisfazer o critério, sobretudo quando a amostra já foi filtrada por algum processo de seleção (apenas pacientes internados, apenas voluntários de um registro): ele aparece estatisticamente associado à exposição e ao desfecho. Mas ajustar por ele introduz viés, em vez de removê-lo.

Greenland e Robins (1) mostram que o critério correto para identificar um confundidor não é estar associado à exposição e ao desfecho — é a capacidade de devolver aos grupos a comparabilidade. Confundidor passa nesse critério; mediador e colisor, não. A consequência prática é direta: decidir se uma variável deve entrar no ajuste exige conhecimento da estrutura causal do problema. Os dados, sozinhos, não distinguem confundidor, mediador e colisor — a mesma associação estatística entre uma covariável e o desfecho é compatível com as três interpretações.

Confundimento positivo e negativo

Quando há um confundidor que ninguém mediu — e que, portanto, não pode ser ajustado —, é útil saber em que direção o viés que sobra atua. VanderWeele, Hernán e Robins (2) estendem o aparato gráfico para responder a essa pergunta. Sob hipóteses específicas, é possível inferir, a partir das setas do DAG, se o confundidor não medido tende a superestimar o efeito da exposição (viés positivo) ou a subestimá-lo ou invertê-lo (viés negativo).

A aplicação clínica mais importante para os casos do site é o viés do usuário saudável (healthy-user bias). Pessoas que aderem a uma prescrição preventiva — terapia de reposição hormonal, suplementação vitamínica, estatina em prevenção primária — costumam praticar, ao mesmo tempo, outros comportamentos protetores que ninguém mediu: alimentação cuidadosa, atividade física regular, ida frequente ao médico, adesão a outras recomendações. Esses comportamentos causam, ao mesmo tempo, o uso da intervenção (porque pessoas saudáveis a procuram) e o desfecho favorável (porque produzem benefício independente).

A consequência é estrutural: a associação observada entre a intervenção e desfechos saudáveis fica sistematicamente superestimada — o viés tem direção positiva, na direção da proteção aparente. Foi esse padrão que sustentou décadas de evidência observacional favorável à terapia de reposição hormonal e a suplementos vitamínicos, antes que ensaios randomizados invertessem a conclusão.

Estratégias de controle por desenho

A primeira camada de controle atua antes mesmo de a análise estatística começar — bloqueia o viés ao desenhar o estudo.

Randomização. É o único procedimento que, em média, torna os grupos comparáveis em todos os fatores — inclusive nos confundidores que ninguém mediu ou pensou em medir. A moeda decide quem recebe o tratamento; em média, os dois grupos ficam parecidos em tudo. O preço é a artificialidade do desenho: o ensaio responde sobre uma população específica, num período específico, sob um regime específico, e generalizar para a prática clínica exige argumento separado.

Restrição. Elimina a variação no confundidor restringindo a amostra a um único valor dele. Um estudo de função pulmonar conduzido apenas em não fumantes elimina, por construção, o confundimento pelo tabaco. O custo é a generalização limitada: o efeito identificado vale para a subpopulação restrita.

Pareamento (matching). Em estudos de coorte, atribui a cada exposto um ou mais não expostos com valores semelhantes do confundidor; em caso-controle, a operação é análoga sobre os pares caso-controle. O pareamento sozinho não controla totalmente o confundimento — a variável usada para parear ainda precisa ser tratada na análise —, mas melhora a precisão e equilibra as distribuições. É especialmente útil quando o confundidor está fortemente associado ao desfecho.

Estratégias de controle na análise

A segunda camada atua sobre os dados já coletados.

Estratificação. Divide a amostra em grupos (estratos) definidos pelo confundidor e estima o efeito da exposição separadamente em cada estrato; depois combina os estratos por uma média ponderada. O exemplo clássico é o estimador de Mantel-Haenszel. A estratificação é transparente e revela se o efeito da exposição varia entre estratos. A limitação é prática: com muitos confundidores, o número de estratos cresce multiplicativamente e a maioria deles fica sem casos suficientes para uma estimativa estável.

Ajuste regressivo. Inclui o confundidor como variável independente em um modelo de regressão (linear, logística, Cox). Acomoda múltiplos confundidores e variáveis contínuas em um único passo. A dependência crítica é da forma funcional do modelo: a relação entre cada covariável e o desfecho precisa ser representada adequadamente — linear, quadrática, com transformação, com interação. Quando o modelo está mal especificado, o ajuste fica incompleto. Em amostras pequenas com muitas covariáveis, surge ainda o risco de viés por dados esparsos (estimativas instáveis quando alguns estratos têm poucos eventos).

Escore de propensão. Resume, em uma única variável, a probabilidade de cada paciente receber a exposição, dada a sua combinação de confundidores medidos. Dentro de cada faixa do escore, a distribuição dos confundidores fica equilibrada entre expostos e não expostos. O escore é então usado para parear pacientes, estratificá-los ou ponderá-los na análise. A redução a uma única variável facilita o ajuste quando há muitos confundidores. As limitações são as mesmas da análise convencional: o escore só equilibra os confundidores que foram medidos, e exige que existam, dentro de cada faixa do escore, tanto expostos quanto não expostos (a chamada positividade).

Confundidores não medidos

Quando o confundidor relevante não foi medido, o ajuste estatístico convencional é inoperante. Três métodos lidam com essa situação.

Variável instrumental. É uma variável que afeta a exposição, mas afeta o desfecho apenas através da exposição — não tem outro caminho até ele. Essa propriedade é chamada de restrição de exclusão. Identificada uma variável com essa propriedade, é possível estimar o efeito causal mesmo na presença de confundidores não medidos. Alguns exemplos: a distância até um centro especializado como instrumento para receber determinado tratamento (a distância afeta o acesso, mas não afeta o desfecho por outra via que não pelo tratamento); a aleatoriedade meteorológica como instrumento para exposição ambiental. A randomização mendeliana é um caso particular: usa uma variante genética como instrumento, aproveitando o fato de que a herança genética é, na prática, um sorteio. A grande dificuldade do método está na restrição de exclusão — ela não pode ser provada a partir dos dados, e exige justificativa biológica sólida.

Regressão descontínua. Explora situações em que a atribuição do tratamento depende de um limiar fixo em uma variável contínua. Alguns exemplos: a idade de 65 anos para elegibilidade ao Medicare; um escore de gravidade que define internação em CTI. Pacientes imediatamente acima e imediatamente abaixo do limiar são, na vizinhança da descontinuidade, comparáveis em todos os fatores que variam de forma contínua com a idade ou a gravidade — a única coisa que difere bruscamente entre eles é o tratamento. A diferença no desfecho entre quem está logo acima e logo abaixo do limiar estima o efeito do tratamento naquela vizinhança. O método produz inferência local — vale apenas perto do limiar — e exige premissas de continuidade.

Análise de sensibilidade. Quantifica a robustez do achado a confundimento não medido. O E-value, proposto por VanderWeele e Ding (3), é a versão mais usada. Em uma única razão de risco, ele responde a uma pergunta direta: qual seria a magnitude mínima de associação que um confundidor não medido precisaria ter, simultaneamente com a exposição e com o desfecho, para anular o efeito observado? Um E-value alto significa que apenas um confundimento substancial poderia explicar o achado; um E-value próximo de 1 significa que o resultado é frágil — confundimento modesto bastaria para anulá-lo. Reportar o E-value rotineiramente, prática hoje recomendada para estudos observacionais com pretensão causal, desloca o debate de “existe confundimento residual?” (resposta sempre sim) para “que magnitude de confundimento residual seria necessária para destruir o efeito?”.

Confundimento residual e análise de viés quantitativa

Mesmo depois de aplicada a melhor estratégia de ajuste, sempre sobra algum confundimento residual — o viés que não foi totalmente eliminado. Ele tem pelo menos quatro fontes: confundidores que não foram medidos; erros de medida em confundidores que foram medidos; modelo regressivo com forma funcional inadequada; e estratos com poucos casos.

Savitz, Pearce e Rothman (4) argumentam que a forma metodologicamente madura de lidar com esse resíduo é a análise de viés quantitativa: em vez de apenas reconhecer no texto que “pode haver confundimento residual”, especificar cenários quantitativos. Qual seria o efeito estimado se um confundidor não medido com determinadas características estivesse presente? Qual a sensibilidade do achado a um erro de medida de magnitude X? Qual o intervalo de estimativas plausíveis sob premissas diferentes? O E-value é uma versão simples dessa análise; fórmulas algébricas de viés, simulação de Monte Carlo e análise probabilística são versões mais elaboradas. O efeito é deslocar o ônus da inferência: o autor não declara apenas que controlou confundimento — demonstra quão robusta é a sua conclusão a violações específicas das premissas.

Aplicação aos casos do site

O viés do usuário saudável — confundimento positivo sistemático — é o eixo explicativo dos casos da terapia de reposição hormonal, da vitamina E e parte da história da vitamina D. Em cada um deles, a evidência observacional sustentava efeito protetor robusto antes que o ensaio randomizado a invertesse. A reanálise contemporânea reconhece, em cada caso, que existiam confundidores não medidos compatíveis com o padrão healthy-user — e que esses confundidores tinham E-values plausíveis para anular a associação observada. O ensaio randomizado os anulou na prática.

Para a vitamina D, além do confundimento, atua a causalidade reversa: pacientes com doença crônica têm níveis séricos de vitamina D mais baixos como consequência da doença, não como sua causa. Para o betacaroteno, entram em cena dois fenômenos adicionais — a falácia do componente ativo (atribuir a um único composto isolado o efeito observado para a matriz alimentar inteira e extraí-lo do contexto químico em que opera) e a interação com a biologia do hospedeiro (em fumantes, o betacaroteno em alta concentração tecidual pode inverter seu papel antioxidante e atuar como pró-oxidante). O confundimento explica parte da história, não toda.

Síntese

Confundimento é o problema central da epidemiologia observacional. O aparato moderno — resultados potenciais, DAGs, controle por desenho, ajuste analítico, métodos para confundidor não medido, análise de viés quantitativa — não elimina o problema, mas o torna disciplinado. Cada decisão analítica passa a ser justificada por uma estrutura causal explícita, e o que sobra de viés fica quantificável.

O Cap. 05 trata do que se faz quando, mesmo com todo esse aparato, a evidência permanece ambígua: triangulação, hierarquia GRADE e a leitura contemporânea dos pontos de Hill como considerações, em vez de critérios.

Exercícios

1. Em um estudo observacional que reporta menor mortalidade cardiovascular em mulheres em uso de terapia de reposição hormonal vs não usuárias, identifique a direção mais provável do viés do usuário saudável e explique, em até cinco linhas, por que esse viés produziria associação aparentemente protetora mesmo na ausência de qualquer efeito biológico de TRH sobre o sistema cardiovascular.

2. Um pesquisador estuda o efeito de uma estatina sobre eventos cardiovasculares e ajusta o modelo regressivo por LDL pós-tratamento. Discuta — usando vocabulário de mediador, confundidor e colisor — por que esse ajuste é metodologicamente problemático e o que ele estima realmente. Que ajuste alternativo recuperaria o efeito causal de interesse?

3. Um estudo reporta razão de risco de 1,8 para uma associação exposição-desfecho, após ajuste por confundidores medidos. O E-value calculado é 3,0. Em uma frase, interprete o E-value: que magnitude de confundimento não medido seria necessária para anular o efeito? O resultado parece robusto a confundimento moderado, ou é frágil?

Referências

Greenland S, Robins JM. Identifiability, Exchangeability, and Epidemiological Confounding. International Journal of Epidemiology. 1986;15(3):413–9.

VanderWeele TJ, Hernán MA, Robins JM. Causal Directed Acyclic Graphs and the Direction of Unmeasured Confounding Bias. Epidemiology. 2008;19(5):720–8.

VanderWeele TJ, Ding P. Sensitivity Analysis in Observational Research: Introducing the E-Value. Annals of Internal Medicine. 2017;167(4):268–74.

Savitz DA, Pearce N, Rothman KJ. Hill’s Considerations Are Not Causal Criteria. Journal of Clinical Epidemiology. 2025;190:112087.