| Aspecto | Item Likert (individual) | Escala Likert (composta) |
|---|---|---|
| O que é | Uma afirmação isolada | Soma/média de múltiplos itens |
| Valores possíveis | 1, 2, 3, 4, 5 (poucos valores discretos) | 10 a 50 (ou 1,0 a 5,0 como média) |
| Natureza | Categórica ordinal | Tratada como numérica na prática |
| Média faz sentido? | Não — poucos valores, distâncias desiguais | Sim — muitos valores, TLC se aplica |
| Distribuição | Discreta, frequentemente assimétrica | Tende a aproximar-se da normal (TLC) |
| Estatística descritiva | Moda, mediana, frequências | Média, desvio-padrão |
| Exemplo | 'Eu me sinto seguro no meu bairro' → 4 | Escore de satisfação = 38 (soma de 10 itens) |
Casos Especiais
Quando o tipo de dado muda: Likert, contexto e a mesma variável com duas identidades
A história
Em 1932, o psicólogo americano Rensis Likert (pronuncia-se “LICK-ert”, não “LIE-kert”) publicou sua tese de doutorado nos Archives of Psychology: A Technique for the Measurement of Attitudes. O problema que o motivava era antigo: como medir algo tão subjetivo quanto uma atitude — a favorabilidade de uma pessoa em relação a uma política, um grupo social, uma instituição? (1).
A solução era elegante. Em vez de perguntas de sim/não, Likert propôs que os respondentes indicassem seu grau de concordância com uma série de afirmações, numa escala de cinco pontos: discordo totalmente, discordo, indeciso, concordo, concordo totalmente. Cada resposta recebia um valor de 1 a 5, e os valores dos itens individuais eram somados num escore total que representava a atitude do sujeito. A técnica era simples, confiável e — crucialmente — produzia números. Tornou-se rapidamente uma das mais utilizadas em ciências sociais e da saúde. Mas a natureza dos números que ela produz gerou um debate longo, que só nas últimas décadas encontrou uma resolução prática.
Escala de Likert: item vs. escala
Para entender a escala de Likert é preciso primeiro distinguir dois conceitos que são facilmente confundidos:
Um item Likert é uma afirmação isolada à qual o respondente reage numa escala de concordância. Exemplo: “Eu me sinto satisfeito com o atendimento recebido” — de 1 (discordo totalmente) a 5 (concordo totalmente).
O escore da escala Likert é a soma (ou média) de múltiplos itens Likert que medem o mesmo constructo. Se um questionário de satisfação tem 10 itens, cada um de 1 a 5, o escore total varia de 10 a 50.
A classificação dos dados Likert gerou um dos debates mais longos da metodologia quantitativa. De um lado, a posição ordinalista: cada item Likert é ordinal, os números representam categorias ordenadas, e a distância entre “discordo” e “indeciso” não é necessariamente igual à distância entre “concordo” e “concordo totalmente”. Logo, média e desvio-padrão não seriam apropriados — o correto seria usar mediana, moda e testes não paramétricos (2).
Do outro lado, estudos de simulação acumulados desde os anos 1930 mostraram que testes paramétricos como ANOVA e correlação de Pearson são extraordinariamente robustos a violações dessas suposições. Pearson (1931) já demonstrava que a ANOVA funcionava com distribuições assimétricas e amostras de 4 a 10. Décadas depois, Havlicek e Peterson (1976) testaram correlações de Pearson com distribuições normais, retangulares e ordinais, com amostras de 5 a 60, e concluíram que o coeficiente de Pearson é “rather insensitive to extreme violations of the basic assumptions of normality and the type of scale” (3).
A explicação teórica é simples: a suposição de normalidade dos testes paramétricos se aplica à distribuição das médias, não dos dados individuais. Pelo Teorema Central do Limite, com amostras maiores que 5 ou 10 por grupo, as médias se distribuem de forma aproximadamente normal independente da distribuição original (3).
O consenso atual
Hoje, a questão está resolvida na prática. O consenso se apoia em dois pontos (3–5):
Um item Likert individual é ordinal. A mediana e as frequências são a forma mais honesta de descrevê-lo.
O score tota da escala Likert composta (soma de múltiplos itens) se comporta de forma aproximadamente contínua — e o uso de média, desvio-padrão e testes paramétricos é adequado. Isso é especialmente claro quando a escala tem oito ou mais itens (4).
Um item Likert (uma pergunta) é ordinal. O escore total da escala Likert (a soma de vários itens) se comporta de forma aproximadamente contínua. A confusão entre os dois é a principal fonte de mal-entendidos sobre o tema.
TLC = Teorema do Limite Central: quando somamos muitas variáveis independentes, a distribuição da soma tende a se aproximar da normal — mesmo que as variáveis originais não sejam normais. É por isso que escalas compostas (soma de vários itens) se comportam de forma mais “bem-comportada” que itens isolados.
Visualizando a diferença com dados simulados
Para tornar a distinção concreta, vamos simular um cenário simples: 200 sujeitos respondem a um item Likert de satisfação (1 a 5). O que muda quando analisamos o item como ordinal vs. como numérico?
| Abordagem | Medida de centro | Interpretação | Teste de comparação |
|---|---|---|---|
| Como ordinal (não paramétrica) | Mediana = 4 (Concordo); Moda = 4 (Concordo) | A maioria concorda ou concorda totalmente | Mann-Whitney, Kruskal-Wallis |
| Como numérica (paramétrica) | Média = 3.6 ± 1.15 | Em média, os respondentes tendem a concordar | Teste t, ANOVA |
Na prática, as duas abordagens frequentemente levam à mesma conclusão (3). A diferença está na precisão da linguagem: dizer “a mediana é 4 (concordo)” é mais fiel à natureza ordinal do dado do que dizer “a média é 3,48”.
Recomendação prática
Na prática, a orientação pode ser resumida assim:
| Situação | Recomendação | Justificativa |
|---|---|---|
| Item individual (1 a 5 ou 1 a 7) | Trate como ordinal: reporte mediana, moda e frequências; use testes não paramétricos | Poucos valores possíveis; distâncias entre níveis não garantidas |
| Escala composta (soma/média de ≥ 5 itens) | Pode tratar como numérica: reporte média ± DP; testes paramétricos são válidos | Muitos valores possíveis; TLC se aplica; décadas de simulações confirmam robustez |
| Amostra pequena (n < 30) com item individual | Sempre trate como ordinal — a robustez paramétrica depende de n suficiente | Sem n suficiente, o TLC não garante normalidade da média amostral |
| Apresentação descritiva em artigo | Reporte frequências por nível (%) E a mediana — mesmo que use média para análise | A distribuição de frequências é a descrição mais fiel dos dados ordinais |
A mesma variável, dois tipos
A escala de Likert ilustra um fenômeno mais geral: a mesma informação pode ser coletada como numérica ou como categórica. A decisão é do pesquisador — e essa decisão tem consequências diretas para a análise.
| Variável | Como numérica | Como categórica | O que se perde na categorização |
|---|---|---|---|
| Idade | 47 anos | Adulto (30–59 anos) | Magnitude exata |
| Peso | 82,3 kg | Sobrepeso (IMC 25–29,9) | Magnitude exata |
| Pressão arterial | 138 mmHg | Hipertenso estágio 1 | Magnitude exata |
| Glicemia | 112 mg/dL | Pré-diabético | Magnitude exata |
| Dor | Escala visual analógica: 7,2 cm | Dor moderada | Precisão contínua |
| Escolaridade | 16 anos de estudo | Ensino superior completo | Magnitude exata |
A passagem de numérico para categórico é sempre possível — basta definir pontos de corte. Mas o caminho inverso é impossível: uma vez que registramos “hipertenso estágio 1”, não podemos recuperar se a pressão era 140, 152 ou 159 mmHg. A categorização é uma via de mão única, e Altman e Royston demonstram que dicotomizar uma variável contínua pela mediana reduz o poder estatístico tanto quanto descartar um terço dos dados (6).
O caso do IMC é paradigmático. O valor bruto (27,4 kg/m²) é uma variável contínua de razão — permite média, desvio-padrão e todas as operações aritméticas. Mas na prática clínica, é quase sempre apresentado em categorias da OMS (baixo peso, normal, sobrepeso, obesidade), tornando-se uma variável ordinal. A mesma informação, dois tipos de dado — e a escolha depende do objetivo: a versão contínua é mais poderosa estatisticamente; a categórica é mais comunicável clinicamente.
Outros casos especiais
A escala de Likert não é o único caso em que a classificação de uma variável desafia as categorias simples. Outros exemplos frequentes em pesquisa em saúde:
Escolaridade: ordinal ou numérica?
A escolaridade pode ser registrada como anos de estudo (variável numérica discreta: 0, 1, 2, …, 20) ou como nível de escolaridade (variável categórica ordinal: fundamental, médio, superior). No IBGE, a classificação oficial é ordinal — mas muitos estudos epidemiológicos usam “anos de estudo” como proxy numérica, permitindo regressão linear em vez de modelos ordinais.
Escala visual analógica de dor (EVA)
O paciente marca um ponto numa linha de 10 cm. O valor lido — 4,7 cm — é contínuo. Mas quando transformamos em categorias (0 = sem dor, 1–3 = leve, 4–6 = moderada, 7–10 = intensa), a variável se torna ordinal. Mesmo o valor bruto levanta questões: a distância entre 2 e 4 é a mesma experiência de dor que entre 6 e 8? A escala pode ser contínua na régua sem ser intervalar na experiência.
Variáveis cíclicas
Algumas variáveis numéricas não obedecem à lógica linear. O horário (0h a 24h) é numérico, mas a diferença entre 23h e 1h não é 22 horas — é 2 horas. O mês de nascimento (1 a 12) é numérico, mas dezembro e janeiro são adjacentes, não distantes. Variáveis cíclicas exigem métodos específicos (estatística circular) e são frequentemente tratadas de forma inadequada quando jogadas numa regressão linear convencional (8).
Variáveis truncadas e censuradas
Na pesquisa em saúde, variáveis numéricas frequentemente têm limites de detecção. Um exame de carga viral que reporta “< 20 cópias/mL” não informa o valor exato — apenas que está abaixo do limite de detecção. Esses dados censurados não podem ser tratados como zero nem como o valor do limite; exigem métodos estatísticos específicos (como a regressão de Tobit ou métodos de sobrevida) que levem em conta a informação parcial.
| Variável | Versão numérica | Versão categórica | Desafio |
|---|---|---|---|
| IMC | 27,4 kg/m² | Sobrepeso (OMS) | Perda de poder ao categorizar |
| Escolaridade | 14 anos de estudo | Ensino médio completo | Proxy numérica comum mas imprecisa |
| Dor (EVA) | 4,7 cm | Dor moderada | Contínua na régua, ordinal na experiência? |
| Horário do evento | 23:15 | Período noturno | Variável cíclica — diferenças lineares falham |
| Carga viral | > 20 cópias/mL | Indetectável vs. detectável | Censura à esquerda — valor exato desconhecido |
| Likert (item) | 4 (concordo) | Concordo | Ordinal, mas tratada como numérica por muitos |
| Likert (escala) | 38 pontos (soma de 10 itens) | Alta satisfação | Composta — comporta-se como intervalar |
A lição dos casos especiais
Os exemplos deste capítulo convergem para uma mesma lição: a classificação de uma variável não é uma propriedade intrínseca do fenômeno — é o resultado de decisões sobre como medir, registrar e analisar. A idade é contínua por natureza, mas pode ser coletada como discreta (anos inteiros) ou categórica (faixa etária). O IMC é contínuo, mas a prática clínica o transforma em ordinal. A escala de Likert muda de natureza dependendo de como é agregada — um item é ordinal, uma escala composta se comporta como contínua.
Essa fluidez não é um defeito do sistema de classificação de Stevens — é uma característica da realidade. As escalas de medida são modelos, não leis da natureza (8,9). O pesquisador deve escolher o modelo que melhor serve ao objetivo da análise, documentar essa escolha e estar preparado para justificá-la.
Em qualquer artigo ou relatório, explicite: (1) como a variável foi medida originalmente, (2) se e como foi categorizada, e (3) por que essa classificação foi escolhida. Essa transparência permite que revisores e leitores avaliem se a análise é coerente com a natureza dos dados — e é exatamente o que diretrizes como o STROBE recomendam (10).
Resumo do capítulo
| Conceito | Definição | Recomendação prática |
|---|---|---|
| A mesma variável, dois tipos | O pesquisador decide se coleta/analisa como numérica ou categórica | Colete na forma mais detalhada possível; categorize depois se necessário |
| Item Likert | Afirmação isolada com resposta de 1 a 5 (ou 7) — ordinal | Reporte frequências por nível e mediana |
| Escala Likert (composta) | Soma ou média de múltiplos itens — comporta-se como contínua | Média ± DP e testes paramétricos são adequados |
| Debate Likert (resolvido) | Item = ordinal (consenso); escala composta = testes paramétricos são robustos | Seja transparente: reporte frequências E mediana, mesmo que use média |
| IMC: dupla identidade | Contínuo (kg/m²) na coleta; ordinal (OMS) na prática clínica | Mantenha contínuo para análise; categorize para comunicação clínica |
| Variáveis cíclicas | Valores numéricos sem linearidade (horário, mês) — exigem estatística circular | Não use média aritmética; considere estatística circular |
| Dados censurados | Valor exato desconhecido (< limite de detecção) — exigem métodos especiais | Não substitua por zero nem pelo limite; use métodos de censura |
Este capítulo explorou os casos em que a classificação de variáveis desafia as categorias simples. No próximo capítulo vamos aprender a organizá-los — como estruturar planilhas para que os dados possam ser analisados de forma eficiente e reproduzível.