Casos Especiais

Quando o tipo de dado muda: Likert, contexto e a mesma variável com duas identidades

A história

Em 1932, o psicólogo americano Rensis Likert (pronuncia-se “LICK-ert”, não “LIE-kert”) publicou sua tese de doutorado nos Archives of Psychology: A Technique for the Measurement of Attitudes. O problema que o motivava era antigo: como medir algo tão subjetivo quanto uma atitude — a favorabilidade de uma pessoa em relação a uma política, um grupo social, uma instituição? (1).

A solução era elegante. Em vez de perguntas de sim/não, Likert propôs que os respondentes indicassem seu grau de concordância com uma série de afirmações, numa escala de cinco pontos: discordo totalmente, discordo, indeciso, concordo, concordo totalmente. Cada resposta recebia um valor de 1 a 5, e os valores dos itens individuais eram somados num escore total que representava a atitude do sujeito. A técnica era simples, confiável e — crucialmente — produzia números. Tornou-se rapidamente uma das mais utilizadas em ciências sociais e da saúde. Mas a natureza dos números que ela produz gerou um debate longo, que só nas últimas décadas encontrou uma resolução prática.

Escala de Likert: item vs. escala

Para entender a escala de Likert é preciso primeiro distinguir dois conceitos que são facilmente confundidos:

Um item Likert é uma afirmação isolada à qual o respondente reage numa escala de concordância. Exemplo: “Eu me sinto satisfeito com o atendimento recebido” — de 1 (discordo totalmente) a 5 (concordo totalmente).

O escore da escala Likert é a soma (ou média) de múltiplos itens Likert que medem o mesmo constructo. Se um questionário de satisfação tem 10 itens, cada um de 1 a 5, o escore total varia de 10 a 50.

A classificação dos dados Likert gerou um dos debates mais longos da metodologia quantitativa. De um lado, a posição ordinalista: cada item Likert é ordinal, os números representam categorias ordenadas, e a distância entre “discordo” e “indeciso” não é necessariamente igual à distância entre “concordo” e “concordo totalmente”. Logo, média e desvio-padrão não seriam apropriados — o correto seria usar mediana, moda e testes não paramétricos (2).

Do outro lado, estudos de simulação acumulados desde os anos 1930 mostraram que testes paramétricos como ANOVA e correlação de Pearson são extraordinariamente robustos a violações dessas suposições. Pearson (1931) já demonstrava que a ANOVA funcionava com distribuições assimétricas e amostras de 4 a 10. Décadas depois, Havlicek e Peterson (1976) testaram correlações de Pearson com distribuições normais, retangulares e ordinais, com amostras de 5 a 60, e concluíram que o coeficiente de Pearson é “rather insensitive to extreme violations of the basic assumptions of normality and the type of scale” (3).

A explicação teórica é simples: a suposição de normalidade dos testes paramétricos se aplica à distribuição das médias, não dos dados individuais. Pelo Teorema Central do Limite, com amostras maiores que 5 ou 10 por grupo, as médias se distribuem de forma aproximadamente normal independente da distribuição original (3).

O consenso atual

Hoje, a questão está resolvida na prática. O consenso se apoia em dois pontos (35):

  1. Um item Likert individual é ordinal. A mediana e as frequências são a forma mais honesta de descrevê-lo.

  2. O score tota da escala Likert composta (soma de múltiplos itens) se comporta de forma aproximadamente contínua — e o uso de média, desvio-padrão e testes paramétricos é adequado. Isso é especialmente claro quando a escala tem oito ou mais itens (4).

DicaItem vs. escala

Um item Likert (uma pergunta) é ordinal. O escore total da escala Likert (a soma de vários itens) se comporta de forma aproximadamente contínua. A confusão entre os dois é a principal fonte de mal-entendidos sobre o tema.

Tabela 1: Item Likert vs. escala Likert — a distinção central.
Aspecto Item Likert (individual) Escala Likert (composta)
O que é Uma afirmação isolada Soma/média de múltiplos itens
Valores possíveis 1, 2, 3, 4, 5 (poucos valores discretos) 10 a 50 (ou 1,0 a 5,0 como média)
Natureza Categórica ordinal Tratada como numérica na prática
Média faz sentido? Não — poucos valores, distâncias desiguais Sim — muitos valores, TLC se aplica
Distribuição Discreta, frequentemente assimétrica Tende a aproximar-se da normal (TLC)
Estatística descritiva Moda, mediana, frequências Média, desvio-padrão
Exemplo 'Eu me sinto seguro no meu bairro' → 4 Escore de satisfação = 38 (soma de 10 itens)

TLC = Teorema do Limite Central: quando somamos muitas variáveis independentes, a distribuição da soma tende a se aproximar da normal — mesmo que as variáveis originais não sejam normais. É por isso que escalas compostas (soma de vários itens) se comportam de forma mais “bem-comportada” que itens isolados.

Visualizando a diferença com dados simulados

Para tornar a distinção concreta, vamos simular um cenário simples: 200 sujeitos respondem a um item Likert de satisfação (1 a 5). O que muda quando analisamos o item como ordinal vs. como numérico?

Figura 1: O mesmo item Likert visto de duas formas: como frequência de categorias (esquerda) e como distribuição numérica (direita).
Tabela 2: O mesmo dado analisado de duas formas — as conclusões são semelhantes, mas a linguagem muda.
Abordagem Medida de centro Interpretação Teste de comparação
Como ordinal (não paramétrica) Mediana = 4 (Concordo); Moda = 4 (Concordo) A maioria concorda ou concorda totalmente Mann-Whitney, Kruskal-Wallis
Como numérica (paramétrica) Média = 3.6 ± 1.15 Em média, os respondentes tendem a concordar Teste t, ANOVA

Na prática, as duas abordagens frequentemente levam à mesma conclusão (3). A diferença está na precisão da linguagem: dizer “a mediana é 4 (concordo)” é mais fiel à natureza ordinal do dado do que dizer “a média é 3,48”.

Recomendação prática

Na prática, a orientação pode ser resumida assim:

Tabela 3: Recomendação prática — como tratar dados Likert dependendo do contexto.
Situação Recomendação Justificativa
Item individual (1 a 5 ou 1 a 7) Trate como ordinal: reporte mediana, moda e frequências; use testes não paramétricos Poucos valores possíveis; distâncias entre níveis não garantidas
Escala composta (soma/média de ≥ 5 itens) Pode tratar como numérica: reporte média ± DP; testes paramétricos são válidos Muitos valores possíveis; TLC se aplica; décadas de simulações confirmam robustez
Amostra pequena (n < 30) com item individual Sempre trate como ordinal — a robustez paramétrica depende de n suficiente Sem n suficiente, o TLC não garante normalidade da média amostral
Apresentação descritiva em artigo Reporte frequências por nível (%) E a mediana — mesmo que use média para análise A distribuição de frequências é a descrição mais fiel dos dados ordinais
NotaNa dúvida, seja transparente

Reporte as frequências por nível e a mediana. Se usar a média para análise, justifique a escolha. Assim o leitor pode avaliar os dados independentemente da abordagem estatística escolhida (3,5).

A mesma variável, dois tipos

A escala de Likert ilustra um fenômeno mais geral: a mesma informação pode ser coletada como numérica ou como categórica. A decisão é do pesquisador — e essa decisão tem consequências diretas para a análise.

Tabela 4: A mesma realidade, dois tipos de dado — a decisão é metodológica, não da natureza.
Variável Como numérica Como categórica O que se perde na categorização
Idade 47 anos Adulto (30–59 anos) Magnitude exata
Peso 82,3 kg Sobrepeso (IMC 25–29,9) Magnitude exata
Pressão arterial 138 mmHg Hipertenso estágio 1 Magnitude exata
Glicemia 112 mg/dL Pré-diabético Magnitude exata
Dor Escala visual analógica: 7,2 cm Dor moderada Precisão contínua
Escolaridade 16 anos de estudo Ensino superior completo Magnitude exata

A passagem de numérico para categórico é sempre possível — basta definir pontos de corte. Mas o caminho inverso é impossível: uma vez que registramos “hipertenso estágio 1”, não podemos recuperar se a pressão era 140, 152 ou 159 mmHg. A categorização é uma via de mão única, e Altman e Royston demonstram que dicotomizar uma variável contínua pela mediana reduz o poder estatístico tanto quanto descartar um terço dos dados (6).

Figura 2: O IMC tem duas vidas: como variável contínua (histograma) e como categórica ordinal (barras).

O caso do IMC é paradigmático. O valor bruto (27,4 kg/m²) é uma variável contínua de razão — permite média, desvio-padrão e todas as operações aritméticas. Mas na prática clínica, é quase sempre apresentado em categorias da OMS (baixo peso, normal, sobrepeso, obesidade), tornando-se uma variável ordinal. A mesma informação, dois tipos de dado — e a escolha depende do objetivo: a versão contínua é mais poderosa estatisticamente; a categórica é mais comunicável clinicamente.

ImportanteA regra de ouro

Sempre que possível, colete e armazene os dados na forma mais detalhada (numérica). Categorizar depois é fácil; recuperar a precisão perdida é impossível. Registre a pressão como 142 mmHg, não como “hipertenso” — você sempre pode criar a categoria depois, mas nunca poderá desfazer a perda (6,7).

Outros casos especiais

A escala de Likert não é o único caso em que a classificação de uma variável desafia as categorias simples. Outros exemplos frequentes em pesquisa em saúde:

Escolaridade: ordinal ou numérica?

A escolaridade pode ser registrada como anos de estudo (variável numérica discreta: 0, 1, 2, …, 20) ou como nível de escolaridade (variável categórica ordinal: fundamental, médio, superior). No IBGE, a classificação oficial é ordinal — mas muitos estudos epidemiológicos usam “anos de estudo” como proxy numérica, permitindo regressão linear em vez de modelos ordinais.

Escala visual analógica de dor (EVA)

O paciente marca um ponto numa linha de 10 cm. O valor lido — 4,7 cm — é contínuo. Mas quando transformamos em categorias (0 = sem dor, 1–3 = leve, 4–6 = moderada, 7–10 = intensa), a variável se torna ordinal. Mesmo o valor bruto levanta questões: a distância entre 2 e 4 é a mesma experiência de dor que entre 6 e 8? A escala pode ser contínua na régua sem ser intervalar na experiência.

Variáveis cíclicas

Algumas variáveis numéricas não obedecem à lógica linear. O horário (0h a 24h) é numérico, mas a diferença entre 23h e 1h não é 22 horas — é 2 horas. O mês de nascimento (1 a 12) é numérico, mas dezembro e janeiro são adjacentes, não distantes. Variáveis cíclicas exigem métodos específicos (estatística circular) e são frequentemente tratadas de forma inadequada quando jogadas numa regressão linear convencional (8).

Variáveis truncadas e censuradas

Na pesquisa em saúde, variáveis numéricas frequentemente têm limites de detecção. Um exame de carga viral que reporta “< 20 cópias/mL” não informa o valor exato — apenas que está abaixo do limite de detecção. Esses dados censurados não podem ser tratados como zero nem como o valor do limite; exigem métodos estatísticos específicos (como a regressão de Tobit ou métodos de sobrevida) que levem em conta a informação parcial.

Tabela 5: Exemplos
Variável Versão numérica Versão categórica Desafio
IMC 27,4 kg/m² Sobrepeso (OMS) Perda de poder ao categorizar
Escolaridade 14 anos de estudo Ensino médio completo Proxy numérica comum mas imprecisa
Dor (EVA) 4,7 cm Dor moderada Contínua na régua, ordinal na experiência?
Horário do evento 23:15 Período noturno Variável cíclica — diferenças lineares falham
Carga viral > 20 cópias/mL Indetectável vs. detectável Censura à esquerda — valor exato desconhecido
Likert (item) 4 (concordo) Concordo Ordinal, mas tratada como numérica por muitos
Likert (escala) 38 pontos (soma de 10 itens) Alta satisfação Composta — comporta-se como intervalar

A lição dos casos especiais

Os exemplos deste capítulo convergem para uma mesma lição: a classificação de uma variável não é uma propriedade intrínseca do fenômeno — é o resultado de decisões sobre como medir, registrar e analisar. A idade é contínua por natureza, mas pode ser coletada como discreta (anos inteiros) ou categórica (faixa etária). O IMC é contínuo, mas a prática clínica o transforma em ordinal. A escala de Likert muda de natureza dependendo de como é agregada — um item é ordinal, uma escala composta se comporta como contínua.

Essa fluidez não é um defeito do sistema de classificação de Stevens — é uma característica da realidade. As escalas de medida são modelos, não leis da natureza (8,9). O pesquisador deve escolher o modelo que melhor serve ao objetivo da análise, documentar essa escolha e estar preparado para justificá-la.

AvisoDocumente suas decisões

Em qualquer artigo ou relatório, explicite: (1) como a variável foi medida originalmente, (2) se e como foi categorizada, e (3) por que essa classificação foi escolhida. Essa transparência permite que revisores e leitores avaliem se a análise é coerente com a natureza dos dados — e é exatamente o que diretrizes como o STROBE recomendam (10).

Resumo do capítulo

Tabela 6: Resumo — casos especiais na classificação de variáveis.
Conceito Definição Recomendação prática
A mesma variável, dois tipos O pesquisador decide se coleta/analisa como numérica ou categórica Colete na forma mais detalhada possível; categorize depois se necessário
Item Likert Afirmação isolada com resposta de 1 a 5 (ou 7) — ordinal Reporte frequências por nível e mediana
Escala Likert (composta) Soma ou média de múltiplos itens — comporta-se como contínua Média ± DP e testes paramétricos são adequados
Debate Likert (resolvido) Item = ordinal (consenso); escala composta = testes paramétricos são robustos Seja transparente: reporte frequências E mediana, mesmo que use média
IMC: dupla identidade Contínuo (kg/m²) na coleta; ordinal (OMS) na prática clínica Mantenha contínuo para análise; categorize para comunicação clínica
Variáveis cíclicas Valores numéricos sem linearidade (horário, mês) — exigem estatística circular Não use média aritmética; considere estatística circular
Dados censurados Valor exato desconhecido (< limite de detecção) — exigem métodos especiais Não substitua por zero nem pelo limite; use métodos de censura
NotaPróximos passos

Este capítulo explorou os casos em que a classificação de variáveis desafia as categorias simples. No próximo capítulo vamos aprender a organizá-los — como estruturar planilhas para que os dados possam ser analisados de forma eficiente e reproduzível.

Referências

1.
Likert R. A Technique for the Measurement of Attitudes. Archives of Psychology. 1932;22(140):5–55.
2.
Jamieson S. Likert Scales: How to (Ab)Use Them. Medical Education. 2004;38(12):1217–8.
3.
Norman G. Likert Scales, Levels of Measurement and the «Laws» of Statistics. Advances in Health Sciences Education. 2010;15(5):625–32.
4.
Carifio J, Perla R. Resolving the 50-Year Debate around Using and Misusing Likert Scales. Medical Education. 2008;42(12):1150–2.
5.
Sullivan GM, Artino Jr. AR. Analyzing and Interpreting Data from Likert-type Scales. Journal of Graduate Medical Education. 2013;5(4):541–2.
6.
Altman DG, Royston P. The Cost of Dichotomising Continuous Variables. BMJ (Clinical research ed). 2006;332(7549):1080.
7.
Agresti A. Statistical Methods for the Social Sciences. 5.ª ed. Boston: Pearson; 2018.
8.
Hand DJ. Measurement Theory and Practice: The World through Quantification. London: Arnold Publishers; 2004.
9.
Velleman PF, Wilkinson L. Nominal, Ordinal, Interval, and Ratio Typologies Are Misleading. The American Statistician. 1993;47(1):65–72.
10.
Vandenbroucke JP, von Elm E, Altman DG, Gøtzsche PC, Mulrow CD, Pocock SJ, et al. Strengthening the Reporting of Observational Studies in Epidemiology (STROBE): Explanation and Elaboration. Annals of Internal Medicine. 2007;147(8):W-163-W-194.