Casos Especiais

Quando o tipo de dado muda: Likert, contexto e a mesma variável com duas identidades

A história

Em 1932, o psicólogo americano Rensis Likert (pronuncia-se “LICK-ert”, não “LIE-kert”) publicou sua tese de doutorado nos Archives of Psychology: A Technique for the Measurement of Attitudes. O problema que o motivava era antigo: como medir algo tão subjetivo quanto uma atitude — a favorabilidade de uma pessoa em relação a uma política, um grupo social, uma instituição? (1).

A solução era elegante. Em vez de perguntas de sim/não, Likert propôs que os respondentes indicassem seu grau de concordância com uma série de afirmações, numa escala de cinco pontos: discordo totalmente, discordo, indeciso, concordo, concordo totalmente. Cada resposta recebia um valor de 1 a 5, e os valores dos itens individuais eram somados num escore total que representava a atitude do sujeito. A técnica era simples, confiável e — crucialmente — produzia números. Tornou-se rapidamente uma das mais utilizadas em ciências sociais e da saúde. Mas a natureza dos números que ela produz gerou um debate longo, que só nas últimas décadas encontrou uma resolução prática.

Escala de Likert: item vs. escala

Para entender a escala de Likert é preciso primeiro distinguir dois conceitos que são facilmente confundidos:

Um item Likert é uma afirmação isolada à qual o respondente reage numa escala de concordância. Exemplo: “Eu me sinto satisfeito com o atendimento recebido” — de 1 (discordo totalmente) a 5 (concordo totalmente).

O escore da escala Likert é a soma (ou média) de múltiplos itens Likert que medem o mesmo constructo. Se um questionário de satisfação tem 10 itens, cada um de 1 a 5, o escore total varia de 10 a 50.

A classificação dos dados Likert gerou um dos debates mais longos da metodologia quantitativa. De um lado, a posição ordinalista: cada item Likert é ordinal, os números representam categorias ordenadas, e a distância entre “discordo” e “indeciso” não é necessariamente igual à distância entre “concordo” e “concordo totalmente”. Logo, média e desvio-padrão não seriam apropriados — o correto seria usar mediana, moda e testes não paramétricos (2).

Do outro lado, estudos de simulação acumulados desde os anos 1930 mostraram que testes paramétricos como ANOVA e correlação de Pearson são extraordinariamente robustos a violações dessas suposições. Pearson (1931) já demonstrava que a ANOVA funcionava com distribuições assimétricas e amostras de 4 a 10. Décadas depois, Havlicek e Peterson (1976) testaram correlações de Pearson com distribuições normais, retangulares e ordinais, com amostras de 5 a 60, e concluíram que o coeficiente de Pearson é “rather insensitive to extreme violations of the basic assumptions of normality and the type of scale” (3).

A explicação teórica é simples: a suposição de normalidade dos testes paramétricos se aplica à distribuição das médias, não dos dados individuais. Pelo Teorema Central do Limite, com amostras maiores que 5 ou 10 por grupo, as médias se distribuem de forma aproximadamente normal independente da distribuição original (3).

O consenso atual

Hoje, a questão está resolvida na prática. O consenso se apoia em dois pontos (3–5):

Um item Likert individual é ordinal. A mediana e as frequências são a forma mais honesta de descrevê-lo.
O score tota da escala Likert composta (soma de múltiplos itens) se comporta de forma aproximadamente contínua — e o uso de média, desvio-padrão e testes paramétricos é adequado. Isso é especialmente claro quando a escala tem oito ou mais itens (4).

Item vs. escala

Um item Likert (uma pergunta) é ordinal. O escore total da escala Likert (a soma de vários itens) se comporta de forma aproximadamente contínua. A confusão entre os dois é a principal fonte de mal-entendidos sobre o tema.

Tabela 1: Item Likert vs. escala Likert — a distinção central.

Aspecto	Item Likert (individual)	Escala Likert (composta)
O que é	Uma afirmação isolada	Soma/média de múltiplos itens
Valores possíveis	1, 2, 3, 4, 5 (poucos valores discretos)	10 a 50 (ou 1,0 a 5,0 como média)
Natureza	Categórica ordinal	Tratada como numérica na prática
Média faz sentido?	Não — poucos valores, distâncias desiguais	Sim — muitos valores, TLC se aplica
Distribuição	Discreta, frequentemente assimétrica	Tende a aproximar-se da normal (TLC)
Estatística descritiva	Moda, mediana, frequências	Média, desvio-padrão
Exemplo	'Eu me sinto seguro no meu bairro' → 4	Escore de satisfação = 38 (soma de 10 itens)

TLC = Teorema do Limite Central: quando somamos muitas variáveis independentes, a distribuição da soma tende a se aproximar da normal — mesmo que as variáveis originais não sejam normais. É por isso que escalas compostas (soma de vários itens) se comportam de forma mais “bem-comportada” que itens isolados.

Visualizando a diferença com dados simulados

Para tornar a distinção concreta, vamos simular um cenário simples: 200 sujeitos respondem a um item Likert de satisfação (1 a 5). O que muda quando analisamos o item como ordinal vs. como numérico?

Figura 1: O mesmo item Likert visto de duas formas: como frequência de categorias (esquerda) e como distribuição numérica (direita).

Tabela 2: O mesmo dado analisado de duas formas — as conclusões são semelhantes, mas a linguagem muda.

Abordagem	Medida de centro	Interpretação	Teste de comparação
Como ordinal (não paramétrica)	Mediana = 4 (Concordo); Moda = 4 (Concordo)	A maioria concorda ou concorda totalmente	Mann-Whitney, Kruskal-Wallis
Como numérica (paramétrica)	Média = 3.6 ± 1.15	Em média, os respondentes tendem a concordar	Teste t, ANOVA

Na prática, as duas abordagens frequentemente levam à mesma conclusão (3). A diferença está na precisão da linguagem: dizer “a mediana é 4 (concordo)” é mais fiel à natureza ordinal do dado do que dizer “a média é 3,48”.

Recomendação prática

Na prática, a orientação pode ser resumida assim:

Tabela 3: Recomendação prática — como tratar dados Likert dependendo do contexto.

Situação	Recomendação	Justificativa
Item individual (1 a 5 ou 1 a 7)	Trate como ordinal: reporte mediana, moda e frequências; use testes não paramétricos	Poucos valores possíveis; distâncias entre níveis não garantidas
Escala composta (soma/média de ≥ 5 itens)	Pode tratar como numérica: reporte média ± DP; testes paramétricos são válidos	Muitos valores possíveis; TLC se aplica; décadas de simulações confirmam robustez
Amostra pequena (n < 30) com item individual	Sempre trate como ordinal — a robustez paramétrica depende de n suficiente	Sem n suficiente, o TLC não garante normalidade da média amostral
Apresentação descritiva em artigo	Reporte frequências por nível (%) E a mediana — mesmo que use média para análise	A distribuição de frequências é a descrição mais fiel dos dados ordinais

Na dúvida, seja transparente

Reporte as frequências por nível e a mediana. Se usar a média para análise, justifique a escolha. Assim o leitor pode avaliar os dados independentemente da abordagem estatística escolhida (3,5).

A mesma variável, dois tipos

A escala de Likert ilustra um fenômeno mais geral: a mesma informação pode ser coletada como numérica ou como categórica. A decisão é do pesquisador — e essa decisão tem consequências diretas para a análise.

Tabela 4: A mesma realidade, dois tipos de dado — a decisão é metodológica, não da natureza.

Variável	Como numérica	Como categórica	O que se perde na categorização
Idade	47 anos	Adulto (30–59 anos)	Magnitude exata
Peso	82,3 kg	Sobrepeso (IMC 25–29,9)	Magnitude exata
Pressão arterial	138 mmHg	Hipertenso estágio 1	Magnitude exata
Glicemia	112 mg/dL	Pré-diabético	Magnitude exata
Dor	Escala visual analógica: 7,2 cm	Dor moderada	Precisão contínua
Escolaridade	16 anos de estudo	Ensino superior completo	Magnitude exata

A passagem de numérico para categórico é sempre possível — basta definir pontos de corte. Mas o caminho inverso é impossível: uma vez que registramos “hipertenso estágio 1”, não podemos recuperar se a pressão era 140, 152 ou 159 mmHg. A categorização é uma via de mão única, e Altman e Royston demonstram que dicotomizar uma variável contínua pela mediana reduz o poder estatístico tanto quanto descartar um terço dos dados (6).

Figura 2: O IMC tem duas vidas: como variável contínua (histograma) e como categórica ordinal (barras).

O caso do IMC é paradigmático. O valor bruto (27,4 kg/m²) é uma variável contínua de razão — permite média, desvio-padrão e todas as operações aritméticas. Mas na prática clínica, é quase sempre apresentado em categorias da OMS (baixo peso, normal, sobrepeso, obesidade), tornando-se uma variável ordinal. A mesma informação, dois tipos de dado — e a escolha depende do objetivo: a versão contínua é mais poderosa estatisticamente; a categórica é mais comunicável clinicamente.

A regra de ouro

Sempre que possível, colete e armazene os dados na forma mais detalhada (numérica). Categorizar depois é fácil; recuperar a precisão perdida é impossível. Registre a pressão como 142 mmHg, não como “hipertenso” — você sempre pode criar a categoria depois, mas nunca poderá desfazer a perda (6,7).

Outros casos especiais

A escala de Likert não é o único caso em que a classificação de uma variável desafia as categorias simples. Outros exemplos frequentes em pesquisa em saúde:

Escolaridade: ordinal ou numérica?

A escolaridade pode ser registrada como anos de estudo (variável numérica discreta: 0, 1, 2, …, 20) ou como nível de escolaridade (variável categórica ordinal: fundamental, médio, superior). No IBGE, a classificação oficial é ordinal — mas muitos estudos epidemiológicos usam “anos de estudo” como proxy numérica, permitindo regressão linear em vez de modelos ordinais.

Escala visual analógica de dor (EVA)

O paciente marca um ponto numa linha de 10 cm. O valor lido — 4,7 cm — é contínuo. Mas quando transformamos em categorias (0 = sem dor, 1–3 = leve, 4–6 = moderada, 7–10 = intensa), a variável se torna ordinal. Mesmo o valor bruto levanta questões: a distância entre 2 e 4 é a mesma experiência de dor que entre 6 e 8? A escala pode ser contínua na régua sem ser intervalar na experiência.

Variáveis cíclicas

Algumas variáveis numéricas não obedecem à lógica linear. O horário (0h a 24h) é numérico, mas a diferença entre 23h e 1h não é 22 horas — é 2 horas. O mês de nascimento (1 a 12) é numérico, mas dezembro e janeiro são adjacentes, não distantes. Variáveis cíclicas exigem métodos específicos (estatística circular) e são frequentemente tratadas de forma inadequada quando jogadas numa regressão linear convencional (8).

Variáveis truncadas e censuradas

Na pesquisa em saúde, variáveis numéricas frequentemente têm limites de detecção. Um exame de carga viral que reporta “< 20 cópias/mL” não informa o valor exato — apenas que está abaixo do limite de detecção. Esses dados censurados não podem ser tratados como zero nem como o valor do limite; exigem métodos estatísticos específicos (como a regressão de Tobit ou métodos de sobrevida) que levem em conta a informação parcial.

Tabela 5: Exemplos

Variável	Versão numérica	Versão categórica	Desafio
IMC	27,4 kg/m²	Sobrepeso (OMS)	Perda de poder ao categorizar
Escolaridade	14 anos de estudo	Ensino médio completo	Proxy numérica comum mas imprecisa
Dor (EVA)	4,7 cm	Dor moderada	Contínua na régua, ordinal na experiência?
Horário do evento	23:15	Período noturno	Variável cíclica — diferenças lineares falham
Carga viral	> 20 cópias/mL	Indetectável vs. detectável	Censura à esquerda — valor exato desconhecido
Likert (item)	4 (concordo)	Concordo	Ordinal, mas tratada como numérica por muitos
Likert (escala)	38 pontos (soma de 10 itens)	Alta satisfação	Composta — comporta-se como intervalar

A lição dos casos especiais

Os exemplos deste capítulo convergem para uma mesma lição: a classificação de uma variável não é uma propriedade intrínseca do fenômeno — é o resultado de decisões sobre como medir, registrar e analisar. A idade é contínua por natureza, mas pode ser coletada como discreta (anos inteiros) ou categórica (faixa etária). O IMC é contínuo, mas a prática clínica o transforma em ordinal. A escala de Likert muda de natureza dependendo de como é agregada — um item é ordinal, uma escala composta se comporta como contínua.

Essa fluidez não é um defeito do sistema de classificação de Stevens — é uma característica da realidade. As escalas de medida são modelos, não leis da natureza (8,9). O pesquisador deve escolher o modelo que melhor serve ao objetivo da análise, documentar essa escolha e estar preparado para justificá-la.

Documente suas decisões

Em qualquer artigo ou relatório, explicite: (1) como a variável foi medida originalmente, (2) se e como foi categorizada, e (3) por que essa classificação foi escolhida. Essa transparência permite que revisores e leitores avaliem se a análise é coerente com a natureza dos dados — e é exatamente o que diretrizes como o STROBE recomendam (10).

Resumo do capítulo

Tabela 6: Resumo — casos especiais na classificação de variáveis.

Conceito	Definição	Recomendação prática
A mesma variável, dois tipos	O pesquisador decide se coleta/analisa como numérica ou categórica	Colete na forma mais detalhada possível; categorize depois se necessário
Item Likert	Afirmação isolada com resposta de 1 a 5 (ou 7) — ordinal	Reporte frequências por nível e mediana
Escala Likert (composta)	Soma ou média de múltiplos itens — comporta-se como contínua	Média ± DP e testes paramétricos são adequados
Debate Likert (resolvido)	Item = ordinal (consenso); escala composta = testes paramétricos são robustos	Seja transparente: reporte frequências E mediana, mesmo que use média
IMC: dupla identidade	Contínuo (kg/m²) na coleta; ordinal (OMS) na prática clínica	Mantenha contínuo para análise; categorize para comunicação clínica
Variáveis cíclicas	Valores numéricos sem linearidade (horário, mês) — exigem estatística circular	Não use média aritmética; considere estatística circular
Dados censurados	Valor exato desconhecido (< limite de detecção) — exigem métodos especiais	Não substitua por zero nem pelo limite; use métodos de censura

Próximos passos

Este capítulo explorou os casos em que a classificação de variáveis desafia as categorias simples. No próximo capítulo vamos aprender a organizá-los — como estruturar planilhas para que os dados possam ser analisados de forma eficiente e reproduzível.

Referências

Likert R. A Technique for the Measurement of Attitudes. Archives of Psychology. 1932;22(140):5–55.

Jamieson S. Likert Scales: How to (Ab)Use Them. Medical Education. 2004;38(12):1217–8.

Norman G. Likert Scales, Levels of Measurement and the «Laws» of Statistics. Advances in Health Sciences Education. 2010;15(5):625–32.

Carifio J, Perla R. Resolving the 50-Year Debate around Using and Misusing Likert Scales. Medical Education. 2008;42(12):1150–2.

Sullivan GM, Artino Jr. AR. Analyzing and Interpreting Data from Likert-type Scales. Journal of Graduate Medical Education. 2013;5(4):541–2.

Altman DG, Royston P. The Cost of Dichotomising Continuous Variables. BMJ (Clinical research ed). 2006;332(7549):1080.

Agresti A. Statistical Methods for the Social Sciences. 5.ª ed. Boston: Pearson; 2018.

Hand DJ. Measurement Theory and Practice: The World through Quantification. London: Arnold Publishers; 2004.

Velleman PF, Wilkinson L. Nominal, Ordinal, Interval, and Ratio Typologies Are Misleading. The American Statistician. 1993;47(1):65–72.

10.

Vandenbroucke JP, von Elm E, Altman DG, Gøtzsche PC, Mulrow CD, Pocock SJ, et al. Strengthening the Reporting of Observational Studies in Epidemiology (STROBE): Explanation and Elaboration. Annals of Internal Medicine. 2007;147(8):W-163-W-194.