Estatística BásicaMédio· 9 min de leitura

Correlação: Descobrindo Relações Entre Variáveis

Sorvete e afogamentos têm correlação positiva. Correlação mede a força de relações lineares, mas cuidado — ela nunca prova causa e efeito.

Renato Freitas

Atualizado em 5 de maio de 2026

O que é correlação?

Correlação é uma medida estatística que descreve a direção e a força da relação linear entre duas variáveis numéricas. Se quando uma variável aumenta a outra tende a aumentar também, temos correlação positiva. Se quando uma aumenta a outra tende a diminuir, temos correlação negativa. Se não há padrão aparente, a correlação é próxima de zero.

O diagrama de dispersão (ou gráfico de pontos) é a primeira ferramenta para visualizar correlação. Cada observação é um ponto no gráfico, com uma variável no eixo X e outra no Y. Uma nuvem de pontos inclinada para cima sugere correlação positiva; inclinada para baixo, negativa; sem direção clara, correlação fraca ou nula.

🧮 Teste você mesmo — CalcSim

Quer mais recursos? Baixar app CalcSim IA

O coeficiente de correlação de Pearson

O coeficiente r de Pearson quantifica a correlação em um número entre −1 e +1. Valores próximos de +1 indicam correlação positiva forte (os pontos quase formam uma linha crescente). Valores próximos de −1 indicam correlação negativa forte. Valores próximos de 0 indicam correlação fraca ou inexistente.

Como regra prática, |r| entre 0,7 e 1,0 é considerado forte; entre 0,5 e 0,7, moderado; entre 0,3 e 0,5, fraco; abaixo de 0,3, muito fraco ou negligenciável. Mas esses limites dependem do campo de estudo — em ciências sociais, r = 0,5 pode ser considerado forte; em ciências exatas, pode ser fraco.

O r de Pearson mede apenas correlação linear. Duas variáveis podem ter relação curvilínea forte (como consumo de remédio e eficácia — muito pouco é ineficaz, a dose certa é eficaz, demais é tóxico) e ainda assim ter r ≈ 0. Sempre visualize os dados antes de interpretar o coeficiente.

r = +1: correlação positiva perfeita
r = −1: correlação negativa perfeita
r = 0: sem correlação linear
|r| ≥ 0,7: correlação forte (regra geral)

Correlação não é causalidade

Este é um dos princípios mais importantes — e mais violados — em estatística e jornalismo. A venda de sorvetes e o número de afogamentos têm correlação positiva forte. Isso não significa que comer sorvete cause afogamentos: ambas são causadas por uma terceira variável (temperatura alta no verão).

Esse tipo de correlação enganosa, gerada por uma variável oculta, é chamada de correlação espúria. Dois fenômenos podem ser correlacionados porque um causa o outro, porque ambos são causados por um terceiro fator, ou simplesmente por coincidência em uma amostra pequena.

Para estabelecer causalidade, precisamos de experimentos controlados (grupos de tratamento e controle com randomização), não apenas de observação. Estudos observacionais, mesmo com r alto, podem apenas levantar hipóteses — a comprovação de causa exige design experimental rigoroso.

Perguntas frequentes

Correlação negativa é 'ruim'?

Não. Correlação negativa simplesmente indica que as variáveis variam em direções opostas. Exercício e gordura corporal têm correlação negativa — o que é desejável. Preço e demanda também. A correlação descreve um padrão; o julgamento de 'bom' ou 'ruim' depende do contexto.

Qual a diferença entre correlação de Pearson e de Spearman?

Pearson mede correlação linear entre variáveis numéricas contínuas. Spearman mede correlação entre os postos (rankings) dos valores, sendo mais robusto quando há outliers ou quando a relação não é estritamente linear. Spearman também funciona com variáveis ordinais.

Se r = 0,9, as variáveis estão sempre próximas de uma reta?

Quase sempre, mas não sempre. O r² (coeficiente de determinação) indica a proporção da variância de Y que é explicada por X. Com r = 0,9, r² = 0,81, ou seja, 81% da variação de Y é explicada pela variação de X. Os 19% restantes são variação não explicada pela relação linear.

Como sei se uma correlação é estatisticamente significante?

Realizando um teste de hipótese para o coeficiente de correlação. O resultado depende tanto do valor de r quanto do tamanho da amostra. Uma correlação de r = 0,3 pode ser significante com n = 200 e não significante com n = 20. O p-valor indica se o resultado é maior do que o esperado por acaso.

Este artigo foi útil para você?

Avalie com estrelas para nos ajudar a melhorar o conteúdo.

Faça login para avaliar este artigo.

Ainda tem dúvida?

O Professor IA explica passo a passo

Faça uma pergunta em linguagem natural e receba uma explicação personalizada sobre Estatística Básica — ou qualquer outro tópico.

Prefere resolver pelo celular?

Baixar o app grátis →

Continue aprendendo

Ver todos os artigos de Estatística Básica