Correlação: Descobrindo Relações Entre Variáveis
Sorvete e afogamentos têm correlação positiva. Correlação mede a força de relações lineares, mas cuidado — ela nunca prova causa e efeito.
Renato Freitas
Atualizado em 5 de maio de 2026
O que é correlação?
Correlação é uma medida estatística que descreve a direção e a força da relação linear entre duas variáveis numéricas. Se quando uma variável aumenta a outra tende a aumentar também, temos correlação positiva. Se quando uma aumenta a outra tende a diminuir, temos correlação negativa. Se não há padrão aparente, a correlação é próxima de zero.
O diagrama de dispersão (ou gráfico de pontos) é a primeira ferramenta para visualizar correlação. Cada observação é um ponto no gráfico, com uma variável no eixo X e outra no Y. Uma nuvem de pontos inclinada para cima sugere correlação positiva; inclinada para baixo, negativa; sem direção clara, correlação fraca ou nula.
🧮 Teste você mesmo — CalcSim
Quer mais recursos? Baixar app CalcSim IA
O coeficiente de correlação de Pearson
O coeficiente r de Pearson quantifica a correlação em um número entre −1 e +1. Valores próximos de +1 indicam correlação positiva forte (os pontos quase formam uma linha crescente). Valores próximos de −1 indicam correlação negativa forte. Valores próximos de 0 indicam correlação fraca ou inexistente.
Como regra prática, |r| entre 0,7 e 1,0 é considerado forte; entre 0,5 e 0,7, moderado; entre 0,3 e 0,5, fraco; abaixo de 0,3, muito fraco ou negligenciável. Mas esses limites dependem do campo de estudo — em ciências sociais, r = 0,5 pode ser considerado forte; em ciências exatas, pode ser fraco.
O r de Pearson mede apenas correlação linear. Duas variáveis podem ter relação curvilínea forte (como consumo de remédio e eficácia — muito pouco é ineficaz, a dose certa é eficaz, demais é tóxico) e ainda assim ter r ≈ 0. Sempre visualize os dados antes de interpretar o coeficiente.
- r = +1: correlação positiva perfeita
- r = −1: correlação negativa perfeita
- r = 0: sem correlação linear
- |r| ≥ 0,7: correlação forte (regra geral)
Correlação não é causalidade
Este é um dos princípios mais importantes — e mais violados — em estatística e jornalismo. A venda de sorvetes e o número de afogamentos têm correlação positiva forte. Isso não significa que comer sorvete cause afogamentos: ambas são causadas por uma terceira variável (temperatura alta no verão).
Esse tipo de correlação enganosa, gerada por uma variável oculta, é chamada de correlação espúria. Dois fenômenos podem ser correlacionados porque um causa o outro, porque ambos são causados por um terceiro fator, ou simplesmente por coincidência em uma amostra pequena.
Para estabelecer causalidade, precisamos de experimentos controlados (grupos de tratamento e controle com randomização), não apenas de observação. Estudos observacionais, mesmo com r alto, podem apenas levantar hipóteses — a comprovação de causa exige design experimental rigoroso.
Perguntas frequentes
Correlação negativa é 'ruim'?
Não. Correlação negativa simplesmente indica que as variáveis variam em direções opostas. Exercício e gordura corporal têm correlação negativa — o que é desejável. Preço e demanda também. A correlação descreve um padrão; o julgamento de 'bom' ou 'ruim' depende do contexto.
Qual a diferença entre correlação de Pearson e de Spearman?
Pearson mede correlação linear entre variáveis numéricas contínuas. Spearman mede correlação entre os postos (rankings) dos valores, sendo mais robusto quando há outliers ou quando a relação não é estritamente linear. Spearman também funciona com variáveis ordinais.
Se r = 0,9, as variáveis estão sempre próximas de uma reta?
Quase sempre, mas não sempre. O r² (coeficiente de determinação) indica a proporção da variância de Y que é explicada por X. Com r = 0,9, r² = 0,81, ou seja, 81% da variação de Y é explicada pela variação de X. Os 19% restantes são variação não explicada pela relação linear.
Como sei se uma correlação é estatisticamente significante?
Realizando um teste de hipótese para o coeficiente de correlação. O resultado depende tanto do valor de r quanto do tamanho da amostra. Uma correlação de r = 0,3 pode ser significante com n = 200 e não significante com n = 20. O p-valor indica se o resultado é maior do que o esperado por acaso.
Este artigo foi útil para você?
Avalie com estrelas para nos ajudar a melhorar o conteúdo.
Faça login para avaliar este artigo.
Ainda tem dúvida?
O Professor IA explica passo a passo
Faça uma pergunta em linguagem natural e receba uma explicação personalizada sobre Estatística Básica — ou qualquer outro tópico.
Prefere resolver pelo celular?
Baixar o app grátis →Continue aprendendo