Como criar gráfico de dispersão no Python

Gráfico de dispersão

Um gráfico de dispersão é uma forma de visualizar a relação entre duas variáveis. Ele representa cada ponto de dados em um plano. Isso permite verificar a existência de uma relação entre as variáveis e se há uma correlação positiva, negativa ou nenhuma entre elas.

 

No exemplo acima temos um exemplo de um gráfico de dispersão onde é possível notar que quando a variável do eixo x (eixo horizontal) aumenta, a variável y (eixo vertical) também aumenta.

Como criar um gráfico de dispersão no Python

Existem várias maneiras de criar um gráfico de dispersão no Python. Uma delas é através da função scatter da biblioteca matplotlib.

Veja o código abaixo:

No primeiro bloco de código, foi onde eu importei as bibliotecas que seriam usadas. O Numpy não é necessário para criar o gráfico, foi usado apenas para criarmos valores aleatórios para usarmos no nosso gráfico.

 

O que é importante mesmo é a linha import matplotlib.pyplt as plt é aí que está função scatter que é usado para gerar o gráfico de dispersão.

 

As linhas variável1 e variável2 são apenas valores aleatórios que serão utilizados nos código. 

 

Agora para criar nosso gráfico basta chamar a função scatter usando o código plt.scatter(x,y) onde X é a variável do eixo x e Y é a variável do eixo y.

Nesse caso, coloquei a variável1 no eixo x e a variável2 no eixo y

 

E assim temos nosso gráfico de dispersão que consegue dar a gente uma melhor visualização da relação entre duas variáveis. 

 

Vamos a um outro exemplo?

 

Tenho uma base de dados no Python que possui informações sobre o valor e metros quadrados de imóveis de uma determinada região do Rio de Janeiro. A base é mostrada abaixo.

 

Como poderíamos fazer uma análise da relação que existem entre o valor da casa e o metro quadrado? Uma boa saída pra isso é fazer a análise através do gráfico de dispersão.

Então é só a gente colocar em prática o que aprendemos agorinha. Você lembra? Vamos usar a função Scatter.

Nosso código ficaria assim:

 

Lembrando sempre que o 1° argumento é o eixo X e o 2° argumento o eixo Y, mas podemos indicar isso no nosso gráfico. Vamos fazer isso?

 

Para isso nós precisamos de 2 funções, a xlabel (que vai colocar uma legenda no eixo X) e a ylabel (que vai colocar legenda no eixo Y).

 

Ficou mais legal, né? É possível fazer mudanças na cor, no formato e em outras coisas que forem do seu interesse. Você pode descobrir todas as personalizações da biblioteca acessando a documentação, que é bem organizadinha e de fácil compreensão 🙂

Vamos voltar a nossa análise agora?

Claramente existe uma relação entre o valor da casa e o metro quadrado. Quanto maior a casa, mais cara ela fica. Pode parecer meio óbvia essa relação, mas em outros casos nem sempre é tão intuitiva assim a relação. Por isso o gráfico de dispersão é tão importante.

É assim que você cria seu gráfico de dispersão!

Conclusão

Agora você está pronto para criar suas visualizações no Python de maneira bem simples.

Há outras ferramentas que vão potencializar seu conhecimento, e todas elas você pode aprender com a gente.

Compartilhe nas mídias:

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
Categorias

Conheça a Motim Academy

Tenha acesso a cursos gratuitos e se destaque no mercado sem gastar nada

Os artigos
mais lidos: