Preenchendo valores vazio no Python

Quando trabalhamos com dados, é normal encontrarmos valores vazios ou faltantes em algumas linhas. Esses valores interferem nas análise, e por isso é importante saber como lidar com eles.

 

Felizmente existe o Pandas, uma biblioteca que já usamos antes aqui no blog. O Pandas oferece várias opções para preenchermos os valores vazios em um dataframe. Nesse artigo, explicaremos como preencher valores vazios em um dataframe no Python.

 

Como preencher valores vazios em um dataframe

 

Para começar, vamos criar um dataframe fictício para exemplificar as técnicas de preenchimento:

 

Observe que temos dois valores vazios na coluna “Idade”.

 

Existem vários caminhos para você substituir esse valor vazio, então é importante você avaliar melhor o seu caso e estudar qual é o melhor pra você.

 

Preenchimento com um valor fixo

 

Podemos preencher valores vazios com um valor fixo usando o método “fillna()”. Por exemplo, para preencher os valores vazios com o número 0, podemos usar:

 

df.fillna(0)

 

Que vai retornar o seguinte dataframe:

Note que a coluna “idade” agora não tem mais valores vazios e todos foram substituídos por 0. Só que também não faz muito sentido colocar as idades como 0, né? 

 

Então vamos ver outros métodos.

 

Preenchimento com a média ou mediana

 

Uma opção comum para preencher valores vazios é usar a média ou mediana dos valores não vazios. Podemos usar o método “mean()” ou “median()” do Pandas para calcular esses valores e preencher os valores vazios com eles.

 

Por exemplo, para preencher os valores vazios na coluna “A” com a média dos valores não vazios, podemos usar:

 

df[‘idade’].fillna(df[‘idade’’].mean(), inplace=True)

 

Veja o resultado:

Consegue entender o que estamos fazendo? A gente quer preencher os valores vazios da coluna “idade” com a média das idades, né? Então o que precisamos fazer? Saber a média das idades.

 

É isso que df[‘idade’’].mean() faz, por isso estamos colocando ele dentro do nosso fillna. Estamos passando falando para os valores NaN serem preenchidos com df[‘idade’’].mean() que é a média da coluna idade. 

 

Preenchimento com base em valores adjacentes

 

Também podemos preencher valores vazios com base nos valores próximos na mesma coluna ou linha.

 

Podemos usar o método fillna() com o parâmetro method=’ffill’ para preencher os valores vazios com o valor anterior na mesma coluna.

 

Por exemplo, para preencher os valores vazios na coluna “B” com base nos valores anteriores, podemos usar:

 

df[‘cidades’’].fillna(method=’ffill’, inplace=True)

 

Assim, os valores vazios serão preenchidos exatamente com os valores anteriores da coluna.

 

Conclusão

 

O Pandas oferece várias opções para preencher valores vazios, incluindo o preenchimento com um valor fixo, a média ou mediana dos valores não vazios e com base em valores próximos. 

 

Cada técnica tem seus próprios prós e contras, e a escolha de qual técnica você vai usar vai depender do contexto e dos objetivos da sua análise. É importante você saber que essas opções existem para poder trabalhar nesses casos de  valores vazios em dataframes.

 

Gostou do conteúdo e quer saber mais sobre o Python? 

 

No nosso curso completo Master em Python você pode aprender o Python do zero até o nível Master, acima do avançado.

 

Acesse aqui e conheça.

 

Compartilhe nas mídias:

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
Categorias

Conheça a Motim Academy

Tenha acesso a cursos gratuitos e se destaque no mercado sem gastar nada

Os artigos
mais lidos: