Nessa segunda parte, vamos falar sobre agregação, merging e filtros! É uma parte muito importante da análise de dados. Eu irei utilizar um exemplo de um dataset que eu estou utilizando para aprender ciência de dados, então pode ser que algumas coisas não façam muito sentido porque você, caro leitor, não viu o que eu fiz antes. Mas o importante é que você entenda o que está acontecendo, pois você poderá usar esses passos para suas futuras análises. Vamos lá! Vamos criar um dataframe que conterá a média das avaliações a depender do ID do filme. Para tal, utilizaremos o dataframe ratings e agruparemos pelo ID do filme. Utilizaremos as_index como false para que os índices comecem do 0, e[…]

Quando nós vamos trabalhar com dataframes, é muito comum que a gente tenha mais de um arquivos ou mais de um frame de dados. Portanto, é um hábito dos analistas de dados de fazer um merge do dados em um só lugar, unindo vários frames de dados. No exemplo de hoje, utilizaremos dois frames de dados: O primeiro método que utilizaremos é pd.concat([left, right]). Caso nós utilizemos o método concat(), nós colocaremos o frame right embaixo do frame left. Se uma coluna não existir em um dos frames, NaN preencherá as céulas sem valor, como na imagem a seguir: Podemos utilizar ainda alguns parâmetros dentro do método concat(), como: axis=1 – combine as colunas join=’inner’ – como o método inner do SQL, ele[…]

Pandas Series e DataFrames Hoje eu comecei a mexer um pouco com Pandas. Eu já havia mexido com esse pacote em outro curso, mas é sempre bom rever os conceitos e aprender alguns novos. O pacoted Pandas tem duas estruturas principais de dados Series DataFrames Series Series são matrizes de uma única dimensão, enquando DataFrames são matrizes de mais de uma dimensão, ou seja, bidimensionais, tridimensionais, etc. Uma Serie tem dados e índices. Primeiramente passamos os dados e depois os índices:

Suponhamos que você queira ver os índices disponíveis; Simplesmente utilize o seguinte:

Agora digamos que você deseja localizar o valor de um ou mais de seus índices:

Você pode também selecionar os índices que você quiser pelo[…]