Étiquette : Pandas
-
Charger un CSV sans Header avec Pandas
Charger des données via Pandas, en Python, pour les stocker dans une dataframe, préalablement à leur traitement, est une tâche récurrente en analyse de données. Très souvent, les données sont stockées dans des fichiers csv pour compresser l’information. Lorsque l’on ouvre un csv dans un éditeur de texte, on peut alors voir des lignes de…
-
Filtrer les Valeurs d’une Colonne d’une Dataframe qui ne Contiennent pas un Mot
Dans Excel, la possibilité de filtrer les colonnes est un atout très avantageux lorsqu’il s’agit de sélectionner uniquement les lignes répondant à un critère donné. Avec Python et les dataframes que l’on manipule avec Pandas, il arrive que l’on veuille également filtrer les valeurs d’une colonne. Par exemple, si une colonne contient des chaînes de…
-
Convertir une dataframe en numpy array
Problème : Comment convertir une dataframe pandas en numpy array ? Solution : Utiliser la méthode to_numpy. Exemple : Si df est une dataframe, alors x sera un numpy array avec les valeurs de df.
-
Faire la Jointure entre Deux Dataframes avec Pandas
Problème : Comment faire une jointure entre deux tables de données (deux dataframes) avec Pandas ? Solution : Utiliser pandas.merge avec how= »inner » Exemple : Pour faire la jointure entre deux dataframes df1 et df2, sur une colonne colonne_commune, on fera pandas.merge(left=df1, right=df2, on=colonne_commune, how= »inner »).
-
Changer l’Index d’une Dataframe
Problème : Comment changer l’index d’une dataframe en Python? Solution : Utiliser la méthode set_index des dataframes de Pandas. Exemple :
-
Obtenir la Liste des Colonnes d’une Dataframe
Problème : Comment obtenir la liste des colonnes d’une dataframe? Solution : Utiliser les attributs columns puis values, et convertir en liste. Exemple :
-
Itérer sur les Colonnes d’une Dataframe en Python
Problème : Comment itérer sur les colonnes d’une dataframe en Python? Solution : Itérer directement sur la dataframe. Exemple : column va balayer les colonnes de la dataframe, dans l’ordre.
-
Supprimer des Colonnes d’une Dataframe en Python
Quand il vous arrive d’avoir trop de colonnes dans un tableau ou que certains attributs sont superflus, supprimer ces colonnes devient une étape nécessaire du pré-traitement de données. Problème : Comment supprimer des colonnes d’une dataframe en Python? Solution : Utiliser la méthode drop des dataframes créées avec Pandas. Exemple :
-
Ajouter une Colonne à une Dataframe
Les données tabulaires sont une forme de données très répandue. Elles sont organisées selon des colonnes et des lignes. Et, bien souvent, il arrive que l’on veuille rajouter une colonne au tableau, ou à la dataframe (si l’on reprend le langage de pandas), qui nous intéresse. Si cette tâche est triviale sur le papier, il…
