Catégorie : Dataframes
-
Charger un CSV sans Header avec Pandas
Charger des données via Pandas, en Python, pour les stocker dans une dataframe, préalablement à leur traitement, est une tâche récurrente en analyse de données. Très souvent, les données sont stockées dans des fichiers csv pour compresser l’information. Lorsque l’on ouvre un csv dans un éditeur de texte, on peut alors voir des lignes de…
-
Filtrer les Valeurs d’une Colonne d’une Dataframe qui ne Contiennent pas un Mot
Dans Excel, la possibilité de filtrer les colonnes est un atout très avantageux lorsqu’il s’agit de sélectionner uniquement les lignes répondant à un critère donné. Avec Python et les dataframes que l’on manipule avec Pandas, il arrive que l’on veuille également filtrer les valeurs d’une colonne. Par exemple, si une colonne contient des chaînes de…
-
Supprimer une colonne constante dans une dataframe avec Pandas
Voici une solution pour supprimer facilement une colonne d’une dataframe pandas dont toutes les valeurs sont les mêmes.
-
Convertir une dataframe en numpy array
Problème : Comment convertir une dataframe pandas en numpy array ? Solution : Utiliser la méthode to_numpy. Exemple : Si df est une dataframe, alors x sera un numpy array avec les valeurs de df.
-
Garder seulement les lignes uniques d’une dataframe avec Pandas
Problème : Comment supprimer les lignes en doublon dans une dataframe Pandas pour garder seulement les lignes uniques ? Solution : Utiliser la méthode drop_duplicates : Exemple : Faisons un exemple trivial pour voir l’effet de drop_duplicates. Dans un premier temps on définit une dataframe juste pour l’exemple, avec une ligne en double. Appliquons la…
-
Compter les Occurrences d’une Valeur dans la Colonne d’une Dataframe
Il arrive que l’on veuille compter les occurrences des différentes valeurs d’une colonne dans une dataframe. Alors, il faut trouver une astuce pour faire les comptes. Par chance, pandas fournit une fonction qui répond à cette demande. Problème : Comment compter le nombre d’occurrences d’une valeur dans une dataframe? Solution : Utiliser la méthode value_counts…
-
Changer l’Index d’une Dataframe
Problème : Comment changer l’index d’une dataframe en Python? Solution : Utiliser la méthode set_index des dataframes de Pandas. Exemple :
-
Obtenir la Liste des Colonnes d’une Dataframe
Problème : Comment obtenir la liste des colonnes d’une dataframe? Solution : Utiliser les attributs columns puis values, et convertir en liste. Exemple :
-
Itérer sur les Colonnes d’une Dataframe en Python
Problème : Comment itérer sur les colonnes d’une dataframe en Python? Solution : Itérer directement sur la dataframe. Exemple : column va balayer les colonnes de la dataframe, dans l’ordre.
-
Supprimer des Colonnes d’une Dataframe en Python
Quand il vous arrive d’avoir trop de colonnes dans un tableau ou que certains attributs sont superflus, supprimer ces colonnes devient une étape nécessaire du pré-traitement de données. Problème : Comment supprimer des colonnes d’une dataframe en Python? Solution : Utiliser la méthode drop des dataframes créées avec Pandas. Exemple :
