Étiquette : Dataframes
-
Charger un CSV sans Header avec Pandas
Charger des données via Pandas, en Python, pour les stocker dans une dataframe, préalablement à leur traitement, est une tâche récurrente en analyse de données. Très souvent, les données sont stockées dans des fichiers csv pour compresser l’information. Lorsque l’on ouvre un csv dans un éditeur de texte, on peut alors voir des lignes de…
-
Filtrer les Valeurs d’une Colonne d’une Dataframe qui ne Contiennent pas un Mot
Dans Excel, la possibilité de filtrer les colonnes est un atout très avantageux lorsqu’il s’agit de sélectionner uniquement les lignes répondant à un critère donné. Avec Python et les dataframes que l’on manipule avec Pandas, il arrive que l’on veuille également filtrer les valeurs d’une colonne. Par exemple, si une colonne contient des chaînes de…
-
Supprimer une colonne constante dans une dataframe avec Pandas
Voici une solution pour supprimer facilement une colonne d’une dataframe pandas dont toutes les valeurs sont les mêmes.
-
Convertir une dataframe en numpy array
Problème : Comment convertir une dataframe pandas en numpy array ? Solution : Utiliser la méthode to_numpy. Exemple : Si df est une dataframe, alors x sera un numpy array avec les valeurs de df.
-
Garder seulement les lignes uniques d’une dataframe avec Pandas
Problème : Comment supprimer les lignes en doublon dans une dataframe Pandas pour garder seulement les lignes uniques ? Solution : Utiliser la méthode drop_duplicates : Exemple : Faisons un exemple trivial pour voir l’effet de drop_duplicates. Dans un premier temps on définit une dataframe juste pour l’exemple, avec une ligne en double. Appliquons la…
-
Changer l’Index d’une Dataframe
Problème : Comment changer l’index d’une dataframe en Python? Solution : Utiliser la méthode set_index des dataframes de Pandas. Exemple :
-
Obtenir la Liste des Colonnes d’une Dataframe
Problème : Comment obtenir la liste des colonnes d’une dataframe? Solution : Utiliser les attributs columns puis values, et convertir en liste. Exemple :
-
Itérer sur les Colonnes d’une Dataframe en Python
Problème : Comment itérer sur les colonnes d’une dataframe en Python? Solution : Itérer directement sur la dataframe. Exemple : column va balayer les colonnes de la dataframe, dans l’ordre.
-
Supprimer des Colonnes d’une Dataframe en Python
Quand il vous arrive d’avoir trop de colonnes dans un tableau ou que certains attributs sont superflus, supprimer ces colonnes devient une étape nécessaire du pré-traitement de données. Problème : Comment supprimer des colonnes d’une dataframe en Python? Solution : Utiliser la méthode drop des dataframes créées avec Pandas. Exemple :
-
Ajouter une Colonne à une Dataframe
Les données tabulaires sont une forme de données très répandue. Elles sont organisées selon des colonnes et des lignes. Et, bien souvent, il arrive que l’on veuille rajouter une colonne au tableau, ou à la dataframe (si l’on reprend le langage de pandas), qui nous intéresse. Si cette tâche est triviale sur le papier, il…
