Ajouter une Colonne à une Dataframe

Les données tabulaires sont une forme de données très répandue.

Elles sont organisées selon des colonnes et des lignes.

Et, bien souvent, il arrive que l’on veuille rajouter une colonne au tableau, ou à la dataframe (si l’on reprend le langage de pandas), qui nous intéresse.

Si cette tâche est triviale sur le papier, il n’est pas évident de deviner comment ajouter une colonne à une dataframe tant que l’on ne l’a jamais codé.

🚩 Problème :

Comment ajouter une colonne à une dataframe?

Solution :

Affecter une valeur à un nouveau de nom de colonne.

De manière générique, faire df["colonne"] = valeurs.

🤠 Exemple :

Imaginez que vous ayez une dataframe df qui contient deux colonnes Nom et Prenom, et qui contient un certain nombre de lignes, disons 100. Chaque ligne correspond à un individu dont le nom et le prénom sont donnés par les colonnes Nom et Prenom.

Maintenant, vous avez également la liste des 100 dates de naissance de ces 100 individus. Et vous aimeriez rajouter une colonne Naissance à df qui contiendrait justement ces dates de naissance.

Pour faire ça, en admettant que la liste de ces dates de naissance soit contenue dans une variable liste_naissances, vous ferez :

df["Naissance"] = liste_naissances

Le bloc ci-dessous vous indique comment procéder de manière plus générique :

df[COLUMN_NAME] = values
# où COLUMN_NAME est le nom de la colonne à rajouter
# et values sont les valeurs à affecter.
# values peut être un numpy array par exemple.

Laisser un commentaire