PyTorch fournit des librairies puissantes pour faire du deep learning avec Python.
Pour des exercices pratiques, on peut utiliser des datasets déjà pré-définis.
Néanmoins, il arrive que l’on veuille définir son propre dataset à utiliser avec PyTorch, notamment lorsque l’on travaille avec des données que l’on a collectées soi-même.
Il faut alors voir comment définir son propre dataset PyTorch, de sorte à exploiter le plein potentiel de cette librairie, notamment avec les dataloaders.
🚩 Problème :
Comment définir un dataset pour PyTorch?
✅ Solution :
Utiliser l’objet Dataset de torch.utils.data.
Vous devez définir une classe avec trois méthodes:
- __init__ pour initialiser votre dataset
- __len__ pour définir ce qu’est la longueur de votre dataset
- __getitem__ pour accéder aux éléments du dataset
Et votre classe doit hériter de Dataset.
Voir l’exemple ci-dessous pour avoir la structure générique.
🤠 Exemple :

Laisser un commentaire