Bien qu’elles ressemblent parfois à des chaînes de caractères, les expressions régulières sont des objets différents, en Python, qui ont leur propre comportement.
Entre autres, les caractères spéciaux, nécessitant un traitement spécial pour être utilisés en tant que caractères, ne sont pas les mêmes entre les objets de type str et les expressions régulières.
C’est le cas, par exemple, des crochets [ et ], lesquels servent à définir des ensembles de caractères avec ReGex, tandis qu’ils sont des caractères normaux pour les chaînes.
🚩 Problème :
Comment échapper les crochets ([ et ]), dans les expressions régulières en Python ?
✅ Solution :
Il suffit de précéder ces caractères par un backslash. Ainsi, on écrira, dans l’expression régulière, \[ et \], pour écrire les crochets en tant que caractères simples.
🤠 Exemple :
Admettons que l’on veuille extraire d’un texte les portions qui contiennent du texte entre crochets.
On s’intéressera alors au motif débutant par un crochet ouvrant, contenant ensuite n’importe quelle chaîne de caractères, et terminant finalement par un crochet fermant.
Un tel motif s’écrira, en expression régulière :
\[.*\]
\[and\]: ce sont les crochets, échappés afin de les considérer en tant que caractères..*: ce motif matche n’importe quelle suite de caractères à l’intérieur des crochets.

Laisser un commentaire