Le guide du débutant sur les expressions régulières

Ghidul începătorilor pentru expresii regulate
⏱️ 5 min read

Avez-vous déjà essayé de trouver un motif récurrent dans un morceau de texte ? Vous avez peut-être utilisé quelque chose comme la fonction de recherche de votre navigateur ou de votre traitement de texte, mais lorsque vous avez besoin de trouver quelque chose de plus complexe, cela peut être comme trouver une aiguille dans la botte de foin proverbiale.

Heureusement, il existe un moyen de choisir des motifs précis dans le texte jusqu’au personnage. C’est ce qu’on appelle des expressions régulières (RegEx), et cela vous permet de devenir un maître de la recherche dans le texte.

Énergie de Noël 🤶 Glaçon ou c...
Énergie de Noël 🤶 Glaçon ou cours d'eau limpide ? Que choisis-tu ?

Où puis-je utiliser RegEx ?

Bien qu’Unix et Linux les aient rendus populaires, les expressions régulières sont disponibles dans une variété de packages, y compris Microsoft Word.

Les expressions régulières sont notamment utilisées dans plusieurs programmes Linux notables, notamment grep, Awk et Sed.

Par exemple, vous voudrez peut-être vérifier les périphériques USB sur votre PC. En utilisant lspci, vous verrez une liste de tous les appareils et vous devrez localiser les entrées USB par vous-même. Vous pouvez utiliser à la place ce qui suit pour afficher uniquement les périphériques USB :

C’est l’exemple le plus simple de RegEx en action. C’est la manière la plus populaire d’utiliser des expressions régulières dans le terminal, mais pas la seule. Aujourd’hui, vous pouvez trouver le support RegEx dans de nombreux types de logiciels différents, des éditeurs de texte aux gestionnaires de fichiers.

Trouver des modèles

Vous avez probablement utilisé le * caractère, qui agit comme un caractère générique lors de la sélection de fichiers ou de dossiers dans le terminal. Par exemple, pour lister tous les fichiers JPG d’un dossier, vous pouvez utiliser :

L’équivalent RegEx de ce qui précède serait :

Introduction au filtre Regex Jpgs

Pour rechercher à la fois des fichiers jpg et png, utilisez :

Gammes

Si vous souhaitez rechercher une plage de caractères spécifique au lieu d’un modèle, vous pouvez le faire en le définissant entre parenthèses. Si, par exemple, vous utilisez [a-z] comme modèle, cela correspondrait à n’importe quelle chaîne composée de lettres minuscules de l’alphabet.

Comme vous l’avez peut-être deviné, [A-Z] sélectionnerait uniquement les lettres majuscules. Pour choisir n’importe quelle plage de lettres, à la fois en majuscules et en minuscules, l’expression deviendrait [a-zA-Z].

Pour localiser un nombre spécifique d’instances de votre modèle, vous pouvez l’indiquer entre accolades. {5} renverrait cinq occurrences de votre modèle. Vous pouvez également utiliser des plages de nombres, donc {5,10} vous présenterait cinq à dix instances.

Méta-caractères

Dans les expressions régulières, vous pouvez également rechercher des parties d’une chaîne avec deux caractères appelés métacaractères. Ils sont similaires aux correspondances génériques que vous avez peut-être utilisées dans le shell.

Le principal est le point simple, qui représente tout autre caractère unique. Si vous avez utilisé le modèle c.ll, il correspondrait à « cell » mais également à « cull » et « call ».

En saisissant un astérisque après un point, vous pouvez l’utiliser pour faire correspondre un nombre infini de caractères. Par exemple, .*board sera un match à la fois pour “clavier” et “planche à roulettes”. même si « key » et « skate » ont un nombre de lettres différent.

Échapper

Vous avez peut-être remarqué que dans notre exemple, où nous avons sélectionné différents types de fichiers image, nous avons utilisé des barres obliques inverses avant le point (“.jpg”). C’est ainsi que vous échappez aux caractères spéciaux dans RegEx.

Si nous ne les utilisions pas, notre modèle ne correspondrait pas uniquement aux extensions des fichiers, des chaînes telles que “.jpg” et “.png”, mais correspondrait également à “ajpg” et “opng”. Rappelles toi, . est un caractère générique qui correspond à n’importe quel caractère.

Ancres et limites

Les ancrages et les frontières vous permettent de définir plus précisément ce que vous recherchez.

Pour ne trouver que le mot individuel « ordinateur », sans aucun autre caractère attaché avant ou après, vous devez définir le modèle comme <computer>.

Vous pouvez également rechercher spécifiquement des motifs qui apparaissent au début ou à la fin de la ligne. Ceci est réalisé avec le ^ et $ caractères respectivement.

Donc, si vous vouliez trouver uniquement les entrées où le mot “ordinateur” est apparu au début d’une ligne, votre modèle ressemblerait à ^computer. Au contraire, lorsqu’il est à la fin de la ligne, le motif changerait en computer$.

Ce sont les règles simples de RegEx, que vous pouvez également mélanger pour trouver précisément les modèles que vous recherchez. Vous pouvez rechercher des plages de caractères au début d’une ligne ou des mots alternés à la fin, des dates spécifiques ou une plage d’années, en utilisant une seule chaîne de texte.

N’oubliez pas de consulter notre aide-mémoire sur les expressions régulières pour maîtriser les expressions régulières.

Join our Newsletter and receive offers and updates! ✅

0 0 votes
Article Rating
Avatar of Routech

Routech

Routech is a website that provides technology news, reviews and tips. It covers a wide range of topics including smartphones, laptops, tablets, gaming, gadgets, software, internet and more. The website is updated daily with new articles and videos, and also has a forum where users can discuss technology-related topics.

Vous aimerez aussi...

S’abonner
Notification pour
guest
0 Comments
Commentaires en ligne
Afficher tous les commentaires
0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x