Un tutorial pentru începători la expresiile regulate

Expresiile regulate, adesea abreviate ca regex sau regexp, sunt secvențe de caractere care definesc un model de căutare. Ele sunt utilizate în mod obișnuit pentru potrivirea șirurilor, înlocuirea subșirurilor și extragerea informațiilor din text.

De ce să înveți expresiile regulate?

Învățarea expresiilor regulate vă poate îmbunătăți considerabil capacitatea de a gestiona datele text. Cu regex, puteți:

  • Căutați modele specifice în text.
  • Validați datele introduse, cum ar fi adresele de e-mail și numerele de telefon.
  • Extrageți anumite părți ale unui text, cum ar fi datele și adresele URL.
  • Înlocuiți subșiruri în text pe baza modelelor.

Componentele de bază ale expresiilor regulate

Regex este compus din caractere literale și metacaractere. Iată câteva dintre componentele de bază:

  • Caractere literale: Personaje care se potrivesc. De exemplu, a se potrivește cu "a".
  • Metacaractere: Caractere speciale cu semnificații specifice, cum ar fi ., *, + și ?.

Metacaracterele comune și semnificațiile lor

Înțelegerea metacaracterelor este cheia pentru stăpânirea expresiilor regex. Iată câteva dintre cele mai frecvent utilizate:

  • . - Se potrivește cu orice caracter, cu excepția linie nouă.
  • * - Se potrivește cu 0 sau mai multe repetări ale elementului precedent.
  • + - Se potrivește cu 1 sau mai multe repetări ale elementului precedent.
  • ? - Se potrivește cu 0 sau 1 repetare a elementului precedent.
  • [] - Se potrivește cu oricare dintre caracterele dintre paranteze.
  • {} - Specifică un număr specific de apariții ale elementului precedent.
  • () - Grupează mai multe jetoane împreună și creează grupuri de captură.
  • | - Acționează ca un operator SAU.

Modele de regex de bază cu exemple

Să ne uităm la câteva modele regex de bază și la modul în care funcționează:

cat

Se potrivește cu șirul exact "cat".

.at

Se potrivește cu orice șir care conține un singur caracter urmat de "at", cum ar fi "cat", "bat", "hat".

\d{3}

Se potrivește exact trei cifre, cum ar fi "123", "456", "789".

[a-z]

Se potrivește cu orice literă mică de la "a" la "z".

(dog|cat)

Se potrivește fie "dog", fie "cat".

Utilizarea Regex în limbaje de programare

Expresiile regulate sunt acceptate pe scară largă în diferite limbaje de programare. Iată exemple de utilizare regex în Python și JavaScript:

Exemplu Python

import re

# Search for 'dog' in a string
pattern = r'dog'
text = 'The dog barked loudly.'
match = re.search(pattern, text)

if match:
    print('Match found:', match.group())
else:
    print('No match found')

Exemplu JavaScript

// Search for 'dog' in a string
const pattern = /dog/;
const text = 'The dog barked loudly.';
const match = text.match(pattern);

if (match) {
    console.log('Match found:', match[0]);
} else {
    console.log('No match found');
}

Concluzie

Expresiile regulate sunt un instrument puternic pentru oricine se ocupă de procesarea textului. Înțelegând și exersând componentele și modelele de bază, vă puteți îmbunătăți semnificativ capacitatea de a manipula și manipula textul în proiectele dvs. de programare. Experimentați cu diferite modele și aprofundați-vă cunoștințele pentru a debloca întreg potențialul regex.