Regulární výrazy
Z Milan Kerslager
Regulární výrazy slouží pro obecný popis textových řetězců. Rozdělují se na regulární výrazy podle normy POSIX a podle jazyka Perl. Využívají se při zpracování textů (hledání, nahrazování), kontrole vstupu (rodné číslo, URL, e-mailová adresa, ...). Jejich podporu nalezneme přímo v některých programovacích jazycích (Perl, Python), používají je unixové nástroje (příkaz grep
), jsou k dispozici v podobě knihoven atd.
Přehled
Seznam základních a rozšířených POSIXových regulárních výrazů:
Základní Rozšířený Význam .
Jakýkoliv 1 znak (i žádný znak) [abc]
Jeden z uvedených znaků [^abc]
Žádný z uvedených znaků [c..e]
Jeden z rozsahu uvedených znaků (zde c, d nebo e) ^
Začátek řádku (řetězce) $
Konec řádku (řetězce) \( \)
( )
Skupina znaků (zapamatovatelná) *
Libovolné opakování předchozího znaku (skupiny), i žádné (0 krát) \n
Zapamatovaná skupina číslo n \{m,n\}
{m,n}
Opakování předchozího znaku (skupiny) m až n krát ?
Žádný nebo jednonásobný výskyt předchozího znaku (skupiny) +
Jedno- nebo vícenásobné opakování předchozího znaku (skupiny) |
Vyznačení variant (logická spojka nebo)
Externí odkazy
- http://www.root.cz/clanky/regularni-vyrazy-1/ – série 5 dílů