Regulární výrazy: Regexp není zaklínadlo...
...a regulární výrazy nejsou magií.
Co je to regulární výraz?
Regulární výraz (regular expression; zkráceně regex či regexp) je speciální řetězec znaků, který představuje určitý vzor (chcete-li masku) pro textové řetězce.
Kdy se používá?
Regulární výrazy se proto nejčastěji používají ke kontrole dat zadávaných ve formulářích (například e-mailová adresa či PSČ) nebo „parsování” kódu (třeba HMTL, XML či CSV).
Regulární výrazy můžete v současné době najít téměř ve všech programovacích jazycích (C#, Java, Visual Basic .NET, Perl, PHP, Javascript aj.) a mnoha programech zvláště pro Unix/Linux. I základní znalost regulárních výrazů vám při programování může ušetřit mnoho řádků kódu (především různých „if-then-else” konstrukcí).
Druhy regulárních výrazů
Existují různé odnože regulárních výrazů – nejznámější dvě odnože jsou Perl-compatible regulání výrazy a POSIX regulární výrazy. Ačkoliv většina novějších programovacích jazyků používá regulární výrazy odvozené od jazyka Perl, drobné rozdíly v implementaci tu stále přetrvávají (například Javascript nepodporuje všechny Perl regular expressions konstrukce).
Mnoho užitečné práce obstarají i jednoduché regulární výrazy – pro vytváření složitějších výrazů se pak hodí programy pro tvorbu regulárních výrazů nebo on-line testery regulárních výrazů.