$ – конец строки

| – альтернатива (или)

()  – группировка

[]  – класс символов

Метасимволы имеют модификаторы (пишутся после метасимвола):

 – повторяется 0 или большее число раз

 – повторяется 1 или большее число раз

 – 1 или 0 раз

{n} – точно n раз

{n,} – по меньшей мере раз

{n,m} – не менше n, но и не больше m

Во все других случаях фигурные скобки считаются обычными (регулярными) символами. Таким образом '*' эквивалентна {0,} , '+' – {1,} и '?' – {0,1}. n и m не могут быть больше 65536.

По умолчанию действие метасимволов «жадно» (greedy). Совпадение распространяется столько раз сколько возможно не учитывая результат действия следуюющих метасимволов. Если вы хотите «уменьшить их аппетит» то используйте символ '?'. Это не изменяет значение метасимволов просто уменьшает распространение. Таким образом:

*? – станет 0 и более

+?  – 1 и более

?? – 0 или 1 раз

{n}? – точно n раз

{n,}? – не меньше n раз

{n,m}? – больше или равно n и меньше m раз

Шаблоны работают так же как и двойные кавычки поэтому в них можно использовать `` – символы (бакслэш-символы):

 – символ табуляции

   – новая строка

 – перевод каретки

A – перевол формата

v – вертикальная табуляция

a – звонок

e – escape

33 – восьмеричная запись символа

x1A – шестнадцатеричная

c[ – control символ

l – нижний регистр следующего символа

 u – верхний регистр -//-

 L – все символы в нижнем регистре до E

 U – в верхнем -//-

E – ограничитель смены регистра

Q – отмена действия как метасимвола

Дополнительно в Перл добавлены следующие метасимволы:

w – алфавитно-цифровой или '_' символ

W – не алфавитно-цифровой или '_' символ

s – один пробел

 S – один не пробел

d – одна цифра

D – одна не цифра

Обратите внимание что все это «один» символ. Для обозначения последовательности применяйте модификаторы. Так:

w+ – слово

d+ – целое число

[+-]?d+ – целое со знаком

[+-]?d+.?d* – число с точкой

Кроме того существуют мнимые метасимволы. Обозначающие не существующие символы в месте смены значения. Такие как:

 – граница слова

B – не граница слова

A – начало строки

 – конец строки

G – конец действия m//g

Граница слова () – это мнимая точка между символами w и W.

Внутри класса символов '' обозначает символ backspace (стирания).

Метасимволы A и  – аналогичны '^' и '$' но если началостроки '^' и конец строки '$' действуют для каждой строки в многосторочной строке то A и  обозначают начало и конец всей многосторчной строки.

Если внутри шаблона применяется группировка (круглые скобки) то номер подстроки группы обозначается как 'цифра'.

Заметьте что за шаблоном в пределах выражения или блока эти группы обозначаются как '$цифра'. Кроме этого существуют дополнительные переменные:

$+  – обозначает последнее совпадение

$& – все совпадение

$` – все до совпадения

$' – все после совпадения

Пример:

$s = «Один 1 два 2 и три 3»;

if ($s =~ /(d+)D+(d+)/)

{

print «$1 »; # Результат '1'

print «$2 »; # '2'

print «$+ »; # '2'

print «$& »; # '1 два 2'

print «$` »; # 'Один '

print «$' »; # ' и три 3'

}

Перл версии 5 содержит дополнительные конструкции шаблонов:

(?#комментарий) – комментарий в теле шаблона.

(?:шаблон) – группировка как и '( )' но без обратной ссылки

(?=шаблон) – «заглядывание» вперед.

Например /w+(?= )/ соответствует слову за которым идет табуляция но символ ' ' не включается в результат.

Пример:

$s = «1+2-3*4»;

if ($s =~ /(d)(?=-)/) # Наити цифру за которой стоит '-'

{

print «$1 »; # Результат '2'

}

else { print «ошибка поиска »;}

Вы читаете Введение в Perl
Добавить отзыв
ВСЕ ОТЗЫВЫ О КНИГЕ В ИЗБРАННОЕ

0

Вы можете отметить интересные вам фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.

Отметить Добавить цитату