Фигурные скобки в регулярных выражениях Python
Операторы '+', '*', '?'
хороши, однако, с их помощью нельзя указать
конкретное число повторений. В этом случае
вам на помощь придет оператор {}.
Работает он следующим образом: {5}
- пять повторений, {2,5} – повторяется
от двух до пяти (оба включительно), {2,}
- повторяется два и более раз.
Посмотрите примеры:
Пример
В данном примере шаблон поиска выглядит так:
буква 'x', буква 'a' один
или два раза, буква 'x':
txt = 'xx xax xaax xaaax'
res = re.sub('xa{1,2}x', '!', txt)
print(res)
Результат выполнения кода:
'xx ! ! xaaax'
Пример
В данном примере шаблон поиска выглядит так:
буква 'x', буква 'a' два
раза и более, буква 'x':
txt = 'xx xax xaax xaaax'
res = re.sub('xa{2,}x', '!', txt)
print(res)
Результат выполнения кода:
'xx xax ! !'
Пример
В данном примере шаблон поиска выглядит так:
буква 'x', буква 'a' три
раза, буква 'x':
txt = 'xx xax xaax xaaax'
res = re.sub('xa{3}x', '!', txt)
print(res)
Результат выполнения кода:
'xx xax xaax !'
Пример
В данном примере шаблон поиска выглядит так:
буква 'a' десять раз:
txt = 'aaa aaaaaaaaaa aaa'
res = re.sub('a{10}', '!', txt)
print(res)
Результат выполнения кода:
'aaa ! aaa'
Пример
В данном примере есть такой шаблон:
буква 'x', буква 'a' три
раза раза и меньше, буква 'x'.
Для того, чтобы его реализовать, перед цифрой 3
можно не указывать число, а поставить
просто запятую:
txt = 'xx xax xaax xaaax'
res = re.sub('xa{,3}x', '!', txt)
print(res)
Результат выполнения кода:
'! ! ! !'
Пример
Ноль перед 3 тоже допустим:
txt = 'xx xax xaax xaaax'
res = re.sub('xa{0,3}x', '!', txt)
print(res)
Результат выполнения кода:
'! ! ! !'
Практические задачи
Дана строка:
txt = 'aa aba abba abbba abbbba abbbbba'
Напишите регулярку, которая найдет строки
'abba', 'abbba', 'abbbba'
и только их.
Дана строка:
txt = 'aa aba abba abbba abbbba abbbbba'
Напишите регулярку, которая найдет строки
вида 'aba', в которых 'b' встречается
менее 3-х раз (включительно).
Дана строка:
txt = 'aa aba abba abbba abbbba abbbbba'
Напишите регулярку, которая найдет строки
вида 'aba', в которых 'b' встречается
более 4-х раз (включительно).