Регулярные выражения в Linux

GuDron

dumpz.ws
Admin
Регистрация
28 Янв 2020
Сообщения
10,730
Реакции
1,634
Credits
40,427
Регулярные выражения (RegEx) в Linux: Полная шпаргалка
Сохраняйте в избранное, чтобы всегда было под рукой при работе с grep, sed, awk или при написании Bash-скриптов!

Базовые символы (Matching Characters)
• . — Любой символ (кроме переноса строки)
• \w — Буквенно-цифровой символ + подчеркивание
• \W — Любой НЕ буквенно-цифровой символ
• \d — Любая цифра (0-9)
• \D — Любой символ, кроме цифры
• \s — Пробельный символ (пробел, таб, перенос)
• \S — Непробельный символ

⚓️ Якоря (Anchors)
• ^ — Начало строки
• $ — Конец строки
• \b — Граница слова
• \B — Не граница слова

Квантификаторы (Quantifiers)
• * — 0 или более вхождений
• + — 1 или более вхождений
• ? — 0 или 1 вхождение
• {n} — Ровно n вхождений
• {n,} — n или более вхождений

Жадные vs Ленивые (Greedy vs Lazy)
• * — Жадный (захватывает как можно больше символов)
• *? — Ленивый (захватывает как можно меньше символов)
• +?, ??, {n}? — Ленивые версии остальных квантификаторов

Классы символов (Character Classes)
• [abc] — Любой символ из списка: a, b или c
• [^abc] — Любой символ, КРОМЕ a, b или c
• [a-z] — Любая буква в диапазоне от a до z
• [0-9] — Любая цифра от 0 до 9

Группы и Диапазоны (Groups and Ranges)
• (abc) — Захватывающая группа (сохраняет совпадение)
• (?:abc) — Незахватывающая группа (ищет, но не сохраняет)
• | — Логическое ИЛИ (например, cat|dog)
• \1, \2, \3 — Ссылки на 1-ю, 2-ю, 3-ю захваченные группы

Флаги / Модификаторы (Flags)
• g — Глобальный (ищет все совпадения, а не только первое)
• i — Игнорировать регистр (A = a)
• m — Многострочный (^ и $ работают для каждой строки текста)
• s — Dotall (позволяет точке . совпадать с переносами строк)
• x — Extended (позволяет использовать пробелы и комментарии в самом RegEx)

Экранирование (Escaping)
• \ — Используется для экранирования спецсимволов, чтобы искать их буквально.
• Символы, которые нужно экранировать: [ \ ^ $ . | ? * + ( ) { }

Опережающие и ретроспективные проверки (Lookarounds)
• (?=abc) — Позитивный lookahead (совпадает, если дальше идет abc)
• (?!abc) — Негативный lookahead (совпадает, если дальше НЕ идет abc)
• (?<=abc) — Позитивный lookbehind (совпадает, если перед ним идет abc)

Свойства Unicode (работают с флагом u)
• \p{L} — Любая буква из любого языка
• \p{N} — Любой числовой символ
• \p{Sc} — Любой символ валюты