Тестер регулярных выражений
Тестирование регулярных выражений с подсветкой совпадений
Напиши регулярное выражение, вставь тестовую строку и увидишь совпадения прямо в тексте — без единой строки кода. Захваченные группы отображаются в таблице ниже. Удобно при создании экстракторов для HTML: убедись, что шаблон захватывает именно то, что нужно.
Как использовать
- 1Напиши паттерн — Введи регулярное выражение в поле Pattern. Без слэшей — просто паттерн.
- 2Выбери флаги — g — найти все совпадения, i — без учёта регистра, m — многострочный режим (^ и $ работают для каждой строки).
- 3Вставь тестовый текст — Скопируй фрагмент HTML, текст страницы или API-ответ.
- 4Изучи совпадения — В авторежиме совпадения подсвечиваются сразу при вводе паттерна. Если авторежим отключён — нажми Run. Группы захвата отображаются в отдельной таблице ниже.
Примеры
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}\$?\d{1,3}(?:[,.]\d{3})*(?:[.,]\d{2})?href="(https?://[^"]+)"\b(\d{2})\.(\d{2})\.(\d{4})\b<span class="count">(\d+)</span>Когда использовать
Регулярные выражения в парсинге используются на этапе постобработки: CSS-селекторы или XPath извлекают нужный элемент, а regex — конкретное значение из его текста. Например, элемент содержит «Цена: 1 299 ₽» — regex извлекает число. Также regex применяется когда HTML плохо структурирован: нет удобных классов или атрибутов, контент «зашит» в текст. В Python — модуль re, в JavaScript — нативные RegExp, в Scrapy — метод re() сразу после xpath() или css(). Тестируй паттерны здесь на реальных фрагментах страниц, прежде чем встраивать в код. Один неверный символ в группе захвата — и парсер молча вернёт пустые строки вместо данных.