Поиск строк с определенным количеством точек в Notepad++
05 May 2024 | Автор: dd |Понадобилось отфильтровать список доменов, убрав из него домены третьего уровня, т.к чекалка whois их не пробивает, да и днсы если не настроены, то и таким образом нельзя проверить на занятость, так что надо либо перепроверять руками, т.к панели регистраторов это умеют, либо в промышленных масштабах, когда списки из тысяч доменов – откинуть.
Проще всего оказалось проверить через регулярное выражение в notepad++ по поиску текстовых сегментов с точками разделителями. Выполнить такой поиск можно как с произвольным количеством точек, так и любых других символов, слегка видоизменив приведенное выражение.
Выражение выглядит как: (.+?[.]){2}
то есть ищется выражение состоящие из любых символов .+ и включающее точку на конце [.] и эта проверка выполняется дважды
Причем поиск производим через вкладку поиска пометки, с последующим удалением помеченных строк.
Хотя если не жалко времени, можно задать поиск и пробежаться глазами по списку, чтобы оставить какие то домены третьего уровня являющихся регистрируемыми, проде .msk.ru .spb.ru .co.uk и т.д – такой поиск, с визуальным выделением, все равно пройдет легче, чем ломать глаза об белый список.
Либо же можно отобрать все вариации вхождений рушных доменов третьего уровня: как публичных вроде .msk.ru .spb.ru .com.ru .narod.ru так и частных, гдде третий уровень создается непосредственным владельцем домена .site.ru
Получается чуть более сложная конструкция: (.+?[.]).*.ru