@Mic Из твоей же логики исходя, можно предположить, что завтра к релизу они добавят слово .finel и куда ты пойдешь со своей регуляркой ?
Верная регулярка
-
@Revers Для таких как ты, сделали специальный сайт для создания регулярок (https://bablosoft.github.io/RegexpConstructor)
Вот твоя измененная регулярка"([\s\S]+\.(?:com|fr|eu|it|ga|gq|ml|cf|net|es|ru|la|de|co|in|ir|nl|su|pro))" -
-
@Fox said in Верная регулярка:
@Revers А смысл изменять то, что и так работает?
Берутся не только нужные домены, но и те, которые граббить нельзя:
"randomdomen.us" "randomdomen.org" "randomdomen.me" "randomdomen.fun" "randomdomen.red" "randomdomen.top" -
@Revers said in Верная регулярка:
@Fox said in Верная регулярка:
@Revers А смысл изменять то, что и так работает?
Берутся не только нужные домены, но и те, которые граббить нельзя:
"randomdomen.us" "randomdomen.org" "randomdomen.me" "randomdomen.fun" "randomdomen.red" "randomdomen.top"Тогда оформите нормально вопрос, какой текст есть изначально, какие сайты с какими доменами нужно спарсить, а какие ни в коем случае нельзя
-
@Revers Можно вообще без регулярки
[[DOMAINS_ALLOW]] = { ru: 1, com: 1, kz: 1, } [[DOMAIN]] = 'site.com' if ([[DOMAINS_ALLOW]][ [[DOMAIN]].split('.').pop() ] ){ log([[DOMAIN]] + ' домен разрешен') } else { log([[DOMAIN]] + ' домен не разрешен') } [[DOMAIN]] = 'site.biz' if ([[DOMAINS_ALLOW]][ [[DOMAIN]].split('.').pop() ] ){ log([[DOMAIN]] + ' домен разрешен') } else { log([[DOMAIN]] + ' домен не разрешен') } -
@UserTrue said in Верная регулярка:
@Revers Можно вообще без регулярки
[[DOMAINS_ALLOW]] = { ru: 1, com: 1, kz: 1, } [[DOMAIN]] = 'site.com' if ([[DOMAINS_ALLOW]][ [[DOMAIN]].split('.').pop() ] ){ log([[DOMAIN]] + ' домен разрешен') } else { log([[DOMAIN]] + ' домен не разрешен') } [[DOMAIN]] = 'site.biz' if ([[DOMAINS_ALLOW]][ [[DOMAIN]].split('.').pop() ] ){ log([[DOMAIN]] + ' домен разрешен') } else { log([[DOMAIN]] + ' домен не разрешен') }Можно и без объекта, создать массив разрешённых доменов и сравнивать через тот же indexOf(). Я думаю топикастер использует именно регулярки, потому что он парсит ссылки из исходного, большого текста и задача состоит именно в том, что бы спарсить ссылки только с необходимыми доменами
-
@UserTrue said in Верная регулярка:
@Fox объект быстрей работает просто, там поиск по хэшу, а не перебором. Для сортированого массива можно бинарный поиск написать, но из коробки такого нет.
Сомневаюсь, что в массиве будет достаточно данных доменов, что бы была заметна разница
:D
