Регулярное выражение

Поддержка
  • @xxAsa_Renxx said in Регулярное выражение:

    А на втором варианте в обоих случаях False

    Приложите текст, не скрины не видео, а текст

  • @GhostZ Так в том то и проблема с самого начала была. Что в обоих есть вариант site.com. Но из двух должно выбрать только один. То бишь если [URL] = "site.com", [SAVE_TEXT] = "Отзывы·www.site.com.ua/отзывы о сайтах | Отзывник сайтов" - тогда должно быть значение "False"

    Если : [URL] = "site.com.ua", [SAVE_TEXT] = "Отзывы·www.site.com.ua/отзывы о сайтах | Отзывник сайтов" - тогда должно быть значение "True"

  • @xxAsa_Renxx, я же самого начала писал
    @GhostZ said in Регулярное выражение:

    @xxAsa_Renxx, приложите содержимое переменных SAVE_TEXT и URL

    А вы прикладываете какие то примеры которые вообще не соответствуют тому к чему вы пытаетесь применить

  • @xxAsa_Renxx,

    [[SAVE_TEXT]].indexOf([[URL1]]) > -1 && [[SAVE_TEXT]].indexOf([[URL2]]) < 0
    

    URL1 - ссылка нужного сайта
    URL2 - ссылка не нужного сайта

  • @GhostZ Проблема в том что [url2] нет возможности указать, так как там кучу сайтов и всех их указывать..., есть возможность указать только урл1 и savetext.
    Извините если я плохо изъясняю свои мысли

  • @GhostZ То есть, [URL1] - это входные данные, [SAVE_TEXT] - это строка которая парситься.
    Мб где то есть уроки по регулярным выражениям, что бы вам не надоедать

  • @xxAsa_Renxx, ну тогда просто попробуйте это [[SAVE_TEXT]].indexOf([[URL]] + "/") > -1

  • @GhostZ said in Регулярное выражение:

    [[SAVE_TEXT]].indexOf([[URL]] + "/") > -1

    Дааа))) это именно то решение что нужно))) Я могу вас как-то финансово отблагодарить?

  • @xxAsa_Renxx, если только нажать на 090749b7-38d2-43fb-a96d-ee889b385ae8-image.png

  • Просьба помочь с регуляркой.
    Имеется такая строка:

    class="mg-card__link" data-log-id="u-1661857122000-707e77-25">Поздравляю всех с 1 сентября! Отличная новость, скоро Новый год!</a>

    class="mg-card__link" data-log-id="u-1661857122000-707e77-25">[[Нужно получить этот текст]]</a>

    На странице таких строк несколько, нужно собрать через "Извлечь все данные"
    Я пробовал такую регулярку class="mg-card__link" data-log-id=".*">([\s\S]+?)</a> но она только одно последнее выражение берет

  • @dor said in Регулярное выражение:

    Просьба помочь с регуляркой.
    Имеется такая строка:

    class="mg-card__link" data-log-id="u-1661857122000-707e77-25">Поздравляю всех с 1 сентября! Отличная новость, скоро Новый год!</a>

    class="mg-card__link" data-log-id="u-1661857122000-707e77-25">[[Нужно получить этот текст]]</a>

    На странице таких строк несколько, нужно собрать через "Извлечь все данные"
    Я пробовал такую регулярку class="mg-card__link" data-log-id=".*">([\s\S]+?)</a> но она только одно последнее выражение берет

    Действие "Xpath получить каждый текст"

    //*[@class="mg-card__link"][@data-log-id="u-1661857122000-707e77-25"]
    
  • @Fox Эта часть, ID сообщения
    u-1661857122000-707e77-25
    меняется у каждого сообщения на странице

  • //[@class="mg-card__link"][@data-log-id=""] Так не сработало, звездочку в конце в кавычках у меня тут на форуме не отображает

  • @dor said in Регулярное выражение:

    @Fox Эта часть, ID сообщения
    u-1661857122000-707e77-25
    меняется у каждого сообщения на странице

    Я отталкивался от того кода, который вы приложили

  • @Fox Сорян! Я не точно сформулировал, что этот ID меняется у каждого сообщения

  • @dor said in Регулярное выражение:

    @Fox Сорян! Я не точно сформулировал, что этот ID меняется у каждого сообщения

    Приложите html код страницы, так будет быстрее

  • target="_self" rel="noopener" class="mg-card__link" data-log-id="u-1661933524000-3f0f7d-21">«Ъ»: в&nbsp;России появятся ноутбуки и компьютеры от&nbsp;китайских Machenike и Thunderobot</a></h2><div class="mg-card__annotation">На российском рынке появятся новые марки компьютеров и игровых ноутбуков, пишет «Коммерсантъ».</div>
    
  • target="_self" rel="noopener" class="mg-card__link" data-log-id="u-1661933524000-3f0f7d-25">В&nbsp;Энергодаре сообщили об ударе американского беспилотника по&nbsp;зданию администрации</a></h2><div class="mg-card__annotation">Американский беспилотник ударил по зданию администрации Энергодара - глава ВГА Балицкий.</div></div></div>
    target="_self" rel="noopener" class="mg-card__link" data-log-id="u-1661933524000-3f0f7d-29">В&nbsp;Эстонии 28 компаний попросили разрешить им импорт нефти из&nbsp;России</a></h2><div class="mg-card__annotation" style="-webkit-line-clamp: 2;">«Сегодня МИД публикует названия 28 компаний, которые попросили об исключении, чтобы продолжить импорт российских нефтепродуктов в переходный период даже после введения санкций», — сказал Рейнсалу.</div></div></div>
    target="_self" rel="noopener" class="mg-card__link" data-log-id="u-1661933524000-3f0f7d-33">Канцлер ФРГ Шольц назвал санкции в&nbsp;отношении России эффективными и правильными</a></h2><div class="mg-card__annotation">Канцлер Германии Олаф Шольц в интервью Magdeburger Volksstimme назвал санкции западных государств в отношении России эффективными и правильными.</div></div></div>
    
    
  • @dor

    //a[@class="mg-card__link"][@data-log-id]