В Конструкторе регулярок, регулярки начали строится по другому и не работают



  • Подскажите пожалуйста, как сейчас правильно строить регулярки, так как их строю в конструкторе, а в самой программе они не работают.
    Для примера - мне нужно со страницы собрать все анкоры. Делаю гет запрос, получаю сохраненную страницу в переменную saved_content. Использую функцию извлечь все данные в меню регулярных выражений....и использую построеную регулярку в конструкторе <a[\s\S]+>([\s\S]+)</a> хотя раньше регулярка была другой....вот и не собирает данные эта регулярка. Чем лучше пользоваться и какая должна быть регулярка. Спасибо



  • @seedgg Первое что бросилось в глаза, это закрывающий тег без экранирования. Попробуйте так:

    <a[\s\S]+([\s\S]+)<\/a>
    


  • Большое спасибо за помощь, но всеравно не работает. Мне так кажется, что что-то поменялось...так как раньше все регулярки с конструктора работали, а сейчас нет



  • @seedgg Раньше в конструкторе создавались регулярки ориентированные на работу с данными без переноса строки. Но на форуме много кто жаловался, что они у них не работают. Вот и @support немного переделал конструктор.
    Напишите здесь в таком формате:
    ```
    Часть кода страницы
    ```
    И отдельно что из этого кода необходимо достать.





  • сработала только такая регуляка <a[^>]*>([^<]+)</a>



  • @seedgg Судя по регулярке, вам нужно было содержимое тега <a>..</a>, с этой задачей лучше справится Xpath.


Log in to reply
 

  • 15
  • 4
  • 9
  • 9
  • 3
  • 2
  • 17
  • 9