Символы и точки в регулярке



  • Забуксовал на ровном месте :( Нужно вытащить из сохраненной страницы через регулярку все строки такого вида:
    /moskva/zemelnye_uchastki/uchastok_9.6_sot._snt_dnp_809255362

    Перепробовал кучу регулярок, не работает ни одна, тут даже скорее проблема в символах и точках, не пойму как их прописать в регулярке.
    Делал примерно так [[SAVED_CONTENT]].match(/<a href=[a-z0-9_-/.]{1,150}" class="item-link"></a>/g)
    Подскажите в чем ошибка?



  • @gaget007
    Вышла новая версия - 15, в ней появилось действие "Извлечь данные". Оно как раз и применяет регулярное выражение к строке.

    Например, чтобы извлечь все ссылки, достаточно выполнить регулярку href="([^"]+)

    0_1471041380927_RegexpGetRefs.png

    Результатом будет список

    0_1471041529138_LinkList.png

    , который можно обработать этим модулем:

    0_1471041429558_ListModule.png



  • Очень удобно, благодарю, всё получилось =)


Log in to reply
 

  • 11
  • 1
  • 10
  • 19
  • 15
  • 6
  • 8
  • 3