Как спарсить все абзацы в текстовом блоке (скриншот прикрепляю)?

Поддержка
  • Здравствуйте!
    Вчера весь вечер просидел в попытках решить эту проблему... но все безрезультатно, уже если честно вообще немного расстроился даже... Не знаю, может у кого-то есть идеи, как это решить...
    Хотел спарсить текст на сайте с описанием компаний. Но там проблема - у каждой компании большой текст, где-то 5 абзацев, где-то 10, а то и больше...
    Но BAS не видит весь этот блок описание... можно выбрать только какой-то один абзац...
    Примеры страниц, про которые я говорю и скриншот:
    https://joblab.by/e/80535/
    https://joblab.by/e/31527/

    Т.е. я хотел извлечь вот этот текст:
    ФОТО 001.png

    Но при попытке его извлечь в BAS у меня примерно следующее (можно выбрать только 1 абзац). Т.е. синим отметил, что я бы хотел спарсить, а красным - это то что получается выбрать в BAS:
    фото 002.png

  • сохранить страничку и xpath запросом получить весь текст с тэгом пи. Можно воспользоваться джптэ, если не хочешь разбираться.

  • @brotok

    Там же простой тег p. Составил xpath и получил все абзацы.

  • @sergerdn Подскажите, я неправильно делаю? Может другое действие надо выбирать?
    Вот сейчас сделал так как на скриншоте...
    2023-12-05_201105.png
    а в файл записалась все равно только 1 строчка (хотя BAS выделяет 9 элементов), может знаете как сделать чтобы сразу все 9 шт. добавлялись? похоже я что-то не так делаю(((
    вот результат этого действия сейчас:
    Прямой работодатель   ·   domitochka.by   ·   На сайте с 2023 года

  • @brotok said in Как спарсить все абзацы в текстовом блоке (скриншот прикрепляю)?:

    может знаете как сделать чтобы сразу все 9 шт. добавлялись?

    В цикле их получай и дописывай в конце файла.

    Capture.PNG

  • Ну у этих параграфов же есть родитель?
    Почему бы не взять текст из родителя?

  • Посмотрел верстку страницы: https://joblab.by/e/80535/ - сделано, конечно, через Ж немножечко )))
    В родителе, присутствуют и заголовок, и тех информация...
    Тогда есть другой вариант:

    1. Считаем число подходящих P на странице, через соответствующий пункт в контекстном меню
    2. Через массив FOR перебираем каждый параграф, выдергивая содержание, обращаясь к нему напрямую, через >AT>[[CYCLE_INDEX]]
    3. Записываем это в список, если нужен каждый отдельный параграф, либо сразу плюсуем к строковой переменной.