@WASD1244 Меняйте версии в ссылке пока не найдете нужную
Как сделать парьсинг то ли html, то ли текстовой страницы (фрагмента)?
-
Здравствуйте!
Пытаюсь написать парсер госзакупок российских - что то не особо получается если честно...Хотелось бы извлечь только нужные данные - например, номер тлефона, организации и т.д. (пометил на скриншоте красной полосой).
Но если это невозможно (а так оно наверно и есть) - то как хотя бы весь этот блок (раздел IV) - извлечь из общей страницы чтобы не качать всю страницу целиком... Это возможно вообще?![0_1566939034249_GkzFBTY[1].png](https://i.imgur.com/J0Hk77U.png)
http://zakupki.gov.ru/epz/contract/printForm/view.html?contractInfoId=48799835
-
@brotok все возможно. Главное составить правильный xpath

По типу такого, будет доставать всю таблицу, идущую за заголовком "Раздел IV"
>XPATH> //center[contains(text(),'Раздел IV')]/following::table[1]Аналогичная тема - https://community.bablosoft.com/topic/6786/комбинированное-селектирование-элементов-match-и-css
-
@brotok said in Как сделать парьсинг то ли html, то ли текстовой страницы (фрагмента)?:
XPATH> //center[contains(text(),'Раздел IV')]/following::table/tbody/tr[4]/td[10]
Спасибо! я так понимаю надо просто цифру менять и все, чтобы другие ячейки вылавливать?
Да, если таблицы на других страницах схожие. В ином случае, придется изменять немного xpath