Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
Есть ли простой способ получить из html кода страницы его текстовую версию? Просто текст, md разметка или другие варианты - всё подошло бы.
document.body.outerText
так пойдёт?
Не совсем, так как будет много мусора (навигация, сайдбары и т.д.), но спасибо.
Решил эту задачу подключением Node.js и библиотеки html-to-text.
Проблема вроде решилась обновлением BAS
@UserTrue Ойййй, я забыл что там есть, спасибо большое) В след раз сначала туда
@Fox Большое спасибо, сработало!
@brotok said in Как сделать парьсинг то ли html, то ли текстовой страницы (фрагмента)?:
XPATH> //center[contains(text(),'Раздел IV')]/following::table/tbody/tr[4]/td[10] Спасибо! я так понимаю надо просто цифру менять и все, чтобы другие ячейки вылавливать?
XPATH> //center[contains(text(),'Раздел IV')]/following::table/tbody/tr[4]/td[10]
Спасибо! я так понимаю надо просто цифру менять и все, чтобы другие ячейки вылавливать?
Да, если таблицы на других страницах схожие. В ином случае, придется изменять немного xpath