Как получить чистый текст со страницы сайта

arxat

Пытаюсь написать парсер текстов с сайтов(сайты всегда разные)... с помощью get запроса получаю тело страниц(html)... далее нужно как-то почистить его от html кода и получить чистый текст желательно с алтами и титлами элементов... помогите как это сделать с регуляркой или через xpach?

support

@arxat Действие Xpath получить текст c параметром //body

arxat

спасибо :)

Bablosoft

Как получить чистый текст со страницы сайта

Как вставить текст из файла содержащий пустые строки или перенос строки

Вставить текст полученный текст.

Как добавить к каждому элементу списка шаблонный текст?

Как скопировать текст вместе с картинками из поля контента сайта?

Как сделать скриншот страницы после скрола?