Пытаюсь написать парсер текстов с сайтов(сайты всегда разные)... с помощью get запроса получаю тело страниц(html)... далее нужно как-то почистить его от html кода и получить чистый текст желательно с алтами и титлами элементов... помогите как это сделать с регуляркой или через xpach?
@mansory333 Игра с морокой с перекрытием стандартного модуля, как по мне, в данном случае не стоит свеч. Тут надо-то всего лишь распарсить json и вытащить нужное свойство