я бы сделал просто сначала Установить разрешение браузера, например 600х1200, типа как у планшета, или же электронной книги.
Затем тыкнул прмрено в точку, где всегда на каждом таком сайте будет текст, скорей всего это будет по середине страницы где-то ближе к низу, вычислил бы эту координату, затем просто Правой кнопкой "Получитьь текст", и скорее всего будет сохранена вся статья.
Затем переходим к следующему сайту.
как получить текст страницы
-
@oltan said in как получить текст страницы:
привет
подскажите как получить чистый текст страницы
xpath //body ругается
Получить текс >CSS>body - получает не только текст страницы а еще кучу какой то не нужной мне информацииМожешь регуляркой дернуть из кода страницы.
-
@oltan said in как получить текст страницы:
@fastspace
не я еще могу попросить алису из яндекса прочитать содержимое страницы.
а можно как то проще ?А что там сложного? 2 действия - сохранить код страницы. Второй извлечь текст регулярным выражением в переменную.
-
@uraabk
какой информации ?
я задал вопрос - как получить видимый текст со все страницы
испробывал 2 способа
xpath получить текст //body - выдает ошибку
Получить тексе >CSS>body - возвращает не только текст на странице но и кучу информации из стилей которая не отображается в данный моментя попросил совета - посоветовали регулярки но без конкретики
я не сомневаюсь что регулярками можно много что сделать но думаю это точно не проще вышеуказаных методов
да и считаю что задача должна решаться встроенными методами так как задача встречается почти во всех проектах. -