Для начала ты попробуй хотя бы хоть что-то собрать с этого ресурса в промышленных масштабах.
Я собирал достаточно давно данные оттуда, еще до фичи с подменой номеров, уже тогда это был не особо простой процесс.
Подскажите идею как собирать с разных сайтов текст со страницы?
Все сайты разные. Но открывается url и на открывшейся странице статья (длинный текст).
Всё что объединяет эти сайты, это то что на открывающихся URL-лах помимо баннеров и ссылок - находится длинный текст, который мне и нужен.
Вот думаю, может как то по коду страницы, или ещё как-то этот длинный текст нужно сохранять.
я бы сделал просто сначала Установить разрешение браузера, например 600х1200, типа как у планшета, или же электронной книги.
Затем тыкнул прмрено в точку, где всегда на каждом таком сайте будет текст, скорей всего это будет по середине страницы где-то ближе к низу, вычислил бы эту координату, затем просто Правой кнопкой "Получитьь текст", и скорее всего будет сохранена вся статья.
Затем переходим к следующему сайту.