Одно дополнение.
Пару раз встречал случай когда такой вариант не срабатывал (текст не кликался), но можно было кликнуть элемент который его содержал.
Приходилось через селектор брать родительский элемент этого текста (или как-то так, точно уже не помню).
Как узнать, что на сайте загрузились базовые элементы и CSS?
-
Прокси могут подлагивать и при выполнении действия Загрузить есть возможность выставлять "Ждать полной загрузки" и "Максимальное время ожидания".
Но бывает так, что сайт внешне полностью загрузился, а какие-нибудь баннеры/тяжелые элементы/flash/фреймы/скрипты нет, из-за чего действие завершается ошибкой "Таймаут во время выполнения LoadPage", хотя бот мог продолжать работу.
Как можно было бы обойти эту проблему? Если обернуть в "Игнорировать ошибки", то в случаях не загрузки сайта (белый экран) бот будет продолжать работу, что неверно.
Можно ли, допустим, завернуть действие загрузки в игнорирование ошибки и в случае ошибки получать данные о том, насколько страница прогрузилась? Например, прогрузились ли все css файлы или какой-нибудь DOMContentLoaded? Как можно хитро было бы понять, что сайт достаточно загрузился без белого экрана, чтобы продолжить работу? -
@agility said in Как узнать, что на сайте загрузились базовые элементы и CSS?:
@prakash Если страница неизвестная и не знаешь про тексты, есть идеи как обойти?
Ну что-то же должно быть общее на этих страницах, форма входа например или еще что-то. Вы же не просто с потолка рандомные сайты загружаете?
-
@fastspace Супер!!! Тоже сделал подобную проверку... Пять раз, с перерывом в пять секунд на одном и том же прокси пытается загрузиться страница ya. ru. Если нет, то текущий прокси под удаление и поток заново начинается соответственно с другим прокси, если страница загрузилась и нужный элемент найден - сразу продолжаем выполнение скрипта с хорошим прокси.