@kuzkuz Сайты разные и капча капче рознь.
Лично я, если капча статическая, собираю все с сайта и хеширую их в md5, записывая все в текстовик. Именно этим текстовиком и пользуюсь.
Кстати, скриншоты капч приходится делать очень редко. Лично мне такой сайт с капчей попадался единожды. Когда я на него наткнулся, не знал способов решения, но теперь уверен, что можно обойтись и на нём без скриншотов.
как спарсить текст?
-
есть ссылка https://site.com/storage/2020/s/sobaki-s-milymi-strannostyami/9.jpg .
перед ней стоят анг буквы и символы, потом перед ними стоит текст на русском. как взять этот текст?пример
небо голубое<$*gcdrswqzx https://site.com/storage/2020/s/sobaki-s-milymi-strannostyami/9.jpg -
@wladeeck said in как спарсить текст?:
есть ссылка https://site.com/storage/2020/s/sobaki-s-milymi-strannostyami/9.jpg .
перед ней стоят анг буквы и символы, потом перед ними стоит текст на русском. как взять этот текст?Используйте регулярку. Составить можно в конструкторе https://bablosoft.github.io/RegexpConstructor/
-
@wladeeck said in как спарсить текст?:
@Fox я так делаю, выходит такая регулярка
([а-яА-Я0-9]+)[\s\S][a-zA-Z0-9]+[\s\S]+https://site.com/storage/2020/s/sobaki-s-milymi-strannostyami/9.jpg
но не работаетПопробуйте
(https?:\/\/[\w\/?.&-=]+) -
@wladeeck said in как спарсить текст?:
@Fox said in как спарсить текст?:
(https?://[\w/?.&-=]+)
спасибо, только мне нужна не ссылка, а русский текст «небо голубое»
Для ссылок давно уже есть готовые регулярки, потому что есть чёткие правила их написания. А вот какой текст вам нужен, что его окружает, что меняется, что всегда остаётся неизменным, я без понятия. Так же если вы получаете этот текст со страницы, посмотрите код, может для необходимого текста можно составить конкретный селектор
-
-
@wladeeck said in как спарсить текст?:
@Fox понятно, значит сам буду мучить.
это так не работает. Я помогаю всем в своё свободное время