@zerqsell
судя по всему, сам интерфейс туть
229e2f46-414f-4df3-a726-7859e97b8d19-image.png
я не смог придумать, как подлезть чтоб выдернуть
b6b99f96-09dd-4366-82b4-6cffb00ec11b-image.png
87278daf-25be-439f-bb8b-710167aca1a9-image.png
поэтому, самый просто вариант - модифицировать модуль, добавив туда ресурсы или переменные. работа с ресурсами
https://github.com/bablosoft/BAS/blob/955f5a41bd004bcdd7d19725df6ab229b911c09f/Engine/scripts/engine/worker/properties.js#L6
например, добавить после получения ответа на капчу ресурс
a858d9ba-9a00-45c2-a530-c98b8151a0fd-image.png
а потом считать его, когда нужен результат
b30d985f-79bf-4e7f-bce0-8cd7f78718ee-image.png
Как написать парсер (получить текст), чтобы не захватывал цитату (делаю парсер форума)?
-
Здравствуйте, уважаемые эксперты!
Сегодня промучился - ничего не получается.
Хочу написать парсер форума b17.ru
Вот пример поста:
https://www.b17.ru/forum/topic.php?id=130689&p=5#topic_top
Там идет сначала цитата в большинстве случаев а потом ам текст, вот скриншот:
https://i.imgur.com/gINUrXY.png
Я хочу чтобы извлекалось все кроме цитаты... Как это сделать? Уже намучился серьезно со всем этим..(
Или это на данном форуме невозможно реализовать с помощью bas? Какой селектор выбрать, чтобы извлечь только текст (без цитат?)...
Надеюсь на вашу помощь, т.к. понял что у меня не хватает мозгов для подобной реализации...( -
@brotok said in Как написать парсер (получить текст), чтобы не захватывал цитату (делаю парсер форума)?:
Здравствуйте, уважаемые эксперты!
Сегодня промучился - ничего не получается.
Хочу написать парсер форума b17.ru
Вот пример поста:
https://www.b17.ru/forum/topic.php?id=130689&p=5#topic_top
Там идет сначала цитата в большинстве случаев а потом ам текст, вот скриншот:
https://i.imgur.com/gINUrXY.png
Я хочу чтобы извлекалось все кроме цитаты... Как это сделать? Уже намучился серьезно со всем этим..(
Или это на данном форуме невозможно реализовать с помощью bas? Какой селектор выбрать, чтобы извлечь только текст (без цитат?)...
Надеюсь на вашу помощь, т.к. понял что у меня не хватает мозгов для подобной реализации...(Самое первое, что пришло в голову - это удалить из кода все цитаты
:DДействие "заменить строку", регулярное выражение:
<div class=quote[\s\S]*?<\/div>а из полученной переменной через xpath достать каждый текст:
//td[@class="mes qq"]Вот тестовый скрипт