я бы сделал просто сначала Установить разрешение браузера, например 600х1200, типа как у планшета, или же электронной книги.
Затем тыкнул прмрено в точку, где всегда на каждом таком сайте будет текст, скорей всего это будет по середине страницы где-то ближе к низу, вычислил бы эту координату, затем просто Правой кнопкой "Получитьь текст", и скорее всего будет сохранена вся статья.
Затем переходим к следующему сайту.
Как быстро извлечь все ссылки со страницы (и возможно ли это без цикла)?
-
Здравствуйте!
Скажите, возможно ли быстро извлечь все ссылки со страницы. Их там допустим 500 штук.
Сейчас пробовал просто парсить весь код страницы и сохранять в файл - в akelpad есть функция "извлечь ссылки" - но проблема в том что файл txt в итоге получится огромным (парсер не на 1 страницу), а в итоге akelpad просто не выдержит нагрузку...Вобщем вопрос - можно ли извлечь быстро ссылки в BAS без цикла - просто все ссылки со страницы? или как это сделать максимально быстро вы бы посоветовали?
Чтобы в txt записались только url (все) без разбора... -
@brotok Работа циклов в режиме записи замедлена. В режиме запуска циклы пролетают очень быстро (если у вас внутри цикла нет действий, требующих много времени для выполнения, например, загрузка страницы, движения мыши и клики и.т.п)
-
@DoctorKrolic я это и знал что в режиме запи си медленнее...
но даже при простом запуске тоже тормозит и не так быстро как хотелось бы...( -
@brotok said in Как быстро извлечь все ссылки со страницы (и возможно ли это без цикла)?:
@DoctorKrolic я это и знал что в режиме запи си медленнее...
но даже при простом запуске тоже тормозит и не так быстро как хотелось бы...(для анализа что тормозит можешь запустить в режиме анализа.
-
@UserTrue said in Как быстро извлечь все ссылки со страницы (и возможно ли это без цикла)?:
@brotok Не совсем понятно зачем нужен цикл для получения всех ссылок? В первом же ответе @f0cus написал как получить все ссылки за раз.
я это уже понял - теперь вообще вопрос встал - можно ли как то на максимальной скорости собрать ссылки, в которых образно содержится:
"/video ...***...дальше не важно..?
как оказалось - там много ссылок не нужных - а как собрать ссылки на видео - может подскажете как сделать код для xpath или еще как то но только без цикла если по возможности (чтобы было быстро и работало без тормозов)? заранее спасибо..
-
@brotok said in Как быстро извлечь все ссылки со страницы (и возможно ли это без цикла)?:
как оказалось - там много ссылок не нужных - а как собрать ссылки на видео - может подскажете как сделать код для xpath или еще как то но только без цикла если по возможности (чтобы было быстро и работало без тормозов)? заранее спасибо..
Как-то надоело уже давать готовые ответы, может кто и даст. А я дам ссылку на ман по xpath https://docs.google.com/document/d/1PdfKMDfoqFIlF4tN1jKrOf1iZ1rqESy2xVMIj3uuV3g/pub
-
помогите пожалуйста, если кто-то может, какой там готовый код и как он выглядит, чтобы фильтровались ссылки содержащие /video...
эта инструкция у меня есть - даже распечатывал когда-то давно, но там настолько все сложно, не понятно где что искать - да и в BAS это похоже не работает как я понял эти схемы с xpath(((