@kompik said in Парсинг аккаунтов:
url:login:password
поддомен получается не нужен? только url:login:password?
Не получается составить рег. выражение для https://www.reddit.com/r/pics/.rss
Делаю get запрос, в ответ на xpath получить текст: //*[@id="desc_0"]/span[1]/a
выдаёт ошибку. Делаю рег. выражение: //a/@href выдаёт ошибку Can't resolve query //*a/@href,
@Jasvin Сомневаюсь я на счёт применения Xpath, страница выходит почти вся без dom-элементов. А на счёт регулярки.. Вы бы хоть сказали что хотите получить в итоге. Если нужны все ссылки, то подойдёт такая:
((https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?)
Не помогает, делаю так //@href, парсит только коменты "https://www.reddit.com/r/pics/comments/77ngg1/enter_the_pics_halloween_photo_contest/",
@Jasvin said in **Парсинг rss ленты**:
Не помогает, делаю так //@href, парсит только коменты "https://www.reddit.com/r/pics/comments/77ngg1/enter_the_pics_halloween_photo_contest/",
link href="(.*?)" тоже парсит коменты.
@Jasvin said in **Парсинг rss ленты**:
@Jasvin said in **Парсинг rss ленты**:
Не помогает, делаю так //@href, парсит только коменты "https://www.reddit.com/r/pics/comments/77ngg1/enter_the_pics_halloween_photo_contest/",
link href="(.*?)" не парсит коменты, ошибся, просто через onapplicationstart проскачил //@href работает на коменты.
Ссылку на внешний ресурс, вот пример:
href="https://i.redd.it/7q6kz0knmxtz.jpg">[link]
@Jasvin said in **Парсинг rss ленты**:
Ссылку на внешний ресурс, вот пример:
href="https://i.redd.it/7q6kz0knmxtz.jpg">[link]
https://i.redd.it/dhgagtud3utz.jpg
https://i.redd.it/buf30708astz.jpg
https://i.imgur.com/p2OZNq8.jpg
https://imgur.com/gallery/IKxuk
@Jasvin Форум форматирует исходный код, воспользуйтесь вот такой формой:
Здесь отобразится:
a href="https://i.redd.it/7q6kz0knmxtz.jpg">[link]
Когда в простом сообщении эта же строчка будет выглядеть вот так:
a href="https://i.redd.it/7q6kz0knmxtz.jpg">[link]
@Jasvin На скорою руку получилось немного страшновато и не очень универсально:
<span><a href="(.*?)">(?:[комментарии]<\/a><\/span>|[link]<\/a><\/span>)
но по исходному коду внешние ссылки собирает.