POST/GET запрос по селектору



  • Пробую перевести парсер на HTTP-клиент. Подскажите как запросом получить содержание элемента на странице. Например, есть на странице кнопка которая содержит ссылку на другую страницу, как запросом получить эту ссылку? В общем как в ответе получить содержимое нужного элемента. Пробовал селектор ставить в значение параметра запроса, но что то не то выдает. Нагуглить не получилось, киньте ссылку, где доходчиво написано, или пример какой нибудь.



  • @IvanG Через Get-запрос получаешь код страницы и применяешь к нему Xpath.



  • @Fox В полученном ответе нет XPASS. Т.е. ссылка нужная есть, но XPASS нету. Такой текст: "> <tr align="center"> <td nowrap style="padding: 8px; border: 1px solid #ffffff;"><a href="http:/. Или я что то делаю не так?



  • @IvanG Все селекторы работают с браузером. В запросах браузер не участвует. Чтобы получить нужный элемент со страницы нужно использовать модуль Xpath (в самом конце который), экшен Xpath получить xml.



  • @Fox Я сделал: выполнить GET-запрос по нужному адресу. К переменной SAVED_CONTENT применил Xpath запрос содержащий Xpath селектор нужного элемента, так? И ничего не получил, потому что в SAVED_CONTENT нет Xpath. Что я делаю не так?)



  • @IvanG

    XPath (XML Path Language) — язык запросов к элементам XML-документа. XPath призван реализовать навигацию по DOM в XML.

    Вот тестовый скрипт. Получает страницу get-запросом и забирает ссылки через XPath.



  • @Fox У меня в твоем скрипте XPATH_XML_LIST тоже пустой почему то выходит(.



  • @IvanG Просто запусти скрипт, без записи.
    0_1504862436420_forum58.png



  • @Fox Суть проблемы не понял пока. Твой скрипт находит 0 ссылок у меня в режиме запуска. Поменял google на яндекс взял первый попавшийся xpath и все сработало как надо. На моем сайте почему то не работает, может в xpath адресе ошибка, копирую xpath в хроме через инспектор.
    Буду разбираться, огромное спасибо за помощь!!!



  • @IvanG Инспектор тебе возвращает абсолютный путь. Советую глянуть мануал по XPath.



  • @Fox С утра туда гляжу) Не все понимаю пока) Мне инспектор выдает такой адрес ://*[@id="main_menu"]/tbody/tr[1]/td[2]/table/tbody/tr/td[1]/a. Я так понимаю, что он относительный. Но ссылку мою не ищет(



  • @Fox Все, разобрался. Fox, спасибо!


Log in to reply