Извлечение данных из HTML кода



  • Как извлечь определённые данные из HTML кода?
    Например, фрагмент кода:

    <html><head><title></title></head><body><script src="https://hcaptcha.com/1/api.js?hl=en" async defer></script><form method="post">
    <div class="h-captcha" data-sitekey="32s5desa-6cad-2314-4c26-4321a02c578e"></div><br>OR add Token here:<br><textarea name="textarea" ></textarea><br><input type="submit"><input type="hidden" name="f1" value="1"></form></body></html>

    Из него нужно извлечь значение параметра data-sitekey и сохранить в переменную.
    Как это можно сделать?



  • @NickBAS xpath //div[@class="h-captcha"]/@data-sitekey



  • @bigorat хорошо. Это в разделе Xpath -> Xpath получить текст.
    А как заполнить поля "Текст для применения Xpath" и "Xpath запрос".
    Код xpath //div[@class="h-captcha"]/@data-sitekey добавить в Xpath запрос?
    Что указывать в первом поле тогда?



  • @NickBAS said in Извлечение данных из HTML кода:

    //div[@class="h-captcha"]/@data-sitekey

    7d48b7f7-dead-457f-b732-4c932c0d14b4-изображение.png



  • @bigorat выдаёт в логе "Can't resolve query //div[@class="h-captcha"]/@data-sitekey".
    Сначала загружается сама страница в браузере, затем сохраняется код страницы в переменную, затем добавляю эту переменную в поле текста, то есть не предусмотрено добавление переменной туда?Снимок.PNG



  • @NickBAS возможно эти данные находятся в Iframe тогда таким образвом выдернуть не получится, нужно смотреть сам код страницы



  • @bigorat
    <html><head><title></title></head><body><script src="https://hcaptcha.com/1/api.js?hl=en" async defer></script><form method="post">
    <div class="h-captcha" data-sitekey="32s5desa-6cad-2314-4c26-4321a02c578e"></div><br>OR add Token here:<br><textarea name="textarea" ></textarea><br><input type="submit"><input type="hidden" name="f1" value="1"></form></body></html>

    Это и есть весь код страницы. Когда вручную добавляю код в поле текста, всё парсится, а именно из переменной не получается



  • @NickBAS попробуйте переменную с кодом страницы сохранить в файл и открыть его в текстовом редакторе, и проверить совпадает он с тем что здесь? Чудес не бывыет, если не извлекается из переменной, то что то делается не так...



  • @bigorat в текстовый файл и в лог из переменной записывается, всё в порядке, а именно в Xpath нет



  • @NickBAS ну, тут гадать можно долго, что то сделано не так значит.



  • Можно просто запрос

    //@data-sitekey
    

Log in to reply
 

  • 8
  • 2
  • 3
  • 3
  • 6
  • 2
  • 12
  • 20