@DragonFly попробуй переустановить
Не могу спарсить IP. Нет, не только IP.
-
https://ibb.co/df5fEx
все гуд. А тот мануал всетаке лутчше прочесть. -
@hubble said in Не могу спарсить IP. Нет, не только IP.:
Если применить //table[@id="tblproxy"], то там не xml-текст. Ну а потом регулярка. Как-то так. Одним xpath`ом - ну никак у меня.
почему там должен оказаться xml-ТЕКСТ(sic!), Вам же обрабатываете html.
я так считаю, не разбираете xpath и нафиг он не нужен,/([\d]{1-3}\.[\d]{1-3}\.[\d]{1-3}\.[\d]{1-3})/чтобы извлеч ip, обычно хватает
и если xpath не работает значит xpath селектор неверны
или работайте с браузером и DOМ, там и tbody будет и есть css селекторы которые вероятно проще
document.querySelector('css')а для работы с таблицами есть специальные методы
-
@hubble А вы код смотрели? В исходном коде таблицой и не пахнет.
<script type="text/javascript"> gp.insertPrx({"PROXY_CITY":"","PROXY_COUNTRY":"Colombia","PROXY_IP":"190.248.158.194","PROXY_LAST_UPDATE":"8 15","PROXY_PORT":"1F90","PROXY_REFS":null,"PROXY_STATE":"","PROXY_STATUS":"OK","PROXY_TIME":"288","PROXY_TYPE":"Transparent","PROXY_UID":null,"PROXY_UPTIMELD":"33/24"}); </script> <script type="text/javascript"> gp.insertPrx({"PROXY_CITY":"","PROXY_COUNTRY":"Thailand","PROXY_IP":"118.175.13.178","PROXY_LAST_UPDATE":"8 0","PROXY_PORT":"1F90","PROXY_REFS":null,"PROXY_STATE":"","PROXY_STATUS":"OK","PROXY_TIME":"780","PROXY_TYPE":"Transparent","PROXY_UID":null,"PROXY_UPTIMELD":"4/2"}); </script> ................................Максиму тут можно спарсить все данные //script[contains(text(),'PROXY_IP')] , а потом уже регулярным выражением выдергивать данные. Либо можно JSON.parse(), как выше предложил @Fox
