Если сон пробовали ставить, то можно избавиться от получения кода страницы, а текст получать через кубик браузера "Яваскрипт":
[[XPATH_TEXT_LIST]] = [];
res=document.evaluate([[YOU_XPATH]] + "//text()", document, null, XPathResult.ANY_TYPE, null);
while(node=res.iterateNext()) [[XPATH_TEXT_LIST]].push(node.textContent);