Можно из кеша получить всю страницу с кодом из head, но там весь код чистый, без запущенных js скриптов. Для моей задачи может этого и хватит, но лучше б код страницы весь html возвращал мне кажется.
@lev Можно через костыль сделать, выполнять js на странице document.documentElement.innerHTML
Должно вернуться все, что между тегами html, но думаю, разработчик со временем сделает возврат всей страницы.
@Symposium
Видимо xml из ответа на запрос отличается от html страницы, полученного при загрузке через браузер, так как часть элементов страницы подгружается динамически, возможно нужны какие-то дополнительные запросы.
С помощью регулярок, кстати, всё же получается 15 штук найти. test3.xml