@Elger CSV стандарт предполагает что кавычки " хранятся/записываются в файл как "".
тут необработанность и парсера(или нет? лень думать) и того что записывал в файл неформат.
то что " убрались все при парсинге наглядно видно.
Всем привет. Помогите спарсить токен из кода страницы. Вид токена в коде:
<input type="hidden" name="0e12877fd0affbc6ea83f090f90ecfb6" value="1" />
Создаю регулярное выражение:
<input\ type="hidden"\ name="([\s\S]+)"\ value="1"\ />
Однако вместе с ним, парсятся и другие значения (task,option):
<input type="hidden" name="task" value="register" />
<input type="hidden" name="option" value="com_users" />
<input type="hidden" name="task" value="user.login" />
В итоге регулярка вместе с токеном, парсит ненужные значения из кода.
Как можно спарсить данный токен?
@reif Хоть я и люблю регулярки, но в данном случае лучше использовать xpath, работает он быстрее и надёжнее. Если есть трудности с составлением xpath выражением скинь сюда файлом html код страницы.
@reif Действие xpath получить код элемента
//div[@class="btl-buttonsubmit"]/input[@type="hidden"][@value="1"]/@name
@fox Я знаю, и я учился по нему не помню кто возможно ты же давал его. Но его пока раскуришь семь потов сойдет, я использую все.)
Данный плагин хорош для визуализации. И для человека который хочет понять принцип работы xpath-oв. Кстати, в нем же можно тестировать свои xpath вставляешь и смотришь что находит.
вот удобный плагин для новичков, выберете что нужно он вам сам предложит варианты и подсветит элемены

@fox я тоже их люблю, но для html они не очень годятся, и почему так, хорошо разжевано вот тут
простыми словами Regex не является инструментом, который можно использовать для правильного анализа HTML
это я не тебе объясняю не подумай, ты и так в теме, а для новичков которые будут читать этот пост ;)
я бы советовал новичкам юзать вспомогательные плагины на первых этапах, чтобы мануал скучный не курить, все самом собой запомниться и через время сам уже будешь клепать на автомате, изредка покуривая ман.