HTML как получить текст из кода



  • Подскажите как можно вытянуть текст из кода HTML? Нужно вытянуть ключевые слова(Keywords) из ролика в Ютубе.Не могу найти к чему привязаться и как!!!0_1528797361328_keywords.png



  • @assd регулярным выражением если лень курить xpath, перед ключевиками же есть "keywords":" и после них ","innertube_api_key" вроде как то так

    (?<="keywords":")[\w\W]*?(?=\ ","innertube_api_key")
    


  • @bigorat пробовал xpath слишком много выдаёт не смог конкретно нужное вытянуть потому и решил сюда написать



  • Парсит код,а не текст в нём !Подскажите как спарсить именно текст.?
    0_1528809669712_Screenshot_20180612_161742.png



  • @assd
    да почему получать текст то



  • @ruzne Ну у меня опыта не много я подумал что это подходящий запрос



  • @assd в видеоинтсрукции в разделе вики есть ответы.
    'запрос' не подходящий и не запрос,
    в том месте действие получить текст лучше использовать селектор элемента, никогда не регулярное выражение
    в таком действии получить текст получается текст всей страницы, точнее не текст а все что не является тегом, а может все текстовые узлы. Может там внутри innerText, а может и textContent, что скорее раз возвращается содержимое тега script, но в описании к действию написано что "Получить текст элемента видимого на экране" что больше похоже на innerText.

    есть достаточно способов вытянуть текст из кода хтмл и из js кода в коде хтмл тоже. а предложенную регулярное выражение лучше применить через например поиск первого вхождения к коду страницы



  • @assd по картинкам увы сложно ориентироваться, прилагайте хотя бы кусок кода где нужно парсить данные...