Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
Есть ли простой способ получить из html кода страницы его текстовую версию? Просто текст, md разметка или другие варианты - всё подошло бы.
document.body.outerText
так пойдёт?
Не совсем, так как будет много мусора (навигация, сайдбары и т.д.), но спасибо.
Решил эту задачу подключением Node.js и библиотеки html-to-text.
@obam интервал не одинаковый, читайте описание
PS: А зачем создавать тему в англоязычном разделе с темой написанной на английском и при этом сообщение на русском?
@Daniel said in Преобразовать html в docx:
но как теперь test.docx в файл сохранить?
Смотрите примеры использования модуля "fs"
@Fox спасибо тебе большое! Всё работает))
Такой вопрос, возможно ли брать идентификатор пользователя из самой программы? и потом сохранять в текстовый документ или в перемененную. Заранее спасибо.
@Canine Нужно обновиться до 15.8.0, там это исправлено. Или использовать match без первого символа <