Powershell. ConvertFrom-HTML

По аналогии с командлетом ConvertTo-HTML, хотелось бы видеть в Powershell командлет ConvertFrom-HTML, для конвертирования текста с тегами в обычный  форматированный текст. Давайте посмотрим на один  простой метод обхода отсутствия такого командлета

На момент выпуска Powershell 7 такую функцию еще не реализовали, но есть достаточно простое решение.

Смысл метода заключается в:

  • создании пустого объекта HTMLFile, аналогичного тому, что мы получаем с помощью Invoke-WebRequest
  • последующего обращения к его параметру innerText для получения текста без тегов

Пример того что мы имеем на входе:

Сам код для извлечения текста достаточно компактный:

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *