Мы находимся в процессе преобразования справочной системы HTML в библиотеку документов SharePoint. У нас есть около 3000 отдельных HTML-документов, которые мы конвертируем в Word. Около 20% документов содержат гиперссылки на связанные документы, и все они являются относительными ссылками.
Мы пытаемся автоматизировать процесс синтаксического анализа каждого документа, и в любом случае, когда у нас есть гиперссылка, заменив последние три байта строки - "htm" - на "doc".
Я видел несколько примеров PowerShell, где люди анализируют документы (обычно журналы сервера), ища определенные фрагменты информации, но не смогли найти ничего о замене определенных символов в файле перед его закрытием / сохранением.
У кого-нибудь есть советы по достижению этого с PowerShell? или идеи о более подходящих инструментах?