У меня есть установка Drupal и куча файлов DOCX. Как - несколько лет воскресных проповедей? Я не хочу сохранять 99% форматирования, но у них есть сноски. Меня не особо волнует, как сноски появляются, когда они добавляются в виде контента Drupal, если они действительно появляются. Я нашел несколько конвертеров DOCX-в-HTML, но все они содержат много форматирующих материалов и не имеют возможности отключить то, что я могу найти. Например, LibreOffice, сохраняющий как HTML, сохраняет все виды шрифтов и прочего и превращает все в CSS. Сохранение в виде текста в LibreOffice, похоже, сохраняет номера сносок, но теряет их содержание.

Сохранять такие вещи, как жирный шрифт / курсив, было бы неплохо, но я не хочу поля, шрифты и т.д., Потому что сайт Drupal имеет собственный стиль. Это просто глупые сноски, которые я не могу потерять.

В качестве альтернативы, я думаю, что инструмент для удаления всех дополнительных тегов / стилей также может работать, но я не уверен, существует ли такая вещь.

Спасибо!

0