1

У меня есть почти 300 электронных писем в формате .eml, которые мне нужно преобразовать или распечатать в PDF для юридических целей. Из-за этого у меня есть довольно специфические потребности:

  1. Должны иметь номера страниц.
  2. НЕ ДОЛЖНЫ иметь другие верхние / нижние колонтитулы (особенно не путь или текущую дату).
  3. НЕ ДОЛЖНЫ показывать получателей BCC в распечатке.
  4. Должен иметь, по крайней мере, от, cc, и субъект.
  5. Не должен отображать имя пользователя / профиля / учетной записи в верхней части (в стиле Microsoft Outlook Memo)
  6. Имя файла должно быть темой письма, с каким-то уникальным индексом, вставленным или добавленным для предотвращения перезаписи.

Что я пробовал до сих пор (и почему это не сработало):

  1. Печать в PDF из Outlook. Всегда печатает с моим именем вверху. Я случайно обнаружил, что дома, если вы открываете файлы без настройки учетной записи, вы можете распечатать их по отдельности без имени. Но, похоже, нет никакого способа импортировать их в сам Outlook, чтобы распечатать их сразу, или, по крайней мере, большими партиями, чем по одному за раз. Даже если бы я был склонен печатать их по одному, имя / имя файла, которое Outlook, по-видимому, использует по умолчанию для заданий на печать в файл, - это «Microsoft Outlook - Memo Style», что не годится.

    Примечание: у меня дома есть доступ к трем различным PDF-принтерам: Microsoft Print to PDF, Foxit Reader и PDFCreator. MSPTP вообще не предлагает имя файла по умолчанию, а два других используют то, которое я упомянул выше.

  2. Импортируйте их в локальную папку Thunderbird с помощью дополнения importexporttools. Это может быть моим лучшим выбором, но проблема, которая сводит меня с ума больше, чем возможность снова использовать importexporttools для массового сохранения файлов в PDF, но при любом сохранении в PDF таким способом заголовки / колонтитулы по умолчанию включены их. Я просмотрел файлы конфигурации и настроил их внутри и снаружи Tbird, и я не могу на всю жизнь найти, откуда он получает эти настройки. Альтернативой является сохранение всех 300 по одному. Но даже если я согласен с этим, Tbird печатает либо скудные заголовки (я думаю, что они состоят из, date, subject в print.show_header = 0), либо все это - между ними нет. К сожалению, нет никакой разницы между "обычными" заголовками (1) и полными заголовками (2) - кажется, они оба печатают полный заголовок. Поэтому, если я пойду по этому пути, мне придется пройти и вручную удалить любые строки BCC из PDF-файлов из примерно половины из них, отдавать или брать.

  3. (Добавлено с оригинального поста) Изменение расширения на mht и открытие в Internet Explorer. Пробовал открывать в Firefox тоже, на всякий случай, и Chrome. IE выглядел хорошо, нижние и нижние колонтитулы можно было отформатировать, но все заголовки писем полностью отсутствовали. Firefox даже не открывал его, обрабатывал его как загрузку, а Chrome - это просто текст в одной строке, без форматирования и заголовков. Просто чтобы охватить все мои базы, я попробовал файлы eml во всех трех браузерах, ничего.

У кого-нибудь есть идеи?

2 ответа2

0

Вот инструмент с открытым исходным кодом, который преобразует файлы EML (формат MIME) в PDF . Это делает это

парсинг (и очистка) mime/ структуры, преобразование его в html и затем использование wkhtmltopdf для преобразования сгенерированного html в pdf файл.

Таким образом, вы можете либо адаптировать процесс преобразования к HTML в соответствии со своими потребностями, либо постобработать сгенерированный HTML-файл, прежде чем он будет конвертирован в PDF.

0

Если у вас есть несколько EML-файлов для преобразования в PDF-файлы вместе с вложениями, то я бы порекомендовал вам преобразовать eml в PDF, что облегчает процесс преобразования и позволяет сохранять несколько EML-файлов, сохраняя структуру папок и другие связанные данные без изменений.

Вы можете проверить более подробную информацию об этом в " Решение для преобразования нескольких файлов EML в формат PDF ".

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .