Я использую Linux-машину (Debian) и установил на нее fetchmail и procmail. Прямо сейчас он может получать письма, отправленные на мой адрес электронной почты каждую минуту. Однако файл, извлекаемый fetchmail, не является обычным html-файлом, но содержит символы для печати в кавычках.
Моя цель - получить исходный HTML-код письма, как если бы я открыл Outlook в Windows, щелкнул правой кнопкой мыши по почте и выбрал "Показать исходный код".
Также важно иметь возможность делать это программно, так как я хочу автоматизировать задачу.
Изменить: мой первоначальный вопрос не хватает точности, поэтому здесь больше информации о моей проблеме. Один из моих клиентов каждый день отправляет мне электронное письмо, содержащее таблицу с данными о продажах за предыдущий рабочий день. Прямо сейчас, каждый день, я должен копировать, вставлять данные из электронной почты в файл EXCEL. Однако, поскольку это очень повторяющаяся задача, я хочу найти решение, которое может сделать это для меня автоматически. Я знаю, как записывать данные в EXCEL-файл с помощью Python, и у меня есть представление о том, как извлечь информацию из HTML-документа с помощью некоторых библиотек Python.
Поэтому я решил использовать crontab с Linux, fetchmail и procmail, чтобы сделать следующее: каждую минуту я проверяю свой почтовый ящик, получил ли я письмо от своего клиента. Если это так, я запускаю скрипт Python для этого файла, чтобы получить информацию. После этого я ввожу эту информацию в файл EXCEL и отправляю ее себе.
Сценарий отлично работает на моем ПК с исходным кодом HTML-сообщения электронной почты, полученного из Outlook. Однако на моей машине с Linux это не работает. Я открыл исходный код файла электронной почты со своего компьютера с Linux и обнаружил, что часть HTML-кода была изменена.