Время от времени я получаю электронное письмо, которое не отформатировано должным образом, так как в нем содержится много символов «= 92» и «=»:

We are looking for candidates to join our team.    Great qualifications inc=
lude:

*     PhD or Masters specializing in Machine Learning, Statistics, or related fi=
elds.

=B7     Experience dealing with large, real-life data sets. (not just pre-c=
anned problems).

Почему это произошло? Неисправный почтовый клиент отправителя? Неправильная кодировка MIME?

1 ответ1

2

Проблема может быть разделена между отправкой и получением программ электронной почты.
Несомненно, что отправитель электронной почты не видел такой беспорядок, когда он отправил свою электронную почту. Проблема связана с тем, как фактическая кодировка, используемая отправителем, объявляется в части заголовков электронного письма.

Основная проблема заключается в том, что существует слишком много символов, чтобы их можно было выразить только с помощью простого латинского набора символов ascii. Предполагается, что окончательным решением будет Unicode, цель которого состоит в том, чтобы содержать все наборы символов мира (что уже невозможно). Существуют также промежуточные решения, такие как quote-printable, и это, вероятно, то, что мы видим в вашем вопросе.

Теперь для каждого набора символов (кроме, возможно, Unicode) есть несколько независимых реализаций каждым почтовым клиентом, к которым вы также добавляете реализацию заголовков электронной почты.

Результатом является то, что видеть точно такое же изображение текста электронной почты можно только в том случае, если для отправителя и получателя используется одно и то же программное обеспечение клиента электронной почты. Особенно виноват Outlook, который не слишком уважает международные стандарты и поэтому может генерировать электронные письма, которые другие клиенты могут испытывать затруднения при отображении идентичным образом.

К этому беспорядку следует добавить тот факт, что разные операционные системы могут давать разные числовые значения одним и тем же символам. Например, между Mac и ПК нет соглашения о числовом значении даже одного акцентированного символа.

Эта статья также может быть вам интересна: Кодировка символов в электронной почте: необходимость разобраться с дерьмом GroupWise в 2004 году, и может показать вам аналогичные проблемы, с которыми сталкиваются другие люди.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .