Недавно я получил много писем со спамом и фишингом и заметил, что спаммеры, как правило, используют некоторые приемы, чтобы обойти фильтры спама. Например, почти все они имеют текст, который был вырезан из новостных статей и веб-форумов, вставленных внизу письма. Я предполагаю, что в ч / б спам-фильтрах есть алгоритм, который использует отношение помеченных слов и фраз ко всем остальным словам в письме при принятии решения, является ли письмо спамом или нет. Я также заметил, что они, как правило, пишут адреса улиц (то есть, семь один шесть два два Джуанита Драйв Twentynine Palms CA). Мне было просто любопытно, почему это так. Фильтры спама ищут адреса улиц и пытаются сопоставить их с доменными именами, чтобы попытаться выяснить, является ли электронная почта спамом / фишингом или законным бизнесом? Или что-то еще?
1 ответ
0
Вы предоставили одно возможное объяснение. Вот еще один Подумайте об этой проблеме в терминах частотного / стохастического / байесовского анализа. Сколько существует возможностей изменить адрес улицы? Не так много.
Частью работы фильтров спама является подсчет общего количества экземпляров определенных групп букв, цифр, слов, абзацев и т.д. Если вы отправляете 10 тыс. Писем с «111 Main St», а не «One one one Main St» /«One 1 1 Main St» /«One 1 One Main St» /и т.д. ... тогда у вас больше шансов попасть в автоматизированные фильтры. У вас просто больше комнаты для маневра, вот и все.