Это Unicode Byte Order Mark или BOM.
Обычно он находится в файлах, написанных на платформе Microsoft с использованием кодировки UTF-8 или UTF-16 LE (которую Microsoft бесполезно описывает как "Unicode")
Вы можете нормализовать ваши файлы в общую кодировку, используя такие инструменты, как iconv
или recode
.
Скорее всего, жизнь станет намного проще, если вы стандартизируете UTF-8 без спецификации для всего, что вы делаете, используя текст. Однако у вас могут быть определенные обстоятельства, которые делают это недостижимым.
Смотрите также