Редактировать: Резюме
По всей видимости, символ, предназначенный для отображения в этом случае, является «черточкой».
Эта страница имеет половину таблицы, которая показывает, что для –
некоторое программное обеспечение преобразует правильный шестнадцатеричный код 2013 года в 0096. (посмотрите на первую строку в таблице).
Этот ответ на Stackoverflow объясняет, что каким-то образом это путаница между Windows-1252 и UTF-8
Эта статья блога обеспечивает это:
Символ 150 (0x96) является символом Unicode "START OF GUARDED AREA" в неотображаемом диапазоне управляющих символов C1, но в кодировке Windows-1252 он отображается на отображаемый символ 0x2013 «en-dash» (короткая черта) ,
Другие боролись с этим при создании контента, так как этот ответ на Stackoverflow показывает, как заменить 0x0096 на 0x2013.
Google должен понять это, потому что, как указано в моем исходном вопросе ниже, кэшированная версия Google на странице Amazon имеет –
кажется, что они автоматически исправляют эти ошибки на страницах, которые они кешируют.
Я попытался установить кодировку Windows-1252, но это не помогает.
Итак, теперь я думаю, что мой вопрос, как я могу сказать Firefox игнорировать такие непечатаемые символы?
Оригинальное содержание ниже:
(Firefox 3.6.13 в Windows XP)
Время от времени я замечаю странный символ на определенных веб-страницах при просмотре веб-страниц. Это контур коробки с 4-значным числом внутри.
И пример страницы, которая имеет эти символы:http://aws.amazon.com/ec2/#highlights
После каждого заголовка раздела (Эластичный, Полностью контролируемый, ...) Я вижу коробку с номером "0096" внутри. Я посмотрел на кэшированную версию в Google, и в Google есть –
в этом месте, так что я предполагаю, что я должен был видеть черту вместо коробки с цифрами в нем.
Я попытался изменить кодировку символов в Firefox, но не смог найти кодировку, которая правильно отображает эти символы.
Есть ли способ разрешить Firefox просматривать эти символы?
Заранее спасибо!
Редактировать - добавление скриншота из "специальных" символов:
Edit # 2 - пробовал в Ubuntu - новые скриншоты
Я вошел в свой рабочий стол Ubuntu и перешел на страницу Amazon в Chrome и Firefox. Chrome полностью игнорирует символы, даже если я проверяю или просматриваю исходный код страницы. Firefox в Unbutu отображает символ точно так же, как Firefox на моем Windows XP. Я скопировал персонажа и поиграл с ним в командной строке - вот скриншот результатов:
Похоже, я тоже могу вставить персонажа в этот пост: ``
Это определенно не изолирован для Windows XP. Я попытался установить кодировку символов для моего терминала на Windows 1252 (из комментария Денниса ниже), но затем он просто отображает этот символ в виде знака вопроса.
Я перетащил веб-страницу вниз с помощью wget и curl, и оба вывода показывают эти символы как: <96>
Это заставляет меня задуматься, правильно ли этот персонаж отображает для кого-либо? Похоже, webkit просто игнорирует его, мой IE6 игнорирует его, Firefox отображает окно с числами в нем. Я должен был бы вообразить, что команда разработчиков в Амазоне может видеть это правильно?
Это не большая проблема, чтобы эти символы отображались правильно, но было бы неплохо узнать, есть ли решение для этого.