4

Редактировать: Резюме

По всей видимости, символ, предназначенный для отображения в этом случае, является «черточкой».

Эта страница имеет половину таблицы, которая показывает, что для – некоторое программное обеспечение преобразует правильный шестнадцатеричный код 2013 года в 0096. (посмотрите на первую строку в таблице).

Этот ответ на Stackoverflow объясняет, что каким-то образом это путаница между Windows-1252 и UTF-8

Эта статья блога обеспечивает это:

Символ 150 (0x96) является символом Unicode "START OF GUARDED AREA" в неотображаемом диапазоне управляющих символов C1, но в кодировке Windows-1252 он отображается на отображаемый символ 0x2013 «en-dash» (короткая черта) ,

Другие боролись с этим при создании контента, так как этот ответ на Stackoverflow показывает, как заменить 0x0096 на 0x2013.

Google должен понять это, потому что, как указано в моем исходном вопросе ниже, кэшированная версия Google на странице Amazon имеет – кажется, что они автоматически исправляют эти ошибки на страницах, которые они кешируют.

Я попытался установить кодировку Windows-1252, но это не помогает.

Итак, теперь я думаю, что мой вопрос, как я могу сказать Firefox игнорировать такие непечатаемые символы?


Оригинальное содержание ниже:


(Firefox 3.6.13 в Windows XP)

Время от времени я замечаю странный символ на определенных веб-страницах при просмотре веб-страниц. Это контур коробки с 4-значным числом внутри.

И пример страницы, которая имеет эти символы:http://aws.amazon.com/ec2/#highlights

После каждого заголовка раздела (Эластичный, Полностью контролируемый, ...) Я вижу коробку с номером "0096" внутри. Я посмотрел на кэшированную версию в Google, и в Google есть – в этом месте, так что я предполагаю, что я должен был видеть черту вместо коробки с цифрами в нем.

Я попытался изменить кодировку символов в Firefox, но не смог найти кодировку, которая правильно отображает эти символы.

Есть ли способ разрешить Firefox просматривать эти символы?

Заранее спасибо!

Редактировать - добавление скриншота из "специальных" символов:

альтернативный текст

Edit # 2 - пробовал в Ubuntu - новые скриншоты

Я вошел в свой рабочий стол Ubuntu и перешел на страницу Amazon в Chrome и Firefox. Chrome полностью игнорирует символы, даже если я проверяю или просматриваю исходный код страницы. Firefox в Unbutu отображает символ точно так же, как Firefox на моем Windows XP. Я скопировал персонажа и поиграл с ним в командной строке - вот скриншот результатов:

альтернативный текст

Похоже, я тоже могу вставить персонажа в этот пост: ``

Это определенно не изолирован для Windows XP. Я попытался установить кодировку символов для моего терминала на Windows 1252 (из комментария Денниса ниже), но затем он просто отображает этот символ в виде знака вопроса.

Я перетащил веб-страницу вниз с помощью wget и curl, и оба вывода показывают эти символы как: <96>

Это заставляет меня задуматься, правильно ли этот персонаж отображает для кого-либо? Похоже, webkit просто игнорирует его, мой IE6 игнорирует его, Firefox отображает окно с числами в нем. Я должен был бы вообразить, что команда разработчиков в Амазоне может видеть это правильно?

Это не большая проблема, чтобы эти символы отображались правильно, но было бы неплохо узнать, есть ли решение для этого.

2 ответа2

0

0096, скорее всего, является ссылкой ASCII на символ ', который может отображаться в HTML как &#96;

Если посмотреть на вашу ссылку, HTML-код выглядит нормально, и нет ссылки на &ndash;

...

<p><span class="product_highlights">Elastic</span>  Amazon <span class="caps">EC2</span> enables you to increase or decrease capacity within minutes, not hours or days. You can commission one, hundreds or even thousands of server instances simultaneously. Of course, because this is all controlled with web service APIs, your application can automatically scale itself up and down depending on its needs.</p> 


    <p><span class="product_highlights">Completely Controlled</span>  You have complete control of your instances. You have root access to each one, and you can interact with them as you would any machine. You can stop your instance while retaining the data on your boot partition and then subsequently restart the same instance using web service APIs. Instances can be rebooted remotely using web service APIs. You also have access to console output of your instances.</p> 


    <p><span class="product_highlights">Flexible</span>  You have the choice of multiple instance types, operating systems, and software packages.  Amazon <span class="caps">EC2</span> allows you to select a configuration of memory, <span class="caps">CPU</span>, instance storage, and the boot partition size that is optimal for your choice of operating system and application.  For example, your choice of operating systems includes numerous Linux distributions, Microsoft Windows Server and OpenSolaris.</p> 

...

У Firefox не должно быть проблем с отображением символа тире, как я только что протестировал на 3.6.* ...

<html>
    <head>
        <body>
            My dash is &ndash;
        </body>
    </head>
</html>

... скопируйте и вставьте приведенный выше код в тестовый документ, назовите его test.html и откройте его в Firefox. Он должен отображать вашу черту без каких-либо проблем.

РЕДАКТИРОВАТЬ: Как указал Дейв 0x96 ANSI эквивалент en dash. При таком понимании кажется, что это проблема синтаксического анализа в отношении спецификации типа документа на самой странице. Проверьте эту тему.

Вы можете извлечь HTML и изменить doctype, чтобы увидеть, действительно ли это является причиной проблемы. Скорее всего, это нечто среднее между закодированными значениями, т.е. ...ANSI -> Юникод; в качестве Unicode значение является непечатаемым символом.

0

Похоже, ошибка со страницей. Попробуйте изменить кодировку символов на Windows-1252 в Firefox, чтобы посмотреть, поможет ли это.

Многие плохо настроенные веб-страницы скажут, что они ISO-8859-1 или UTF-8, а на самом деле Windows-1252.

Если вы управляете страницей, попробуйте повторно сохранить ее и указать другую кодировку.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .