4

У меня есть файлы .xlf, которые выглядят как на картинке ниже:

Интересно, как мне найти и заменить юникод-символ "xE5" на "æ"? Я подумал, что могу найти:^ 0145 = xE5 и заменить "æ", что не сработало.

Если это невозможно, я мог бы использовать другой текстовый редактор (пример ultraedit).

Вот вставленный текст из файла:

<?xml version="1.0" encoding="utf-8"?>
<xliff xmlns="urn:oasis:names:tc:xliff:document:1.2" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" version="1.2" xsi:schemaLocation="urn:oasis:names:tc:xliff:document:1.2 xliff-core-1.2-strict.xsd">
  <file xmlns:bind="http://bind.sorona.se" original="CTO12623_1_en-GB-da.xml" source-language="en" datatype="xml" date="2015-11-11T15:35:51Z" target-language="da" product-name="Anders_LP8504_151111" bind:file-id="78452" bind:file-hash="85075c54359fa47b087d6c67ec967f43">
    <header>
      <tool tool-name="Sorona TMS" tool-id="bind" tool-version="3.1.5" tool-company="Sorona Innovation" />
      <count-group name="word-count">
        <count count-type="total" unit="word">2743</count>
      </count-group>
    </header>
    <body>
      <trans-unit id="e1ca41ef868a74944745b8cd1dfa59e7" translate="yes" approved="no" restype="string" resname="p">
        <source>The trench compactor LP 8504 is a radio controlled trench compactor. It has a robust design and is suitable for compaction of medium to deep layers of cohesive and granular soils on limited areas such as trenches, construction back-fills and on roads. No other use is permitted.</source><seg-source><mrk mtype="seg" mid="1">The trench compactor LP 8504 is a radio controlled trench compactor. It has a robust design and is suitable for compaction of medium to deep layers of cohesive and granular soils on limited areas such as trenches, construction back-fills and on roads. No other use is permitted.</mrk></seg-source>
        <target state="translated"><mrk mtype="seg" mid="1">Vibrationstromlen LP 8504 er radiostyret. Den har et robust design og er beregnet til komprimering af middel til dybe lag af sammenh篧ende og granuleret jord p塢egr篳ede omr楥r s塳om grr, anl稳opfyldninger og p塶eje. Den m塩kke anvendes til andre form欮</mrk></target>
      </trans-unit>
      <trans-unit id="3b3dbf229f5f1f06ab9427d689c9740b" translate="yes" approved="no" restype="string" resname="p">
        <source>The LP trench compactor must only be used in well-ventilated areas, as is the case for all combustion engine machines.</source><seg-source><mrk mtype="seg" mid="2">The LP trench compactor must only be used in well-ventilated areas, as is the case for all combustion engine machines.</mrk></seg-source>
        <target state="translated"><mrk mtype="seg" mid="2">LP vibrationstromlen m塬ige som alle andre maskiner med forbr篤ingsmotorer kun bruges i godt ventilerede omr楥r.</mrk></target>
      </trans-unit>
      <trans-unit id="3ceced74b90bcbc582c1857395a8abf1" translate="yes" approved="no" restype="string" resname="p">
        <source>The LP trench compactor must not be towed behind vehicles.</source><seg-source><mrk mtype="seg" mid="3">The LP trench compactor must not be towed behind vehicles.</mrk></seg-source>
        <target state="translated"><mrk mtype="seg" mid="3">LP vibrationstromlen m塩kke sl磥s efter biler.</mrk></target>
      </trans-unit>
      <trans-unit id="c1ff7c8ab3ea4123fc2d5fb6a105d98b" translate="yes" approved="no" restype="string" resname="p">
        <source>Handbrake</source><seg-source><mrk mtype="seg" mid="4">Handbrake</mrk></seg-source>
        <target state="translated"><mrk mtype="seg" mid="4">H毤bremse</mrk></target>
      </trans-unit>
    </body>
  </file>
</xliff>

Я также приложил файл xlf вот ссылка:
Вот ссылка для скачивания XLF

Какие-либо предложения?

2 ответа2

4

Интересно, как мне найти и заменить символ юникода xE5 "на æ

Обратите внимание , что на самом деле æ Unicode 00E6 не 00E5

Поиск и замена - это неправильный способ отображения правильных символов.

<?xml version="1.0" encoding="utf-8"?>

Выше указано, что кодировка utf-8 но файл фактически закодирован как ANSI .

Вам необходимо правильно преобразовать файл в UTF-8 следующим образом:

  1. Откройте Testfile.xlf

  2. Файл выглядит так:

    Unicode неправильно отображается.

  3. Меню> Кодировка > Выбрать кодирование в ANSI

  4. Файл выглядит так:

    Юникод отображается правильно.

  5. Выбрать все содержимое файла (ctrl+a)

  6. Меню> Кодировка > Выбрать Преобразовать в UTF-8

  7. Сохранить файл (ctrl+s)

  8. Закрыть и снова открыть.

  9. Файл теперь правильно закодирован, так как символы UTF-8 и Unicode отображаются правильно.


Как вы можете увидеть файл на самом деле ANSI?

file утилита cygwin показывает это (до и после конвертации):

DavidPostill@Hal /f/test
$ file -i Testfile*.xlf
Testfile.xlf:          application/xml; charset=iso-8859-1
TestfileConverted.xlf: application/xml; charset=utf-8
0

Если вы хотите полностью удалить символы UTF-8/ Unicode, щелкните « Encoding в NPP» и выполните следующие действия по порядку:

  1. Выберите Encode в UTF-8 (если он в настоящее время в ANSI)
  2. Выберите Преобразовать в ANSI (также в кодировке)
  3. Сохранить файл

Когда я делаю это, все символы UTF-8/ Unicode исчезают.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .