1

У меня есть несколько книг в печатном формате. Они были переведены с английского на норвежский до того, как компьютеры стали массовыми, поэтому я провел перевод через сканер и распечатал его. Английская версия была уже оцифрована.

Есть ошибки OCR, которые мне нужно исправить, и я также должен сопоставить пункты в норвежском переводе с английским оригиналом.

Кажется, мне следует использовать какую-то программу Translation Memory, например Zanata, в качестве инструмента и репозитория для переводов, но прежде чем я смогу это сделать, мне нужно создать файл TMX, который соответствует сегментам между существующими переводами.

Есть идеи, как мне это сделать? Или я атакую эту проблему под неправильным углом?

1 ответ1

0

Если вы ищете "Выровнять переводы", вы найдете несколько инструментов, специально предназначенных для выравнивания абзацев (или предложений) в уже переведенных документах.

Я использовал sourceforge.net/projects/aligner, который является кросс-платформенным. Я не слишком впечатлен этим инструментом, но он выполняет свою работу, поскольку вопрос, о котором идет речь выше (позволяет выравнивать текст, а затем создает файл TMX).

Однако я закончил тем, что оставил инструмент по причине, которая не ясна из вопроса выше. Мне нужен был выравниватель для вывода текстового файла, который точно соответствовал оригиналу, с учетом количества разрывов строк. Хотя LF Aligner хранит текущий проект в текстовых файлах, было несколько проблем:

  • Когда я открыл проект во второй раз, часть выравнивания была испорчена. В частности, это относится к местам, я добавил пустой абзац.
  • Общие проблемы обработки пустых абзацев как на языке оригинала, так и на переводе.

Я добавлю больше информации в этот пост, если найду инструмент, способный это сделать.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .