У меня есть несколько книг в печатном формате. Они были переведены с английского на норвежский до того, как компьютеры стали массовыми, поэтому я провел перевод через сканер и распечатал его. Английская версия была уже оцифрована.
Есть ошибки OCR, которые мне нужно исправить, и я также должен сопоставить пункты в норвежском переводе с английским оригиналом.
Кажется, мне следует использовать какую-то программу Translation Memory, например Zanata, в качестве инструмента и репозитория для переводов, но прежде чем я смогу это сделать, мне нужно создать файл TMX, который соответствует сегментам между существующими переводами.
Есть идеи, как мне это сделать? Или я атакую эту проблему под неправильным углом?