У меня есть файл .srt, который выглядит так:
1
00:00:06,862 --> 00:00:09,408
It's the first sense you use when you're born.
2
00:00:09,408 --> 00:00:11,283
One out of every fifty of your genes
3
00:00:11,283 --> 00:00:12,625
is dedicated to it.
Это субтитры для видео TEDed, которое я перевожу. Я хотел бы проверить правописание и грамматику того, что я написал, но я не могу найти как. Большинство браузеров и редакторов субтитров имеют какую-то проверку орфографии, но все, что они делают, это проверяют, существует ли группа букв в словаре. У меня есть программное обеспечение для проверки орфографии и грамматики с учетом контекста, но оно не знает, как читать файл .srt.
Поэтому я думаю, что мне нужен способ игнорировать всю "нетекстовую" часть файла, удалить также возврат каретки, и иметь возможность вернуться к файлу srt, как только я закончу.
Я думаю, что мог бы использовать какой-то невидимый символ, который будет игнорироваться моей программой проверки орфографии, но иметь возможность пометить, где должны быть обрезаны линии.
Есть идеи ?