Я занимаюсь переводческой работой, которая требовала, чтобы я разбивал длинные страницы или абзацы на границе предложения, что является точкой (.) Для английского языка и Poorn-Viraam (।) для хинди.
Это называется "выравниванием" или (возможно) токенизацией.
Для Notepad++ (w9-32 bit) есть ли надстройка, регулярное выражение или макрос для разделения длинного текста на предложения. (в текстовых текстовых файлах).,
В регулярных выражениях я не могу просто найти. и заменить на.\r\n, потому что. также используется в качестве обозначения аббревиатуры, например, например, pvt., ltd., inc., и т. д., поэтому он также заменяет его, что нежелательно. Кроме того, если в скобках есть несколько предложений () [] {}, то их также не следует разбивать.
Итак, я думаю, что одна команда регулярных выражений просто не подходит, или она станет слишком сложной, чтобы позаботиться обо всех возможностях.
это должен быть набор регулярных выражений, выполняемых один за другим, или макрос,
или если кто-то разработал какое-то дополнение для этого?
Благодарю.
Рават