3

Мне нужно массово исправить большое количество документов на немецком языке. Мне нужно обработать несколько сотен страниц текста. Я написал макрос для выполнения массовых операций поиска и замены в случае распространенных орфографических ошибок.

Мне нужно найти способ исправить общую типизацию ERror, где SEcond CHaracter CApitalized AL, хотя это не должно быть.

Можно ли использовать поиск по шаблону, чтобы заменить все вхождения неверно прописного второго символа в слове на строчные буквы?

Может ли этот подстановочный знак учитывать тот факт, что сокращения не должны быть изменены?

Я полагаю, что с RegEx можно что-то подобное сделать. Я также хотел бы использовать сторонний инструмент или редактор с этой возможностью макросов.

Поиск в Интернете не принес много пользы, я не могу найти правильную комбинацию поисковых терминов.


Пример:

  • До: это текст с ошибкой CApitalization. Компания ABC не должна быть затронута, как и США. И: TGIF.
  • После: это текст с ложной заглавной буквой. Компания ABC не должна быть затронута, как и США. И: TGIF

Извините за мои частые правки, но после некоторого почесывания и прочтения руководства по Word мне удалось создать шаблон, который мог бы найти достаточно большой набор слов с ошибками.

<[AZ] [AZ] [AZ] [AZ]

Он найдет такие слова, как CApital и SMall, но не UPS или HBO (не аффилированные). К сожалению, поле замены не обрабатывает Regex. Я все еще ищу метод, который заменит неправильное слово на правильное написание.

2 ответа2

1

Я не уверен насчет обработки аббревиатур, но в Word 2007 (и, возможно, ранее) есть способ циклически проходить через основные типы заглавных букв.

Выберите блок текста, затем нажмите Shift+F3

Это будет циклически проходить через следующее:

  • Первая буква заглавная

  • Каждое слово с большой буквы

  • все слова строчные

Как я уже упоминал, я не знаю, насколько хорошо это работает с аббревиатурами.

0

Сторонний инструмент под названием TextPipe (не аффилированный) позволит мне делать то, что мне нужно. Мне удалось создать фильтр после некоторой настройки. Осторожно, только для Windows и ничего для слабонервных (я недавно не видел ни одного уродливого GUI, и он ориентирован на разработчиков, так что ждите крутой кривой обучения). Это довольно мощный, хотя.

Полагаю, что-то подобное можно было бы также осуществить бесплатно с помощью сценария VBA или RegEx, например:

1. Find all words that match these criteria
2. Convert all these words to uppercasefirst (uncapitalize them, after that recapitalize)

Не стесняйтесь не соглашаться и предоставить лучшее решение или бесплатное программное обеспечение.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .