FineReader OCR, выводимый в Word, часто помещает ложное пространство после начального "в сообщаемой речи", которое я хочу удалить. Использование Find & Replace: Find «*», однако, не различает пробел после начального "и" после последнего, поэтому он также выберет строку между последним "одной цитатой и начальной" следующей цитаты.

Альтернативными решениями являются VBA (которую я должен был бы изучить) или программа на Perl (которая требует значительного пересмотра), но я бы предпочел не идти по этим путям, поскольку в моем возрасте интеллектуальные усилия, которые им потребуются, могут быть неустойчивыми :)

1 ответ1

0

При обычной пунктуации простым решением является поиск [ " ] и замена на [ "] (я использую квадратные скобки для удобочитаемости: они не являются частью поиска или заменяют строки, здесь или ниже), но это выиграло ' t работает, когда кавычки находятся в начале строк или когда в цитируемом тексте есть завершающие пробелы.

Я нашел более общее решение, но это не может быть сделано в одной замене:

  1. Сначала найдите подходящие пары кавычек с помощью ["*"] .
  2. Затем пометьте их символом, который не используется в документе; Я использовал # для иллюстрации, но вы можете использовать любой другой символ или даже последовательность символов.
  3. Установите текст замены как [#^&#] и замените все (^& заменяет исходную строку соответствия).
  4. Теперь вы можете удалить начальные пробелы, заменив [#" ] на ["] .
  5. Наконец удалите оставшиеся символы # , заменив [# ] на [] .

Это сработает, если есть какие-либо непревзойденные кавычки.

У меня нет обновленной версии Office, но она, безусловно, работает на более старых версиях, и я не знаю об основных изменениях, чтобы найти / заменить в более поздних версиях.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .