7

У меня есть фотокопия ноутбука и отсканированная фотокопия, около 200 страниц. По разным причинам мне нужно распечатать этот материал. По бокам страницы (после окончания самой страницы) имеется большое количество черных областей, "черных полей".

Изображение выглядит так:

IMG

Я хотел бы удалить черные места, но сохранить весь текст. * Четные и нечетные страницы имеют черную часть в разных местах. * Примечательно, что за черным тоже есть белый край! * В частности, черные области не имеют фиксированной ширины (я пытался наложить все изображения на четные и нечетные страницы отдельно). Его ширина варьируется. Пакетный алгоритм должен быть в состоянии обнаружить его.

Есть ли способ автоматически удалить эти черно-белые поля, сохраняя текст?

Я могу использовать Windows XP или Linux.

2 ответа2

6

Я бы порекомендовал использовать бесплатную утилиту Scan Tailor, которая удаляет границы, выпрямляет и делает другие исправления для отсканированных изображений. Ниже приведен результат, который я получил с минимальным вкладом в ваш пример файла. Пока сложно сказать, как это будет работать для всей партии, но предварительные результаты кажутся многообещающими.

Если вы ищете истинное решение проблемы с помощью сценариев, вы можете попробовать свои силы в ImageMagick, очень мощной утилите командной строки для работы с изображениями. В частности, я бы посмотрел разделы об удалении границы и обрезки. Однако мне не очень повезло заставить его работать с вашим тестовым изображением. Возможно, вы захотите посмотреть на форумах, где другие, похоже, имеют аналогичные проблемы.

Образец сообщения, обработанного Scan Tailor

3

XnView имеет режим пакетной обработки с функцией автоматического кадрирования :

1

Как видите, цвет и уровень допуска могут быть изменены по мере необходимости, так что это может помочь.

IrfanView имеет похожую функцию, хотя она немного более скрыта. В разделе « Options > Properties/Settings > Browsing/Editing вы можете установить значение допуска для границ автоматической обрезки:

2

Вы можете выполнить пакетную автоматическую обрезку через File > Batch conversion:

3

Если ничего из этого не помогло, вам, возможно, придется разбить большие пушки и использовать что-то вроде Photoshop, возможно, с соответствующими плагинами для автоматического обрезки.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .