Вопросы с меткой [ocr]

Оптическое распознавание символов (OCR) - это процесс преобразования изображений текста в текст, которыми могут управлять текстовые процессоры и т.д.

2
голоса
1ответ
719 показов

Windows Search OCR плагин / расширение

Существует ли какой-либо плагин или решение, позволяющее Windows Search индексировать текст на графических страницах, встроенных в файлы PDF. Что-то вроде удивительного плагина Omnipage OCR, который ...
2
голоса
1ответ
53 показов

Как превратить изображение в форматированный документ?

Таким образом, у меня есть журнал (с несколькими страницами) в руках, и я хочу иметь получившийся файл, который сохранит всю диаграмму и изображение в целости, но все же позволит мне искать / ...
2
голоса
1ответ
99 показов

Редактировать текст в изображении

У меня есть изображение JPG с текстом. Я хотел бы редактировать этот текст. В настоящее время я использую Adobe Acrobat для этой цели, однако обнаружил, что инструмент распознавания текста не ...
2
голоса
1ответ
267 показов

Программное обеспечение для "OCR" с точными пикселями из фотографии видеоигры /pixel-art?

Я ищу программное обеспечение, которое может восстановить точные пиксели по фотографии старой видеоигры или по кусочкам пиксель-арта. Целью будет повторная оцифровка цифровых изображений, которые ...
2
голоса
5ответов
2k показов

Как получить скриншот лучшего качества для оптического распознавания символов?

Я пытаюсь получить некоторые данные в текстовый файл из скриншотов. Видимо, снимки экрана не очень хорошо работают с распознаванием, потому что они имеют разрешение 75 точек на дюйм, а минимальное ...
2
голоса
1ответ
877 показов

Редактирование с возможностью поиска .pdf OCR

Мой случай довольно конкретный, поэтому я постараюсь объяснить это быстро и точно. Я должен оцифровать несколько старых листов бумаги размером 230 мм x 268 мм (~ 9 "x 27,7"), сложенных в 4 части; Вы ...
2
голоса
1ответ
147 показов

Распознавание форм с использованием OCR и возврат изображения значения

Я нахожусь на проекте, который обрабатывает сотни форм. Формы имеют согласованные форматы, но заполняются вручную разными людьми. Мне нужен способ быстро обработать все эти данные в электронном виде. ...
2
голоса
2ответа
335 показов

DjVu скрытый текст → PDF?

Есть ли способ сделать PDF только из скрытого текстового слоя файла DjVu? Я умею пользоваться djvused myfile.djvu -e 'output-txt' > myfile.dsed вывести сценарий DjVu, который включает координаты x, y ...
2
голоса
1ответ
540 показов

Adobe не может выполнить распознавание: эта страница больше максимального размера страницы 45 дюймов на 45 дюймов

Я попытался запустить инструмент распознавания текста в PDF и получить следующее сообщение об ошибке: Adobe не может выполнить распознавание (OCR) на этой странице, потому что: Эта страница больше, ...
2
голоса
1ответ
465 показов

Как конвертировать весь текст в PDF в изображение

преамбула Я писал лекции в институте на тетради. Другие написали их ручкой и бумагой (не знаю, как правильно говорить по-английски, но я думаю, что это понятно). Теперь мы должны показать наши лекции ...
2
голоса
0ответов
177 показов

Смешная OCR-ситуация

У меня есть отсканированный многостраничный PDF-файл с разрешением 300 точек на дюйм в системе Ubuntu 16.04. Когда я запускаю следующую команду: pdfocr -t -l swe -i *.pdf -o newfile.pdf В результате ...
2
голоса
3ответа
3k показов

отсканировать A4 doc> pdf> ocr> перевести на английский?

Я пытался использовать комбинацию мой домашний сканер для создания документов «300 точек на дюйм», «документ», «pdf» (параметры Canon all-in-one) ZoHoViewer для создания файла RTF или TXT Google ...
2
голоса
0ответов
989 показов

Как сжимать файлы PDF в кодировке Tesseract, сохраняя встроенный текст из OCR?

Я экспериментировал с использованием Tesseract для распознавания моих PDF-файлов, и он был в основном успешным, особенно с текстами немецкого языка Fraktur (готический шрифт старого стиля), которые ...
2
голоса
3ответа
8k показов

Что такое хорошее программное обеспечение для распознавания рукописного ввода?

Я купил ручку Livescribe, которая записывает все, что я пишу (и говорю). Тем не менее, он может дать мне только PDF-версии того, что я написал. Используя MyScript (платное расширение), я могу ...
2
голоса
0ответов
234 показов

Tesseract не может сканировать `Ошибка: поддерживаются только 1,2,4,5,6,8 бит / с: 32`

Несмотря на то, что я convert canvas.png -depth 8 canvas.tif я все еще вижу это сообщение об ошибке: Tesseract Open Source OCR Engine check_legal_image_size:Error:Only 1,2,4,5,6,8 bpp are ...
2
голоса
4ответа
6k показов

Как я могу найти несколько файлов PDF, которые имеют OCR?

У меня есть тысячи и тысячи файлов PDF, которые имеют OCR. Здорово, когда у вас есть один открытый, но я хочу иметь возможность находить PDF-файлы в папке, содержащей X. В Adobe, похоже, есть что-то ...
2
голоса
1ответ
224 показов

Как я могу портировать текстовый слой из одного PDF в другой? (в окнах)

У меня есть несколько файлов в формате .djvu, размер которых невелик, но, к сожалению, mi e-reader не может их отобразить. Я использую DjvuToy, чтобы преобразовать его в PDF, и он сохраняет небольшой ...
2
голоса
2ответа
1k показов

Скопируйте изображение и вставьте в OCR

Запуск Win 7. Есть ли бесплатное программное обеспечение для распознавания текста, которое позволяет легко скопировать изображение и вставить его в программу преобразования? В данный момент у меня ...
2
голоса
1ответ
50 показов

Каков наилучший метод для работы с текстом JPEG?

У меня относительно простая графика; техническая схема с различными частями текста. Текст на другом языке (чешский / словацкий). Он напечатан достаточно четко, чтобы его можно было точно распознать и ...
2
голоса
2ответа
2k показов

Могу ли я заставить Acrobat Professional заменить выбранное изображение с помощью распознавания текста текстом?

У меня есть книга, которую я хочу прочитать на экране. Он сканируется в монохромном режиме с разрешением 200 точек на дюйм (я до сих пор не знаю, что пошло не так в драйвере сканера, я помню, что ...
2
голоса
1ответ
716 показов

OCR PDF на основе изображений

Возможный дубликат: Извлечение текста из.PDF отсканированная книга Как сделать OCR на PDF-документе? У меня есть руководство в формате> 200 страниц, которое было создано путем сканирования печатной ...
2
голоса
2ответа
3k показов

Сканирование иврита

Какие программы и ресурсы OCR доступны для сканирования текста на иврите и идише? Одна программа на ответ, пожалуйста, включите следующее: Цена Ссылка для скачивания или покупки сайта Работает ли ...
2
голоса
1ответ
4k показов

Общие сведения о параметрах распознавания текста в Adobe Acrobat: "Изображение с возможностью поиска", «Изображение с возможностью поиска (точное)» и "Редактируемый текст и изображения"

В Adobe Acrobat (я использую Pro DC, если это имеет значение) есть три варианта OCR: "Поиск изображений". "Доступное для поиска изображение (точное)". "Редактируемый текст и изображения". Каковы ...
1
голос
1ответ
2k показов

Как заставить OCR распознавать это изображение

исходное изображение Я думаю, что распознать цифры из этого изображения было бы действительно легко, но это не может быть распознано тессерактом и большим количеством онлайн-распознавания текста. ...
1
голос
0ответов
803 показов

Переименование PDF-файла (отсканированного документа) с помощью OCR. Следует прочитать 3 зоны и переименовать соответственно. например, Streetname_LastName_Date.pdf

У меня проблемы с тоннами документов. Я хочу, чтобы он оцифровывался, чтобы упростить поиск и, следовательно, сократить огромное количество времени, затрачиваемого на поиск документов. Это довольно ...
1
голос
4ответа
1k показов

Автоматизируйте чтение номеров лото

Когда мы покупаем большое количество билетов в лото, есть ли способ прочитать все эти числа в электронную таблицу, чтобы их можно было сравнить с выигрышными числами через формулы / макросы? Я ищу ...
1
голос
0ответов
413 показов

OCR, установив шрифт

У меня есть изображения, на которых есть такие шрифты, как Lucida Handwriting. Так как они слишком строги, мое программное обеспечение OCR не распознает их правильно. Есть ли способ сообщить ...
1
голос
1ответ
327 показов

Программное обеспечение OCR для Windows, с поддержкой не английского языка

Точно, я хотел бы найти программное обеспечение OCR, которое может конвертировать файлы PDF и изображения в текст. Также он должен поддерживать "венгерский" язык. Я пытался осмотреться в поисках ...
1
голос
1ответ
181 показов

OCR и слой текста в формате PDF

Я хочу, чтобы OCR PDF, чтобы сделать его для поиска. Предположим, у вас есть документ PDF, который был сделан с помощью сканера или иным образом состоит из данных изображения, но не содержит ...
1
голос
1ответ
1k показов

Сканирование, распознавание текста и добавление отсканированных номеров

Мне нужно отсканировать сотни страниц с номерами, написанными на них в правом нижнем углу. После сканирования - мне нужно программное обеспечение OCR, чтобы распознать число, написанное в правом ...
1
голос
1ответ
3k показов

Удаление нетекстового текста из отсканированного файла OCRd PDF

У меня есть PDF, созданный из отсканированного документа. OCR был использован для распознавания текста. В Acrobat, если я выделю текст и нажму «копировать с форматированием», я могу вставить ...
1
голос
2ответа
110 показов

Могу ли я восстановить исходное изображение текста после обработки Adobe OCR?

Кто-то использовал (возможно) функцию распознавания Adobe Professional для распознавания отсканированного файла PDF. Результат OCRed имел некоторые ошибки, и он добавил текстовый результат обратно к ...
1
голос
0ответов
456 показов

Отключить словарь в Tess4J

Точность распознавания символов в моем приложении tess4j OCR очень низкая. Я слышал, что отключение словаря в tess4j повысит точность, позволяя распознавать отдельные символы. Но я не знаю, как это ...
1
голос
1ответ
966 показов

OCR PDF Разобрать выделенную область

У меня есть много документов баланса счета, мне нужно создать файл Excel из таблицы внутри этих документов. Я могу продолжить обычное распознавание OCR, но основная проблема заключается в том, что в ...
1
голос
1ответ
137 показов

Adobe Pro OCR для не сканируемых презентаций со встроенными текстовыми изображениями

Я пытаюсь использовать функцию распознавания текста в Adobe Pro (2015) для захвата всего текста в презентации. Презентация происходит в PowerPoint. Если я распечатаю презентацию и отсканирую ее, я ...
1
голос
2ответа
3k показов

Стороннее программное обеспечение для анализа (OCRing) чеков?

Мне нужно организовать большое количество отсканированных квитанций. Квитанции сканируются в формате PDF, и мне нужно программное обеспечение, которое будет интеллектуально просматривать документ и ...
1
голос
1ответ
1k показов

Отображение данных из документа OCR'd в поля формы

Есть ли способ автоматически взять данные из определенного места в документе и вставить их в определенное поле формы? Все документы соответствуют одному из двух стандартных форматов: и ...
1
голос
1ответ
142 показов

Распознавание текста на страницах, содержащих как текст, так и изображения в Acrobat XI Pro

Почему Acrobat XI Pro не позволяет сканировать с помощью оптического распознавания текста на страницах, содержащих изображения и визуализируемый текст? Образец PDF на скриншоте был создан из ...
1
голос
0ответов
543 показов

Будет ли извлекать жестко запрограммированные субтитры, как эта работа?

У меня есть mp4 с жестко закодированными субтитрами, и я хочу сделать файл SRT. Я пытался использовать программное обеспечение для распознавания видео AviSub. Время было правильным, но само слово ...
1
голос
0ответов
51 показов

Какой формат лучше всего подходит для захвата экрана при подготовке к распознаванию?

В каком формате должен быть сделан снимок экрана (png, tiff, pdf), чтобы получить лучшее распознавание текста? Некоторые пакеты OCR выполняют OCR для png или tiff, чтобы извлечь текст перед ...
1
голос
0ответов
38 показов

Как я могу получить изображение текста, где я могу указать шрифт (файл TFF)?

Есть ли какой-нибудь способ быстро переписать большой объем текста странным шрифтом (например, что-то вроде BulletMix: https://www.fontstock.net/4041/bulletmix.html)? У меня есть доступ к фотошопу, ...
1
голос
1ответ
869 показов

В jTessBoxEditor for Tesseract, как объединить несколько файлов TIFF/boxfile в один файл с обученными данными

Я думаю, что это было бы возможно с командной строкой, но как это сделать с помощью jTessBoxEditor, поскольку это автоматизировало бы большую часть рабочего процесса. Поскольку jTessBox поддерживает ...
1
голос
1ответ
2k показов

Можно ли вызвать Acrobat из командной строки для выполнения OCR?

В настоящее время у меня есть AppleScript, который работает в папке и загружает мою машину, пока она работает. Я хочу быть в состоянии сделать это без вмешательства интерфейса. Есть идеи? Благодарю.
1
голос
2ответа
4k показов

Как искать в PDF, где текст просто изображение?

В PDF нужно искать текст, но это просто изображение, поэтому оно не знает символов. Я пытался сделать OCR для PDF, но не разбираюсь в необходимых программах. Я пробовал Foxit Reader, но в последней ...
1
голос
0ответов
680 показов

Applescript + pdfpen для ocr для нескольких файлов: как двигаться дальше, когда pdfpen зависает

Я использую следующий AppleScript для пакетной обработки PDF-файлов для ocr: tell application "Finder" set target_folder to target of front Finder window repeat with i from 1 to count (every folder ...
1
голос
1ответ
1k показов

Применение метаданных к файлам на основе распознавания их содержимого

По сути, я ищу инструмент (Windows/Mac), который позволит мне следующий рабочий процесс: Сканирование ВСЕХ моих документов в папку (200-300 отсканированных изображений) запустить инструмент, который ...
1
голос
0ответов
81 показов

Извлечение PDF-данных с использованием категорированных аннотаций

Существуют ли какие-либо инструменты для извлечения данных из файлов PDF с использованием этого метода. Допустим, у меня есть 3 категории Изображение - это будет прямоугольная аннотация, которая ...
1
голос
2ответа
4k показов

При выполнении распознавания Adobe Acrobat для PDF-документа какая понижающая дискретизация обеспечивает более высокое качество: 600 т / д или 72 т / д?

У меня есть большой PDF-документ, который состоит из отсканированных страниц учебника. Я хочу запустить на нем функцию распознавания текста в Adobe Acrobat 9, но мне предоставляется это меню, когда я ...
1
голос
0ответов
180 показов

Пакетно-оптические скриншоты и сохранение их содержимого в метаданных?

В течение довольно долгого времени я искал способ сделать скриншоты доступными для поиска на моем Mac. Есть ли способ их пакетного распознавания, а затем сохранения текста с изображением или ...
1
голос
0ответов
208 показов

Как распечатать документ с таблицей и экспортировать в текст (с правильным текстом влево / вправо / вверх / вниз)?

У меня есть документ со многими страницами, которые имеют столбчатые таблицы, подобные следующим. #1 2.1 This is some text. It can go onto the next line like this. #2 1.3 More text. #3 3.2 And some ...