Итак, у меня есть набор данных, который я хочу использовать для своей нейронной сети.

Проблема в том, что в наборе данных есть файлы, которые были изначально.BMP, но благодаря сценарию, который я использовал, они были преобразованы в.JPG

Я пытаюсь выяснить, как избавиться от этих файлов автоматически, поскольку я имею дело с большим количеством данных, и сделать это вручную невозможно.

Их очень легко обнаружить в проводнике (миниатюра не загружается, а просто говорит JPG), но я не могу найти автоматизированный способ сделать это.

Пожалуйста помоги.

1 ответ1

1

Вы можете использовать команду ImageMagick «определить», чтобы отделить растровые файлы. Остальное должно быть более или менее простым скриптовым упражнением, чтобы просмотреть ваши файлы и удалить нужные - или, возможно, переместить их в отдельный каталог, где вы можете проверить их перед удалением, чтобы убедиться, что вы получили только те, от которых хотели избавиться ,

https://www.imagemagick.org

ImageMagick довольно кроссплатформенный и хорошо документированный онлайн. Вот пример вывода (изнутри Ubuntu):

anlag@jansson:~/Downloads/img$ identify lena_gray.bmp 
lena_gray.bmp BMP3 512x512 512x512+0+0 8-bit sRGB 256c 263KB 0.000u 0:00.000
anlag@jansson:~/Downloads/img$ identify photo.jpg 
photo.jpg JPEG 127x127 127x127+0+0 8-bit sRGB 7.51KB 0.000u 0:00.000

Вы бы проанализировали вывод для строки "BMP3" и обработали бы соответственно. Сам сценарий может быть выполнен любым удобным для вас инструментом: сценарий Windows cmd.exe, Python, bash и т.д. Если вам тоже нужна рука с этой частью, лучше указать некоторую дополнительную информацию о том, какая ОС и программное обеспечение вы используете (в частности, язык сценариев / инструмент).

PS. Я ссылался на ImageMagick, поскольку он кроссплатформенный, но если бы вы использовали Linux, команда «file» выдаст эквивалентную информацию для этого варианта использования.

anlag@jansson:~/Downloads/img$ file lena_gray.bmp 
lena_gray.bmp: PC bitmap, Windows 3.x format, 512 x 512 x 8
anlag@jansson:~/Downloads/img$ file photo.jpg 
photo.jpg: JPEG image data, JFIF standard 1.01, resolution ...

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .