У меня есть около 1 миллиона изображений (организованных в каталогах), которые мне нужны, чтобы попасть в S3. Я начал использовать s3sync.rb, но поскольку он создан для синхронизации, он создает тонны дополнительных файлов для отслеживания вещей. Мне это не нужно или не нужно - просто нужно загрузить его один раз.
Затем я попробовал s3cmd (версия на python), которая имеет опцию --recursive для простого ввода. Проблема в том, что он пытается обработать все загружаемые файлы заранее (по крайней мере, так это выглядит в режиме отладки), что не работает для количества файлов, которые у меня есть.
Я подумываю попробовать что-то вроде bucket explorer или s3fox, но я боюсь тратить кучу времени и только на полпути.
Любые рекомендации, пожалуйста?
Редактировать: мне известны некоторые варианты монтирования s3, но у меня не было хорошего опыта с s3fs. Будет ли jungledisk хорошо работать с большим количеством файлов? Кроме того, эти программы, как правило, создают дополнительные файлы, которые я бы предпочел не иметь.