В настоящее время я застрял в том, что казалось легкой задачей. Я работал над сценарием Python, который находит определенные файлы в папке «Загрузки» и помещает их в другую подпапку в другой папке. Затем он преобразует PDF-файлы в указанной папке в текстовые файлы, так как я буду извлекать информацию из файлов (и с TXT работать намного проще).
Теперь я застрял в следующей части: у меня ~ 600 файлов (и их будет еще больше), и я хочу объединить файлы на основе имени файла. Вот как имена файлов отформатированы ...
- Txt_BI_ProfilesBI_Profile_Export_BB+Generic_August+2016_GGP_20170316.pdf
- Txt_BI_BrofilesBI_Profile_Export_BB+Generic_August+2016_GGP_20170316.pdf (1)
- Txt_BI_ProfilesBI_Profile_Export_Search_20170228.pdf
- Txt_BI_ProfilesBI_Profile_Export_Search_20170228.pdf (1)
Обратите внимание, что существуют файлы, которые имеют общее имя файла, но различаются с помощью .pdf(1). Мне нужен сценарий powershell или bash, который группирует и объединяет файлы в консолидированные текстовые файлы на основе сходства имен файлов.
Итак, учитывая имена файлов выше, я хочу объединить весь контент в
'TxtBI_ProfilesBI_Profile_Export_BB+Generic_August+ 2016_GGP_20170316.pdf' + 'Txt_BI_ProfilesBI_Profile_Export_BB+Generic_August+ 2016_GGP_20170316.pdf (1)' в PDF-файл (1)'в PDF-файл (1)' GG + PDF
и то же самое касается «Поиск». Для групп «BB +Generic_August +2016_GGP» и «Поиск» существует до примерно «.pdf(40)» разных файлов, и существует около 10 или более разных групп файлов с одинаковыми именами файлов. Я написал скрипт на python, который пытается сделать это здесь, но все, что он делает, это разделяет имена файлов [33:] и filenames.rsplit('', 1) [0] (разделяет после символа 33 и последнего '_') и не объединять их в консолидированные файлы, как я упоминал выше. Могу ли я сделать это с PowerShell или Bash? Так, что он разбивает имена файлов (как указано выше), а затем объединяет их, если они содержат одинаковое текстовое имя файла?
Я думал, что это будет очень легко, но это не работает для меня. Если у кого-то есть идеи / идеи / предложения о том, как к этому подойти, я был бы очень признателен! Раньше использовали bash для unix, но это было давно. Я пойду с тем, что наиболее практично! Еще немного новичка, когда дело доходит до программирования ....