У меня есть несколько (~ 20) файлов Excel, и я хочу проверить, есть ли дублирующиеся данные (например, имя). Есть ли способ, которым я могу сделать это, не просматривая каждое имя каждого файла? Спасибо!
1 ответ
Я бы использовал Power Query Add-In для этого. Вы можете запустить Запрос из Папки Файлов - он импортирует все файлы в Папке Windows и может добавить все их данные вместе (при условии, что столбцы файлов совпадают). На языке M Scripting требуется несколько шагов и немного возни, но строительные блоки и дальнейшие манипуляции с данными выполняются по принципу «укажи и нажми»
Вот запись в блоге, в которой подробно описываются шаги по объединению файлов Excel:
http://dutchdatadude.com/combining-excel-files-using-power-query-for-excel/
Чтобы найти дубликаты, я бы продублировал запрос и использовал команду Group By в Power Query. Я бы сгруппировал по имени и рассчитал количество. Любая строка с Count> 1 является дубликатом. Затем вы можете вернуться к первому запросу (со всеми строками подробностей) и объединить 2-й запрос, который находит дубликаты, присоединившись к имени.