Я работаю над таблицами Excel, которые имеют дубликаты. Я должен удалить дубликаты из loc 3 и 4 (столбцы 4 и 5), основываясь на самой ранней дате начала и самой последней дате окончания. Дубликаты из loc 1 и 2 (столбцы 2 и 3) НЕ ДОЛЖНЫ быть удалены. Например, Tylenol и Pepcid в следующем: должны быть удалены только дубликаты с Да в Loc 3 и 4 с самой ранней датой начала и самой последней датой окончания (см. Желаемый результат). У меня есть много сложных таблиц, чтобы сделать это. У кого-нибудь есть предложения?
1 ответ
Я бы использовал Power Query для этого. Power Query - это бесплатная надстройка от Microsoft для Excel 2010 и 2013, которая встроена в Excel 2016 на ленте данных в разделе Get & Transform.
Power Query может читать из таблиц Excel или именованных диапазонов. Он имеет функцию Group By, которая может вычислять минимальные и максимальные значения для ваших требований начальной и конечной даты.
Для вашего требования условной группировки я бы добавил столбец к дизайну Power Query, чтобы сгруппировать, например,
if [Loc 3] = "Y" or [Loc 4] = "Y" then "Y" else "N"
Затем я сгруппировал бы по этому столбцу и вычислил максимум Loc 3 и Loc 4.