2

У меня есть набор данных, содержащий 3 столбца.

  1. Персональный идентификационный номер
  2. сфера занятости
  3. месячный опыт работы в данной сфере занятости

У меня есть большое количество дубликатов, где человек имеет опыт работы в двух или более сферах занятости. Я хочу сузить свой набор данных, чтобы ни у одного личного удостоверения не было дубликатов. Критериями являются сфера занятости, где человек имеет наибольший опыт.

Мой набор данных выглядит так:

a                             b                 c
teacher                       ID99999           38 
teachers assistant            ID99999           6

2 ответа2

1

Вы можете сделать это, используя вспомогательный столбец в столбце D.

  1. Введите эту формулу массива в D2: =IF($C2=MAX(IF($A2=$A$2:$A$20,$C$2:$C$20,-1)),"Remain","Remove")

Примечание: введите формулу с помощью Ctrl+Shift+Enter и заполните.

  1. Отфильтруйте столбец D по "Удалить".

  2. Наконец, удалите отфильтрованные строки.

Эта формула найдет максимальное количество месяцев опыта в столбце C для повторяющихся идентификаторов и пометит эти строки как "Оставить". Другие строки с одинаковыми идентификаторами помечены как "Удалить".

0

Сортировать столбец C от наибольшего к наименьшему.

Теперь удалите дубликаты из вкладки «Данные» -> «Удалить дубликаты» на основе столбца B.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .