3

У меня есть огромный список данных в Excel (250 000+ строк) в следующем формате:

Number  Value1  Date            Value2
40325   1       21/01/11 18.10  2
65485   3       22/01/11 16.47  2
40325   9       25/01/11 19.00  0
70912   8       27/01/11 16.43  2

Мне нужно удалить дубликаты строк на основе столбца 1 (номер), и у меня нет проблем с этим, используя «Данные / Удалить дубликаты» в Excel, но мне нужно убедиться, что я удалил строку с самой старой датой и сохранил самую новую на основе столбца 3 (Дата).

В приведенном выше примере мне нужно удалить строку 1 и оставить строку 3, поскольку строка 3 является самой новой.

У меня 4.800 строк с дубликатами, поэтому ручная сортировка / удаление будет очень трудоемкой работой.

Есть хорошие предложения? И уловки, чтобы помочь мне? Заранее большое спасибо :)

1 ответ1

6

Хитрость заключается в том, чтобы отсортировать таблицу перед использованием Remove duplicates . Excel всегда сохраняет первый набор данных дублированной строки. Все последовательные строки удаляются.

В твоем случае:

  1. Установите вспомогательный столбец и заполните его числовыми значениями. Начните с 1 и используйте автозаполнение до конца нашей таблицы

  2. Убедитесь, что ваш столбец даты отформатирован как дата, а Excel распознает их как дату. В противном случае ваша сортировка не будет работать

  3. Выберите Custom sort (зависит от вашей версии Excel). Сортируйте всю таблицу по столбцу даты от самого нового до самого старого. Это важная часть

  4. Используйте Remove duplicates и выберите только свой столбец « Число», в котором содержатся ваши критерии для поиска дубликатов. Отмените выбор всех остальных столбцов

  5. Снова выберите « Custom Sort и отсортируйте таблицу по столбцу «Помощник», который мы добавили в начале, чтобы вернуть исходный порядок строк.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .