2

Я использую Mac Office 2011 под управлением Lion.

У меня есть лист из многих тысяч строк данных с хорошими 40 или 50 столбцами. Один столбец является адресом электронной почты. Если любые две строки имеют повторяющийся адрес электронной почты, я хотел бы сохранить только одну из строк.

В идеале, когда были найдены дубликаты, по умолчанию будет сохраняться строка, которая имеет определенное значение ("Y") в определенной ячейке, если это применимо. Но даже если бы он сохранил первый или последний, это было бы улучшением.

Кроме того, может быть более двух экземпляров конкретного адреса электронной почты, поэтому решение должно быть в состоянии обрабатывать любое произвольное количество дубликатов.

Я попробовал решение, предложенное здесь - удалить дубликаты строк в Excel, когда не все столбцы одинаковы - но это ничего не сделало для меня.

Спасибо за любые предложения!

1 ответ1

2

Я не знаю Mac Excel конкретно, но я считаю, что следующий подход работает почти для всех приложений электронных таблиц:

  1. Перейти к пустому столбцу.
  2. Используйте =COUNTIF(A:A,A2) . A:A - это столбец, содержащий электронные письма, а A2 - ближайшая ячейка, содержащая электронную почту.
  3. Скопируйте упомянутую формулу на весь столбец.
  4. "1" возвращается для уникальных значений, все, что больше "1", означает дублированное значение.
  5. Сортировка по электронной почте, если вы хотите иметь дубликаты в строках в соседних ячейках.
  6. Используйте фильтр, чтобы скрыть недублированные значения (то есть скрыть 1 с) или отсортировать по убыванию нового столбца, чтобы получить все дубликаты в верхней части таблицы.
  7. Кроме того, вы можете использовать фильтр для другого столбца (содержащего "Y" или sth) для разделения электронных писем, которые вы хотите оставить, и сообщений, которые нужно удалить.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .