У меня есть таблица, которая выглядит примерно так:

Full Name    |      Email          |      Phone Number
---------          -------               -----------
Billy Bob          bob@gmail.com          8019929102
Sally Sue          sue@gmail.com          8013439403
Billy Bob                                 8013432343
                   bob@gmail.com
Sally Sue
Joe So             joe@gmail.com

Я хочу удалить дубликаты на основе электронной почты и сохранить строку, которая содержит наиболее полные данные (большинство заполненных столбцов). После того, как я отправлю электронное письмо, я буду искать дубликаты на основе полного имени, а затем номера телефона и т.д.

Это будет сделано почти на 500 000 строк данных.

1 ответ1

0

Добавьте вспомогательный столбец, который подсчитывает количество полей. Тогда вы можете выделить дупс.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .