У меня есть таблица, которая выглядит примерно так:
Full Name | Email | Phone Number
--------- ------- -----------
Billy Bob bob@gmail.com 8019929102
Sally Sue sue@gmail.com 8013439403
Billy Bob 8013432343
bob@gmail.com
Sally Sue
Joe So joe@gmail.com
Я хочу удалить дубликаты на основе электронной почты и сохранить строку, которая содержит наиболее полные данные (большинство заполненных столбцов). После того, как я отправлю электронное письмо, я буду искать дубликаты на основе полного имени, а затем номера телефона и т.д.
Это будет сделано почти на 500 000 строк данных.