У меня есть проект на работе, где моя задача - выделить дубликаты на электронной таблице. Таким образом, в основном у меня есть таблица из 50 000 строк, заполненная данными, и в одном столбце есть названия компаний, однако эти имена не являются абсолютно одинаковыми, некоторые имена являются дубликатами, но имеют одно незначительное отличие, когда нет условной формулы для дубликатов. удалось уловить различия. Так, например, дубликат, который я должен был бы отметить для удаления, был бы "JP Morgan" и "JP Morgan", и, таким образом, 2 периода в последнем случае - это то, что в формуле листа, которую я включил, не выделяет Разница между двумя. До сих пор я пытался уловить различия вручную, но должен быть лучший и более эффективный способ. Есть ли какая-нибудь формула, которую я могу подключить, которая может выявить тонкие различия и выделить возможные дубликаты?

1 ответ1

0

То, что вы ищете, это возможность "Нечеткого поиска". Есть надстройка для Excel:

Надстройка нечеткого поиска для Excel.

Также есть нечеткие надстройки для поиска в Google Sheets:

Как работать с надстройкой Find Fuzzy Matches для Google Sheets

Найти нечеткие совпадения

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .