4

У меня есть список подписей с большим количеством почти дубликатов. Например:

  • Ей день рождения
  • На день рождения
  • День рождения - для нее
  • Для нее / день рождения

Я искал в Fuzzy Lookup, как способ выделить эти почти дубликаты

1 ответ1

3

Я искал в Fuzzy Lookup, как способ выделить эти почти дубликаты

Надстройка нечеткого поиска для Excel выполняет нечеткое сопоставление текстовых данных в Excel.


Надстройка нечеткого поиска для Excel

Надстройка нечеткого поиска для Excel была разработана Microsoft Research и выполняет нечеткое сопоставление текстовых данных в Microsoft Excel.

Его можно использовать для идентификации нечетких дублирующихся строк в одной таблице или для нечеткого соединения похожих строк между двумя разными таблицами. Соответствие устойчиво к широкому кругу ошибок, включая орфографические ошибки, сокращения, синонимы и добавленные / отсутствующие данные.

Например, он может обнаружить, что строки «Mr. Эндрю Хилл »,« Хилл, Эндрю Р. »и« Энди Хилл »относятся к одному и тому же базовому объекту, возвращая оценку сходства вместе с каждым совпадением.

Хотя конфигурация по умолчанию хорошо работает для широкого спектра текстовых данных, таких как названия продуктов или адреса клиентов, соответствие может быть также настроено для конкретных доменов или языков.

Исходная нечеткая надстройка поиска для Excel


Есть предложения по настройке порога подобия?

Выполнение нечетких поисков в Excel имеет несколько советов по настройке порога подобия.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .