У меня есть список подписей с большим количеством почти дубликатов. Например:
- Ей день рождения
- На день рождения
- День рождения - для нее
- Для нее / день рождения
Я искал в Fuzzy Lookup, как способ выделить эти почти дубликаты
У меня есть список подписей с большим количеством почти дубликатов. Например:
Я искал в Fuzzy Lookup, как способ выделить эти почти дубликаты
Надстройка нечеткого поиска для Excel выполняет нечеткое сопоставление текстовых данных в Excel.
Надстройка нечеткого поиска для Excel была разработана Microsoft Research и выполняет нечеткое сопоставление текстовых данных в Microsoft Excel.
Его можно использовать для идентификации нечетких дублирующихся строк в одной таблице или для нечеткого соединения похожих строк между двумя разными таблицами. Соответствие устойчиво к широкому кругу ошибок, включая орфографические ошибки, сокращения, синонимы и добавленные / отсутствующие данные.
Например, он может обнаружить, что строки «Mr. Эндрю Хилл »,« Хилл, Эндрю Р. »и« Энди Хилл »относятся к одному и тому же базовому объекту, возвращая оценку сходства вместе с каждым совпадением.
Хотя конфигурация по умолчанию хорошо работает для широкого спектра текстовых данных, таких как названия продуктов или адреса клиентов, соответствие может быть также настроено для конкретных доменов или языков.
Исходная нечеткая надстройка поиска для Excel
Выполнение нечетких поисков в Excel имеет несколько советов по настройке порога подобия.