2

Цель: мне нужно найти способ объединить несколько полисов страхования жилья и авто, приобретенных Застрахованным (он же, держатель полиса), и назначить эти полисы одной учетной записи клиента для этого Застрахованного.

Проблема: у меня более 100 тысяч записей политики. Застрахованный может приобрести один или несколько полисов, но в настоящее время каждому полису присваивается уникальный номер учетной записи клиента, даже если эти полисы принадлежат одному и тому же Застрахованному. Кроме того, по способу ввода информации в базу данных я не могу просто сгруппировать политики по имени, адресу или другому значению застрахованного в других полях без интенсивного ручного вмешательства, поскольку информация может вводиться по-разному в каждом поле для тот же Застрахованный (например, Смит, Дж. против Смита, Джеймс или Хайленд 1000 Е, Сак, Калифорния против Ист-Хайленд, Сакраменто, Калифорния).

Вопрос: Кто-нибудь знает инструмент / утилиту (надеюсь бесплатную), которую можно использовать для опроса записей и, с помощью какого-то "нечеткого" алгоритма, группирует эти записи политики более 100k в группу, связанную с данным застрахованным?

0