Общий вопрос влечет за собой сортировку большого списка Excel 2007, чтобы найти записи, которые соответствуют меньшему списку подмножеств.
У меня есть пара идей о том, как подойти к проблеме, но мне не хватает технической сложности для реализации этих идей. Я опишу мое конкретное требование к прецедентам, чтобы прояснить вопрос.
Конкретный пример:
У меня есть основной список названий компаний, которыми я управляю для своей территории продаж (приблизительно 1000 учетных записей клиентов). Каждую неделю моя компания публикует список всех сделок, совершаемых по всем территориям продаж в США (моя и сотни других территорий). Этот журнал транзакций содержит более 10000 строк, поэтому сканирование на глаз, чтобы найти транзакции, связанные с моими аккаунтами, практически невозможно.
Мое текущее неадекватное решение состоит в том, чтобы выделить мой список учетных записей желтым, скопировать этот выделенный список, затем вставить этот выделенный список внизу еженедельного журнала транзакций, затем отсортировать AZ, а затем прокрутить вручную до выделенных элементов. Если журнал транзакций содержит одну из моих учетных записей, запись в журнале транзакций будет находиться непосредственно над или под выделенной мной записью. Этот метод эффективен, но чрезвычайно трудоемкий.
Я знаю, как устранить дубликаты в Excel. Есть ли способ устранить все, НО дублирует? Это облегчит визуальное сканирование списка.
Другая проблема остается, потому что несогласованность данных ограничивает использование простых макросов, фильтров или кнопки "найти дубликаты". Имена журналов транзакций часто пишутся немного иначе, чем в моем основном списке.
Ex: Acme Widget Company, Inc.; Acme Widget Inc; Acme Widget; Ex: United States Hand-ball Organization; U.S. Handball Org; U S Handball; USHO
Я знаю, что есть некоторые сторонние приложения, которые могут использовать нечеткую логику для сопоставления неточных записей. Однако я не могу запустить плагины на своем корпоративном компьютере. (Если нет очень убедительного случая ...)
Существует ли макрос, который может «нормализовать» журнал транзакций, исключая пробелы и знаки препинания? Существует ли макрос, который может соответствовать первому числу символов Х (больше символов = более высокая точность, но больше шансов пропустить почти повторяющуюся запись ...)? Есть ли макрос, который может вывести или отфильтровать полученный список совпадений?
Если эти задачи слишком сложные, у меня гораздо более простая идея. После слияния моего выделенного списка учетных записей в журнал транзакций было бы неплохо иметь возможность скрыть все остальные строки журнала транзакций, которые меньше чем на 5 строк выше или ниже моих выделенных элементов. Это дало бы некоторую гибкость для нестандартных написаний, но значительно упростило бы задачу визуального осмотра по списку.
Любая информация о том, как реализовать эти идеи - или совершенно разные подходы - будет принята с благодарностью. Я думаю, что общий ответ на этот вопрос будет ценным для других, за исключением узкого варианта использования, который я описал.
Спасибо!