У меня есть XML-документ, который выглядит так:

Столбцы от A до S с заголовками, и в них 1922 строки.

Это резервная копия некоторых SMS, и я хочу избавиться от дубликатов.

Проблема в том, что время в заголовке readable_date испорчено. В дате нет ничего плохого, но время на часах неверное, поэтому я разделил этот столбец на три: год, день и часы.

Я знаю, что могу использовать стандартный фильтр, но он ищет только уникальные строки в одном столбце. То, что я хочу выполнить, это сделать проверку строки, подобную этой:

F(x) = Проверить, равен ли столбец 2A (бесконечность) столбцу 3A (бесконечность), но игнорировать столбец (R). Если «Истина», то удалить столбец 3А, чтобы (бесконечность). В противном случае проверьте, чтобы столбец ЕС 2А (бесконечность) был равен столбцу 4А (бесконечность) и т.д.

Мне нужно каждый раз игнорировать определенный столбец в строке, и мне нужно сделать это для полного листа. И проверка формулы должна применяться к каждой строке, когда первая проверка завершена на наличие дубликатов ...

Если у кого-то есть лучшее решение, скажите, пожалуйста. В любом случае, кто-нибудь может помочь?

Вы правы, что я обычно так поступаю, но для действительно коротких сообщений это не относится, так как сообщение "Эй" может быть отправлено несколькими людьми или одним человеком за несколько дней, и это не является дубликатом.

Строки должны быть полностью проверены с первой попытки, и игнорировать определенный столбец, в противном случае он возвращает ложное срабатывание или ложное отрицание ...

1 ответ1

0

Я не большой специалист по базам данных, но если вы откроете файл в Excel, вы можете выбрать все столбцы и отсортировать их, скажем, по az в столбце, в котором есть реальное сообщение, и просто просмотреть этот столбец после сортировки, удалив дубликаты. Конечно, вам нужна формула для этого, но просто интересно, будет ли это быстрее, чем пытаться выяснить формулу LOL. Извините, если я не помог вам.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .