У меня есть большая (1,7 миллиона строк) таблица данных о продажах на листе в Excel, многие записи которой идентичны, кроме уникального идентификатора и отметки времени. Я хотел бы объединить эти данные путем объединения строк, которые являются дубликатами по моим стандартам (то есть только уникальные по параметрам, которые меня не интересуют).
Одного этого можно почти достичь, используя функцию «удалить дубликаты», но я говорю «объединить», потому что мне также хотелось бы, чтобы результат суммировал один из столбцов, который представляет, сколько элементов было частью этого конкретного порядка.
Я собираюсь перейти от чего-то вроде этого:
A | B | C | D | E | F | “OldSheet”
OID | Client | Program | Count | Status | Time |
436266 | Initech | SEO | 1 | Invoiced| 00:52 |
436267 | Initech | SEO | 2 | Invoiced| 01:12 |
436269 | Initech | SEM | 1 | Invoiced| 04:52 |
436268 |Initrode | SEO | 1 | Invoiced| 02:22 |
436269 | Initech | SEM | 3 | Invoiced| 04:52 |
, , , что-то вроде этого:
OID | Client | Program | Count | Status | Time | “NewSheet”
...... | Initech | SEO | 3 | Invoiced| ..... |
...... | Initech | SEM | 4 | Invoiced| ..... |
...... |Initrode | SEO | 1 | Invoiced| ..... |
На эту таблицу в конечном счете ссылаются несколько сводных таблиц, поэтому она должна поддерживать один и тот же формат.