У меня есть большая (1,7 миллиона строк) таблица данных о продажах на листе в Excel, многие записи которой идентичны, кроме уникального идентификатора и отметки времени. Я хотел бы объединить эти данные путем объединения строк, которые являются дубликатами по моим стандартам (то есть только уникальные по параметрам, которые меня не интересуют).

Одного этого можно почти достичь, используя функцию «удалить дубликаты», но я говорю «объединить», потому что мне также хотелось бы, чтобы результат суммировал один из столбцов, который представляет, сколько элементов было частью этого конкретного порядка.

Я собираюсь перейти от чего-то вроде этого:

   A    |    B    |    C    |    D    |    E    |    F    |    “OldSheet”
  OID   |  Client | Program |  Count  |  Status |  Time   |
 436266 | Initech |   SEO   |    1    | Invoiced|  00:52  |
 436267 | Initech |   SEO   |    2    | Invoiced|  01:12  |
 436269 | Initech |   SEM   |    1    | Invoiced|  04:52  |
 436268 |Initrode |   SEO   |    1    | Invoiced|  02:22  |
 436269 | Initech |   SEM   |    3    | Invoiced|  04:52  |

, , , что-то вроде этого:

  OID   |  Client | Program |  Count  |  Status |  Time   |    “NewSheet”
 ...... | Initech |   SEO   |    3    | Invoiced|  .....  |
 ...... | Initech |   SEM   |    4    | Invoiced|  .....  |
 ...... |Initrode |   SEO   |    1    | Invoiced|  .....  |

На эту таблицу в конечном счете ссылаются несколько сводных таблиц, поэтому она должна поддерживать один и тот же формат.

3 ответа3

1

Вот как может выглядеть решение с использованием сводной таблицы.

Для достижения табличного макета перейдите в меню «Дизайн сводной таблицы» и измените макет отчета на « Показать в табличном формате». Отключите промежуточные итоги для каждого столбца.

Не забудьте использовать SUM в поле значения "Количество", потому что у вас там числа больше 1.

0

Мне удалось выяснить это в процессе написания этого вопроса. Мое решение состояло в том, чтобы скопировать старую таблицу на новую вкладку, удалить дубликаты, основываясь только на тех столбцах, которые мне нужны, а затем поместить формулу SUMIFS() в новый столбец «count», который сравнивает каждую ячейку на старой вкладке с ячейками в столбцы, которые мне нужны, на новой вкладке и складывают числа в старом столбце «count» для каждой строки, которая соответствует всем критериям. Вот моя формула (адаптированная для примера выше):

=SUMIFS(OldSheet!D:D,OldSheet!B:B,NewSheet!B2,OldSheet!C:C,NewSheet!C2,OldSheet!E:E,NewSheet!E2)
0

Я бы использовал Power Query Add-In. Он имеет команду Group By, в которой вы можете указать столбцы группировки, а также вычислить Sum или аналогичные функции Aggregate:

http://office.microsoft.com/en-au/excel-help/group-rows-in-a-table-HA103993875.aspx

Вы можете вывести результат в новую таблицу Excel.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .