2

каждый. Может кто-нибудь, пожалуйста, помогите мне со следующим? Любые указатели или помощь приветствуется!

У меня есть подмножество набора данных с +500 000 строк, которое выглядит так

|— Group —|— Name —|— Value1 —|— Value2 —|

В каждой группе я пытаюсь определить имена в верхнем 5 и верхнем 10 процентиле значения 1, чтобы можно было вычислить сумму значения 2 для каждого из идентифицированных процентилей.

До сих пор я был в состоянии создать сводную таблицу, которая выглядит следующим образом.

           |----------|--Sum Val1--|--Sum Val2--|
|--GroupA--|----------|     Totals for GroupA
|----------|-Name A1--|     Values.......
|----------|-Name A2--|     Values.......
    ...
|----------|-Name An--|     Values.......
|--GroupB--|----------|     Totals for GroupB
    ...                     Values.......
|--GroupZ--|----------|     Totals for GroupZ

Я мог бы определить процентили вручную, но я думаю, что есть более простой способ. Я провел несколько поисков того, как действовать, но я только сталкиваюсь с процедурами, чтобы найти процентили среди всего набора данных.

1 ответ1

1

Как настроена ваша сводная таблица, применение 10 лучших фильтров к Names позволит найти главные Names в каждой Group . Если вы хотите найти главные Names целом, вы должны поместить поле « Names перед полем « Group .

Вот макет, который я сделал:

оригинал

Когда я фильтрую для Топ-2 Names:

Лучшие 2 Имена

Когда я ставлю Names в качестве верхнего поля, а затем фильтрую для Верхних 2:

Исправленные 2 имени


Как предлагается в комментариях, вы также можете добавить вспомогательные столбцы к исходным данным, которые рассчитывают влияние каждой строки, а затем определить, входит ли он в Топ-10 и вернуть ИСТИНА / ЛОЖЬ. Затем вы можете применить фильтр к сводной таблице, чтобы показывать только те, которые имеют TRUE в этом поле.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .