каждый. Может кто-нибудь, пожалуйста, помогите мне со следующим? Любые указатели или помощь приветствуется!
У меня есть подмножество набора данных с +500 000 строк, которое выглядит так
|— Group —|— Name —|— Value1 —|— Value2 —|
В каждой группе я пытаюсь определить имена в верхнем 5 и верхнем 10 процентиле значения 1, чтобы можно было вычислить сумму значения 2 для каждого из идентифицированных процентилей.
До сих пор я был в состоянии создать сводную таблицу, которая выглядит следующим образом.
|----------|--Sum Val1--|--Sum Val2--|
|--GroupA--|----------| Totals for GroupA
|----------|-Name A1--| Values.......
|----------|-Name A2--| Values.......
...
|----------|-Name An--| Values.......
|--GroupB--|----------| Totals for GroupB
... Values.......
|--GroupZ--|----------| Totals for GroupZ
Я мог бы определить процентили вручную, но я думаю, что есть более простой способ. Я провел несколько поисков того, как действовать, но я только сталкиваюсь с процедурами, чтобы найти процентили среди всего набора данных.