Мои данные выглядят так:

У меня 500 компаний, i - идентификатор для каждой компании, t - период времени (1-5000) для всех компаний, r - доход, а mktcap - рыночная капитализация.
Данные идут от t = 1-5000 для одной компании, затем от t = 1-5000 для следующей компании и т.д.
Как бы я сделал эти вещи:
Суммируйте все возвраты (или сделайте некоторую другую простую арифметику) за любой определенный период времени
t.Найдите квантиль 5% для возвратов в каждом периоде времени (т.е. доход, при котором 95% возвратов выше для этого периода времени
t)создайте другую строку, которая = 1, если возвращение в этой строке ниже этого
квантиль, и 0 в противном случае (поэтому = 0, если доход в этой строке находится в верхних 95% возвратов за период времениt)
