Мои данные выглядят так:
У меня 500 компаний, i
- идентификатор для каждой компании, t
- период времени (1-5000) для всех компаний, r
- доход, а mktcap
- рыночная капитализация.
Данные идут от t
= 1-5000 для одной компании, затем от t
= 1-5000 для следующей компании и т.д.
Как бы я сделал эти вещи:
Суммируйте все возвраты (или сделайте некоторую другую простую арифметику) за любой определенный период времени
t
.Найдите квантиль 5% для возвратов в каждом периоде времени (т.е. доход, при котором 95% возвратов выше для этого периода времени
t
)создайте другую строку, которая = 1, если возвращение в этой строке ниже этого
квантиль, и 0 в противном случае (поэтому = 0, если доход в этой строке находится в верхних 95% возвратов за период времениt
)