У меня есть электронная таблица со столбцом данных о названиях компаний, другой столбец с указанием количества сотрудников в компании и другой столбец, который классифицирует компанию по коду SIC, например:
Company Employees SIC Code
A 5 2011
B 10 2011
C 15 7374
D 11 7374
E 77 6733
F 44 6733
(Это просто упрощенная версия; у меня несколько кодов SIC и тысячи замечаний компании). По сути, я хочу классифицировать компании в соответствии с их процентным рангом по количеству сотрудников в каждой группе кодов SIC. Например, для кода SIC 2011 я хотел бы выяснить, какие компании выше 99-го процентиля для сотрудников; то же самое для кода SIC 6733 (и так далее). Получать процентили для наблюдений по группам кажется простым, но у меня проблемы. Любая помощь будет оценена.