Я работаю в социальных сетях для своей компании и хочу посмотреть статистическое распределение постов в Твиттере. Зависимой переменной является коэффициент вовлеченности (определяется как%), а различными независимыми переменными могут быть час дня, день недели, количество используемых хэштегов и т.д.
У меня есть экспорт в Excel со всеми моими твитами, по одной строке на твит, со столбцами, показывающими переменные. У меня был смешанный успех, и я получил правильное функционирование сюжета Box и Whisker. Нужно ли мне переформатировать мои данные? Если так, то как? Если нет, что я делаю не так?
Например, мои данные могут выглядеть так:
HOUR OF DAY ENGAGEMENT %
08 1.02
17 0.98
12 1.88
Но сюжет коробки не такой :(Twitter Hour of Day Picture
Я смог взломать версию для Day of Week, но это потребовало от меня ручного переупорядочения первых нескольких строк, чтобы получить ось x в строке для Mon, Tue, Wed и т.д.
DAY ENGAGEMENT %
Thu 0.89
Mon 2.02
Tue 1.69
etc.
Любая помощь будет принята с благодарностью!