У меня есть 2 набора данных:

Один выглядит так:

1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3

Другой выглядит так:

1
3
3
1
1
3
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
2
3
2
1
1
3
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
1
1
3
2

Идея состоит в том, что первый набор меняется очень мало, он меняется только дважды, поэтому я бы сказал, что он меняется очень мало.

Второй набор варьируется немного больше, чем первый. Оба могут содержать одинаковое количество 1, 2 и 3 в конце, но важен порядок.

Проблема с дисперсией заключается в том, что она не учитывает порядок, поэтому оба набора могут иметь одинаковую дисперсию. Я пытаюсь измерить шум, если вы будете в наборе данных. Например, случайный набор 1, 2 и 3 будет в основном на 100% шумным. Список только 1 не будет шума вообще.

Это не обязательно должно быть идеально, я просто хочу объективно измерить, насколько шумными являются данные в Excel.

2 ответа2

2

Не думая об этом, я бы сделал следующее.

Формула вводится как формула массива ctrl+shift+enter

=SUM(ABS(A3:A5-A2:A4))

Он вычисляет abs(A2-A1)+abs(A3-A2)+abs(A4-A3)... и так далее, пока ваш диапазон.

Можно также использовать среднее значение или любую другую функцию, которую вы хотите, но она должна дать вам некоторое представление о шуме.

2
     1    2     3
A    1
B    2
C    2
D    3
  • В ячейке B2 место =IF(A2=A1,0,1)
  • В ячейке B3 место =IF(A2=A3,0,1)
  • Потяните их вниз

Это приведет к чему-то вроде этого:

     1    2     3
A    1
B    2    1     0     
C    2    0     1
D    3    1     0

Столбец 2 будет считать смены, а столбец 3 будет считать повторяющиеся значения.

Внизу сложите столбцы 2 и 3 и разделите 3 на 2. Это приведет к измерению дисперсии (количество изменений / количество повторений, в этом случае = 1/2 = 50% повторений и 50% изменений)

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .