Цель: вырезка каппа-сигмы в Excel
Я хочу реализовать селективную формулу линейной регрессии в Excel (избегая VBA). У меня есть выборка данных, к которой мне нужно применить линейную регрессию. Но мои данные имеют некоторые структурные отклонения. Я хочу отфильтровать их, используя вырезку из каппа-сигмы. По сути, это просто делает линейную регрессию, вычисляет ошибку для каждого элемента данных и, если точка данных имела большую ошибку (некоторая постоянная [каппа] умноженная на стандартное отклонение всех ошибок [сигма]), она будет отклонена из следующей итерации. Затем линейное изменение снова применяется к отсеченному набору данных.
Что у меня пока
У меня есть лист Excel с фиктивными данными (у = 3 * х + некоторые ошибки). Три точки данных (x = 6, x = 10 и x = 16) имеют структурную ошибку (измерение). Поэтому я подгоняю данные (A25:C29
), вычисляю ошибку (столбец D) и проверяю, больше ли ошибка, чем каппа (1), умноженная на стандартное отклонение ошибки (B31
). Результаты приведены в столбце E. Вы можете видеть, что три точки данных со структурной ошибкой аккуратно определены.
Где я застрял
Я хочу сделать линейную регрессию снова по x и y без точек данных, которые должны быть обрезаны. В наиболее идеальном случае я хотел бы ввести условие (D2:D22<$B$31*$B$32
) непосредственно в формулу LINEST
, поэтому я получаю результаты без использования промежуточных столбцов (теперь в E:G). Я почти уверен, что это можно сделать с помощью некоторых условий и функций массива, но я не могу заставить его работать.