1

На моем листе Excel 2016 у меня есть большой объем данных (~ 224 000 строк / 5 столбцов) в следующем формате:

Parameter 1 | Parameter 2 | Parameter 3 | Parameter 4 | Result     |
--------------------------------------------------------------------
0           | 0           | 0           | 0           | 0          |
1           | 0           | 0           | 0           | 1          |
0           | 1           | 0           | 0           | 2          |
0           | 0           | 1           | 0           | 3          |
0           | 0           | 0           | 1           | 4          |
1           | 1           | 0           | 0           | 5          |
[...]

Формат сопоставим с "двоичным" словом, в котором каждое значение проверяется в каждом столбце, причем каждое значение соответствует отдельному результату в столбце "Результат".

Есть ли способ создать диаграмму (кривую или точечную диаграмму), которая позволила бы увидеть, какой из 4-х параметров приводит к тому, что "Результат" растет быстрее?

Я попытался выбрать свои 5 столбцов для создания графика, но в результате получилась "помятая" кривая. Даже при использовании только одного параметра за раз с "результатом", я получил помятую кривую, поскольку данные являются столбцом "параметра x", переходят от 0 к n и сбрасываются несколько раз по линиям 200k+.

РЕДАКТИРОВАТЬ

Вот пример того, что я получаю с графиком XY:

XY График

Ось Y - это значение в "Результат", ось X - номер строки.

Столбец Result желтый на этом графике.

РЕДАКТИРОВАТЬ 2

Результат является аналогом этой формулы:

Result = (Constant + Parameter 1) * (1 + Parameter 2 / 100) * (1 + Parameter 3 / 100 * Parameter 4 / 100)

1 ответ1

0

Предварительный материал (пропустите это, если вы хотите сократить погоню):

Спокойствие, я попытался воспроизвести твой график, чтобы убедиться, что я правильно понял твою проблему, и я смог "приблизиться". Есть два основных различия:

  1. Ваш график показывает результат и параметр 3 "сброс" при значении х около 55 000. Тем не менее, вы говорите, что параметр 3 изменяется от 0 до 100 (с увеличением на 1), а затем повторяется. Вы также говорите, что ось X - это номер строки. Эти утверждения противоречивы, если только номер строки не сильно отличается от целого ряда (т. Е. Номера строки) в Excel.
  2. Ваш график не показывает параметр 1, который, как вы говорите, изменяется от 0 до 61 с шагом 1, а затем повторяется. Но ваш график действительно показывает ряд (серые символы) , которая начинается около 30 , и увеличиваются скачки по всему диапазону , как показано.

Итак, следующий анализ покажет вам в целом, как действовать, но вывод относится к данным, которые я сгенерировал из ваших комментариев, а не к данным, показанным на вашем графике.

Важные вещи (начните здесь, если вы хотите сократить погоню):

На графиках ниже я нанес результат и еще четыре серии, произведенные путем удаления одного из четырех параметров из расчета. Они помечены как P123, P124, P134 и P234 - они были сгенерированы путем удаления параметров 4,3,2 и 1 соответственно.

Для параметров 2,3 и 4 я удалил весь член (т. Е. (1+Param2/100) из вашего уравнения. Для параметра 1, который умножается на константу, я удалил только параметр 1. Вы можете решить обращаться с этим по-другому. Также обратите внимание, что я использовал значение 300 для константы, потому что это дает начальное значение для результата 75, что примерно соответствует тому, что показывает ваш график.

На приведенном ниже графике показан результат и четыре серии Pnnn с линейной линией тренда, установленной для каждой серии. Этот график немного грязный, но ясно одно: удаление параметра 4 увеличивает наклон линии тренда. то есть P123 "растет" быстрее, чем Result, так что параметр 4 имеет отрицательный вклад в рост Result - он уменьшает его.

Следующий график расширяет нижнюю часть первого графика и включает уравнения для линейных подгонок. (P123 зашкаливает, но самое верхнее уравнение для его линии тренда).

Наклон линии тренда для результата составляет 0,0584. Наклоны для P234, P134 и P124 все ниже, что означает, что пропущенные параметры положительно влияют на рост - добавление их обратно увеличит наклон до 0,0584. Самый низкий уклон для P124. Это означает, что параметр 3 оказывает наибольшее влияние на рост результата.

Как я уже говорил выше, вы можете получить другой результат, если примените этот вид анализа к имеющимся у вас данным.

Но я надеюсь, что это поможет, и удачи.

ПРИМЕЧАНИЕ. Чтобы добавить линию тренда к серии (в Excel 2011 для Mac), щелкните одну из точек в серии и выберите «Добавить линию тренда ...» в меню "График". В появившемся диалоговом окне в разделе "Тип" выберите "Линейное соответствие", а в разделе "Параметры" установите флажок "Показать уравнение на диаграмме". Детали этого могут отличаться в зависимости от вашей версии Excel.

РЕДАКТИРОВАТЬ: Я хочу отметить, что "рост" этой функции немного вводит в заблуждение. Поскольку все четыре параметра являются циклическими функциями, в конечном итоге наклон всех них равен нулю. Результат "растет" только для начальных циклов параметра с самым длинным периодом (P3). Но при достаточно больших значениях x Result выровняется, и наклон линейной аппроксимации приблизится к нулю. Чтобы продемонстрировать это, вы можете выполнить линейное приближение к n циклам P3 и увидеть уменьшение наклона при увеличении n.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .