У меня есть столбец с почти миллионными строками со значениями в диапазоне от 25 до 140000 (приблизительно), хотя присутствует не каждое значение в этом диапазоне. Как я могу получить график, показывающий распределение значений (возможно, график типа колокола), предпочтительно только те, которые действительно существуют?
2 ответа
Войдите в сводную таблицу.
выделите сводную таблицу данных вставки.
Использовать столбцы lables = data Использовать количество данных для значений
Затем создайте свой график из результатов сводной таблицы.
Если вам нужна диаграмма, показывающая распределение, включая пробелы в значениях, которых нет, вы, вероятно, захотите использовать формулу частоты Excel. Для этого требуется два аргумента: массив данных, который вы анализируете, и массив bin (для подсчета уникальных экземпляров этих значений). В качестве аргумента bin вы можете использовать массив одиночных значений (1,2,3 ... n) или групповых значений (5,10,15 ... n). С диапазоном 25-140 000, ячейки со значением больше 1 могут быть предпочтительнее, в противном случае вы получите диаграмму с 140 000 столбцами, и пробелы (или другие аномалии) будет трудно увидеть.
Когда у вас есть массив частот, просто нанесите значения в виде столбчатой диаграммы, и вы получите нечто, похожее на гистограмму распределения.
Примечание. Частота - это формула массива, поэтому вам нужно выбрать диапазон ячеек, который вы хотите заполнить, и завершить его с помощью [Ctrl] - [Shift] - [Enter].
РЕДАКТИРОВАТЬ: Вот образец диаграммы, используя параметры данных, которые вы упомянули. Он использует случайные значения, поэтому распределение является относительно равномерным, но он показывает, насколько плотными будут значения.
Стоит также отметить, что Excel не слишком захлебывался кальками - я получил немного отложенное обновление форматирования диаграммы, но он справился с объемом данных довольно хорошо.