Я пытаюсь составить точечную диаграмму событий, где у меня есть день недели на одной оси и время дня на другой оси, а данные представлены в виде точек для каждого дня + время события.

То, что я пытаюсь получить, - это распределение времени, когда «когда что-то произошло», но нет ничего заговора о том, что или как много произошло.

В идеале я бы также построил график по месяцу или году на третьей оси, например, по цвету, но это просто замечательно.

-------- 8 <-------------------------- Ответ на вопрос ниже ... вторая попытка, так как моя первая была потеряна :-(

Я использую опцию ls --time-style =+"...", поэтому хорошо контролируйте данные. Вот изображение данных и основная диаграмма рассеяния. Попытки реструктурировать график оказываются пустыми. Есть 40 тыс. Строк данных, и появляется попытка обработать все (!) повесить.

Снимок экрана с образцами данных и точечной диаграммой

1 ответ1

0

Для этого вам нужна точечная диаграмма (XY диаграмма). Ось X должна обрабатываться как числовые значения, в противном случае она будет обрабатываться как категории, причем значения будут просто метками, а каждое последующее значение будет сложено. Вот пример, и я объясню, как я это сделал:

Значения дня - это числа. Вы можете получить их, применив функцию WEEKDAY к вашим датам (1 = с воскресенья по 7 = суббота). Они должны храниться в виде чисел, но если вы хотите, чтобы они читались как дни, отформатируйте их с помощью специального формата даты ddd , который я сделал для последних семи значений.

Каждый год представляет собой отдельную серию данных, поэтому вы хотите предварительно отсортировать данные, как это выглядит у вас. Начните график, выбрав данные первого года (день, время, год), который даст вам первую серию. В качестве имени серии выберите одну ячейку в столбце года. Убедитесь, что диапазон оси X указывает на диапазон столбца дня, а диапазон оси Y указывает на столбец времени.

Для каждого дополнительного года добавьте ряд с кнопкой + внизу и повторите процесс, чтобы указать диапазоны данных.

Автоматические настройки для оси X начнутся с 0 и закончатся на 8 , что нормально. Это сохранит ваши данные внутри диаграммы. Похоже, что LO Calc не будет форматировать числа для оси X в точечной диаграмме. Я добавил заголовок оси X. Для текста заголовка я ввел названия дней с пробелами между ними, а затем скорректировал пространство так, чтобы имена совпадали с метками оси. Затем я отформатировал ось, чтобы не показывать метки оси.

Вот как заставить график отображаться так, как вы просите, но 40000 точек данных - это другая проблема. Предполагая, что ваш компьютер имеет ресурсы для обработки, это займет некоторое время. Ваш компьютер может быть занят и заблокирован на несколько минут даже при наличии достаточного количества оперативной памяти. Если у него нет тонны ОЗУ, процесс может занять очень много времени, переставляя куски на диск, даже до такой степени, что "навсегда". Возможно, вам придется разделить данные на подгруппы и нанести их на график отдельно, либо построить только выборку данных (случайную выборку или каждую N-ю точку) или комбинацию методов. Даже 10% данных (4000 точек) - это много данных для одного графика, но вы можете поэкспериментировать, чтобы узнать, с какими данными может работать ваша система.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .