2

Я работал с Excel довольно долго для статистического анализа, который я делаю регулярно. Однако в последнее время размер данных, с которыми я работаю, значительно увеличился. Структура рассматриваемых баз данных довольно проста, обычно это всего три строки, которые включают метку времени UNIX и значение EST, собственное числовое значение и, наконец, среднее из строк, которые имеют метку времени +/- 1000 метки времени этой строки (мало AVERAGEIFS() формула). Эта формула и EST-преобразование являются единственными формулами на листе.

Я начинаю работать с файлами с 500 000+ строк. Выполнение средней формулы по всему ряду занимает вечность. Конечным результатом является создание графиков, достойных печати. Я ищу либо утилиту UNIX CL, либо отдельное приложение для работы с электронными таблицами / базами данных, которое может обрабатывать такой объем данных, не перегружая процессор и не заставляя меня ждать час. Там что-нибудь есть?

TL; DR: Простая таблица Excel с более чем полмиллионом строк становится слишком медленной для работы. OS X альтернативы?

1 ответ1

1

Я хотел бы увидеть, если вы можете сделать это в традиционной базе данных (SQL или аналогичной) или что-то вроде консоли R. Если проблема заключается в графике, а не в расчете, я бы попытался выполнить какой-либо тип фильтрации (не уверен, какие у вас данные или как они распределены, но в любом случае вам не нужно 500 000+ точек данных на графике), чтобы избавиться от множества ненужных точек данных для сюжета. Это ускорит построение графиков (и вы можете использовать R или gnuplot для реального построения графиков, если Excel работает слишком медленно)

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .