У меня есть большая база данных из примерно 20 различных измерений, охватывающих длительный период времени. Некоторые измерения доступны для всего диапазона дат, в то время как другие доступны только в некотором меньшем диапазоне. У меня просто есть список дат в первом столбце, а остальные данные размещены в соответствии с датами, когда они доступны. Я рассчитываю построить много графиков измерений в поисках корреляций и других взаимосвязей. Каждый раз, когда я делаю график, мне нужно выделить тот диапазон дат, для которого все столбцы на графике имеют доступные данные. Это выглядит как довольно мучительный процесс, включающий в себя нелепое количество прокрутки в поисках начальной и конечной точек данных - также довольно часто я забываю, какие данные принадлежат какому-либо столбцу, поскольку метка столбца записана только в первой строке.

То, что я действительно хотел бы сделать, это просто выделить интересующие меня столбцы, а затем добавить какой-нибудь умный макрос / встроенную функцию / надстройку, чтобы изменить мои выборки так, чтобы они были ограничены только диапазонами дат, в которых все столбцы иметь значения. Я слишком много спрашиваю?

2 ответа2

0

Я думаю, что вы можете захотеть использовать смесь Sort и выделения выделения.

Вы можете выделить все, а затем использовать команду sort чтобы выбрать строку даты, и выборочно выделить отдельные ячейки с помощью клавиши Ctrl . (И используйте Shift для выделения больших выделений в сочетании с Ctrl).

Наконец, если вы собираетесь создавать много графиков или это долгосрочный проект, вы можете захотеть использовать что-то вроде SQL-сервера для хранения данных, тогда вы сможете манипулировать этим гораздо лучше - но это излишне для небольших проектов.

0

Во-первых, вы можете рассмотреть возможность использования определенных имен, функций sort и поиска .

Во-вторых, я собираюсь предположить, что, возможно, вы используете не тот инструмент. Это тот тип вещей, в котором R, S, SAS и т.д. Все превосходят (хех). Они также имеют дополнительное преимущество, заключающееся в том, что они намного, намного быстрее выполняют преобразования или интенсивный анализ вычислений. Со всеми этими инструментами легко извлечь и отобразить / проанализировать определенные диапазоны данных или построить все на одном большом беспорядочном графике, выполнить многомерную регрессию или просто выполнить простую линейную регрессию. Я использую R, потому что это направление биологических исследований, оно бесплатное, и сообщество великое.

Как подсказывает @Wil, использование базы данных, вероятно, будет хорошей идеей, если ваш набор данных огромен, но вплоть до гарганута я предлагаю SQLite поверх MS SQL server, MySQL или PostgreSQL. Это плоский файл, он отлично работает с R и не является кошмаром для установки.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .