2

Это не вопрос формул или функций в Excel. Я обсуждаю правильный / лучший способ управления растущим объемом данных, которыми я должен управлять в Excel (я создаю таблицы / отчеты PIVOT для своего управления).

ДАННЫЕ: Я записываю количество публикаций, которые мы заказываем: стоимость, заказанная дата, начало и конец подписки, кто запрашивал ее, когда заказывал, когда я заказывал, будет ли она отменена в следующем году и т.д., И т.д., И т.д., И т.д.

ДИЛЕММА: Очевидно, что мы переупорядочиваем множество одних и тех же публикаций, поэтому в зависимости от того, как я управляю данными, я могу повсеместно дублировать данные.

ВАРИАНТ 1: Итак, я должен использовать ROW = имя публикации в строке 1, и все соответствующие столбцы для каждого финансового года копируются и вставляются после каждого финансового года, готового к новой информации о финансовом году? Это приведет меня к колонке ZZ.

ВАРИАНТ 2: Или я должен использовать COLUMNs = каждая строка имеет только одну информацию о финансовом положении для каждой публикации, и если мы переупорядочиваем или отменяем публикацию, я повторно вводю название публикации в строке ниже и заполняю соответствующие столбцы? Это приведет к длинному списку публикаций вплоть до строки 10000, а также к возможности неправильного написания повторных упорядоченных названий публикаций.

ИДЕИ: Какой самый лучший способ - думать с точки зрения лучшей практики сводных таблиц, легко суммировать или считать, форматировать отчеты и т.д.

Любая лучшая практика высоко ценится.

2 ответа2

3

На самом деле, Excel не является правильным и эффективным способом управления большими объемами данных. В моей компании, которая занимается планированием распространения журналов, они выполняли те же задачи, что и вы в Excel, но со временем Excel стал неадекватным, и ИТ-специалисты решили перенести все процессы / работы, связанные с Excel, в онлайн-базу данных. Весь процесс (выход из Excel и переход к онлайн-базе данных) был обработан как проект. Теперь все контролируется через веб-интерфейсы и базу данных Oracle. Люди управляют данными после входа в свои онлайн-аккаунты и могут создавать автоматические веб-отчеты. PL / SQL также используется для генерации специальных отчетов. Короче, вы должны как-то начать покидать Excel и перейти к решению для базы данных. Подобные изменения всегда кажутся трудными, но как только вы управляете ими программно с успешной координацией ИТ, вы переходите на более высокий и продуктивный уровень.


РЕДАКТИРОВАТЬ: IMO, не имеет значения, в каком направлении (вниз или вправо) вы заполняете данные, если вы не превышаете максимальные пределы Excel. Максимальный предел Excel 2007 для размера листа составляет 1 048 576 строк и 16 384 столбцов. Поэтому вы должны просто убедиться, что вы правильно организовали формулы и вводите правильные данные в правильные ячейки. Поскольку максимальный предел столбца составляет 16 384, в вашем случае лучше идти вниз.

1

Если вам нужно остаться в Excel, вы должны упорядочить данные таким образом, чтобы впоследствии было легче перейти к реляционной базе данных. Даже если вы не видите, как это происходит сейчас, у вас будет время, ресурсы и поддержка со стороны руководства, чтобы когда-нибудь сделать это правильно, так что сделайте это проще для себя.

Нормализовать данные в Excel будет сложно, но подойдите как можно ближе. Создайте другой лист с именами публикаций и используйте проверку данных в поле "имя публикации", чтобы предотвратить написание ошибок.

Если бы я делал это в RDBS, у меня было бы три таблицы: Заказы, Публикации, Люди.

Люди: PersonID, PersonName ...

Публикации: PublicationID, PubName, ...

Заказы: OrderID, OrderDate, PublicationID, RequestedBy(personid), OrderedBy(personid) и т.д.

Это может быть не совсем так, как вы хотите, но вы можете выяснить, что будет работать для ваших данных. Как только вы узнаете, как это будет выглядеть в RDBS, настройте его в Excel. Например, каждая строка будет порядок, а столбцы будут

OrderDate, PublicationName, RequestedBy, OrderedBy и т.д.

используйте проверку данных, указывающую на отдельную таблицу для PublicationName и для RequestedBy и OrderedBy. Через три года вы можете создавать поля идентификаторов для своих таблиц публикаций и людей. Затем используйте формулы, чтобы заменить имена в таблице заказов на идентификаторы, которые вы придумали. Импортируйте весь беспорядок в RDBS, и все готово.

Между тем, ваши квазинормализованные данные будут в отличной форме для создания сводных таблиц, IMO.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .