Фон:
Нам необходимо объединить данные о продажах по всей стране, чтобы сделать анализ
Наше подключение к Интернету / ИТ-экспертиза / ИТ-инвестиции не достаточно сильны, поэтому полное решение BI не подлежит сомнению
Я попробовал несколько решений SaaS BI (GoodData, ZohoReports), и, хотя они хороши, они, кажется, не полностью поддерживают то, что нам нужно
Мы смотрим на рекорд по 2 миллионам за каждые 2 месяца
Мой нынешний подход
Наши (10) сайтов в настоящее время собирают данные из всех своих филиалов и объединяют их в 1 файл Excel с помощью сводной таблицы и встраивают исходные данные.
В штаб-квартире я буду просить 10 сайтов периодически отправлять эти файлы Excel
Мы импортируем эти Excel на наш сервер MSSQL
Будет основной файл Excel, который также будет иметь ту же сводную таблицу (как и из файла Excel сайта), а источником данных является сервер MSSQL.
Подробнее
Для тестирования я сейчас использую MSSQL 2008 Express на своем ноутбуке
До сих пор я импортировал наши транзакции за последние 2 месяца, и в MSSQL есть 2 миллиона + строка в 1 таблице (мы просто используем 1 таблицу, соответствующую нашей общей структуре сводной таблицы). Размер БД ~ 600 МБ
В главном файле Excel, если не включать исходные данные, он составляет всего <10 МБ. Включение исходных данных увеличит размер до 60 МБ (поэтому я предположил, что Office 2007 автоматически архивирует данные?)
Я пытаюсь использовать Pivot (поля перетаскивания), и производительность пока в порядке (характеристики моего ноутбука: C2D T7200, 3 ГБ ОЗУ, Windows XP)
Итак, мой вопрос:
Если мы рассмотрим транзакцию за весь год (примерно 15 миллионов строк в MSSQL 2008 Express, размером 3,6 ГБ), есть ли проблема с этими 15 миллионами строк в 1 таблице в SQL Express?
Есть ли какие-либо проблемы с производительностью в сводной таблице в то время? Можно ли все еще встраивать исходные данные? (Я google-ed, но не нашел максимальный размер исходных данных, которые Excel 2007 может встраивать)
Любые другие предложения о том, как мы можем лучше сделать это? Учитывая, что мы не можем позволить себе полное решение BI, какой легкий / бюджетный / SaaS BI вы можете порекомендовать?
Спасибо