У меня возникли проблемы с операцией, которая, по моему мнению, ограничена размером сдвига данных - операция представляет собой объединение и фильтрацию двух книг Excel, каждая из которых содержит более 1 миллиона строк.

Возможно, здесь есть кто-то, кто хочет проявить мастерство, чтобы помочь мне понять путь, по которому я должен идти. Я хотел бы использовать SQL в Microsoft Access.

Две рабочие книги - данные об автомобиле и данные об авариях. Они оба содержат информацию о дорожно-транспортных происшествиях в Великобритании. Рабочая тетрадь содержит информацию о каждом транспортном средстве (идентификационный номер ДТП, тип транспортного средства, скорость транспортного средства ...). Рабочая тетрадь с информацией о происшествии содержит информацию о происшествии (идентификационный номер аварии, длинный, лат, несчастные случаи ...)

Я хочу объединить две рабочие книги в одну рабочую книгу, используя данные об автомобиле в качестве основной рабочей книги. Таким образом, добавьте информацию в строки книги транспортного средства из строк книги аварии, используя уникальные идентификационные номера аварии. Примечание: они оба имеют уникальные идентификационные номера ДТП, однако в рабочей книге транспортного средства часто перечислены уникальные идентификационные номера ДТП несколько раз, поскольку в дорожно-транспортных происшествиях часто встречается несколько транспортных средств (28 транспортных средств являются самыми крупными в этом наборе данных). Поэтому в строках необходимо будет вызывать и впоследствии перечислять информацию о книге происшествий более одного раза.

Я думаю, что было бы лучше изучить SQL, потому что я считаю, что SQL может выполнять мою вторую задачу синонимично.

Задача 2. Я хотел бы изолировать конкретное транспортное средство от набора данных после его объединения. Я хотел бы выделить данные о велосипедах, которые включают всю информацию в одну строку для построения сводных таблиц и подключения к QGIS.

Таким образом, конечный продукт будет представлять собой единую таблицу данных о ДТП с велосипедом, в которой есть все данные для каждого инцидента, полученные из двух рабочих книг.

Может ли кто-нибудь помочь мне начать?

Из того, что я понимаю, мне нужно объединить два сервера в качестве связанных, использовать TSQL для выполнения фильтрации.

1 ответ1

0

Вы можете использовать Microsoft Power Add-In Query , чтобы объединить несколько файлов.

В Power Query есть некоторые ограничения. Однако вы должны иметь возможность объединить более 1 млн. строк в зависимости от свободной памяти в вашей системе (для большого набора данных вы должны использовать 64-битную версию).
Окончательный набор данных должен быть ниже 1 млн. строк, если вы экспортируете таблицу на лист Excel.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .