У меня есть два очень больших файла Excel с финансовыми данными. Мне нужно объединить данные из одного файла с данными другого. Все строки в первом файле имеют присвоенный код категории. Некоторые строки во втором файле могут иметь одинаковый код.
Мне нужно объединить все строки из первого файла со всеми совпадающими строками с одинаковым кодом из второго файла. Файлы имеют различное количество столбцов.

Как я должен заняться этим?

3 ответа3

2

Задача такого рода - то, для чего предназначен доступ Microsoft и называется "левое соединение". Но вы все равно можете сделать это в Excel, используя vlookup или используя функцию match и index. Лично я предпочитаю совпадение / индекс.

Предположим, что Sheet1 A:F является первым файлом, и вы помещаете второй файл на Sheet2 A1:Q500. Допустим, ваши коды в столбце A обоих. Затем на листе 1 в G2 введите это:

=MATCH(A2,Sheet2!A$1:A$500,0)

Тогда в типе H2:

=INDEX(Sheet2!B$1:B$500,$G2)

Затем перетащите это через и перетащите все это вниз.

1

Сначала добавьте несколько столбцов в файл, который нужен для выравнивания данных, затем вырежьте и вставьте данные из самого маленького в самый большой файл, а затем отсортируйте по коду вашей категории.

Вот один из способов сделать это в VBA. Этот код будет копироваться только в том случае, если ячейка, содержащая значение NACE, одинакова, но вы можете изменить ее для своих нужд. Прямо сейчас он просто копирует всю строку в первую книгу.

Private Sub CopyRows()

Dim FirstSheet As Range
Dim SecondSheet As Range
Dim s1col As Integer, s2col As Integer
Dim nextrow As Integer, secondendrow As Integer
Dim copyrow As Range, col As Range
Dim firstsheetrow As Range, secondsheetrow As Range
Dim NACE() As String, Limit As Integer, Index As Integer
Dim testrange As Range

Set FirstSheet = ActiveSheet.UsedRange
Set SecondSheet = Workbooks("Book2").Sheets("Sheet1").UsedRange

For Each col In FirstSheet.Columns
    If Not col.Cells(1).Find("NACE") Is Nothing Then
        s1col = col.Column
        Exit For
    End If
Next col

For Each col In SecondSheet.Columns
    If Not col.Cells(1).Find("NACE") Is Nothing Then
        s2col = col.Column
        Exit For
    End If
Next col


''//Fill NACE array with distinct entries from first sheet
nextrow = FirstSheet.Rows.Count + 1

ReDim Preserve NACE(1 To 1)
NACE(1) = FirstSheet.Rows(2).Cells(1, s1col).Value

For Each firstsheetrow In FirstSheet.Range("3:" & nextrow - 1).Rows
    Limit = UBound(NACE)
    If instrArray(NACE, firstsheetrow.Cells(1, s1col).Value) = 0 Then
        ReDim Preserve NACE(1 To Limit + 1)
        NACE(Limit + 1) = firstsheetrow.Cells(1, s1col).Value
    End If
Next firstsheetrow

''//Copy lines from second sheet that match a NACE value on the first sheet
secondendrow = SecondSheet.Rows.Count

For Each secondsheetrow In SecondSheet.Range("2:" & secondendrow).Rows
    Index = instrArray(NACE, secondsheetrow.Cells(1, s2col).Value)
    If Index > 0 Then
        secondsheetrow.Copy
        ActiveSheet.Rows(nextrow).PasteSpecial (xlPasteValues)
    End If
Next secondsheetrow

End Sub

Этот код должен войти в модуль для поддержки основной процедуры:

Public Declare Sub CopyMemory Lib "kernel32" _
   Alias "RtlMoveMemory" _
  (pDest As Any, _
   pSrc As Any, _
   ByVal ByteLen As Long)

Public Function GetArrayDimensions(ByVal arrPtr As Long) As Integer

   Dim address As Long
  'get the address of the SafeArray structure in memory

   CopyMemory address, ByVal arrPtr, ByVal 4

  'if there is a dimension, then
  'address will point to the memory
  'address of the array, otherwise
  'the array isn't dimensioned
   If address <> 0 Then

     'fill the local variable with the first 2
     'bytes of the safearray structure. These
     'first 2 bytes contain an integer describing
     'the number of dimensions
      CopyMemory GetArrayDimensions, ByVal address, 2

   End If

End Function

Public Function VarPtrArray(arr As Variant) As Long

  'Function to get pointer to the array
   CopyMemory VarPtrArray, ByVal VarPtr(arr) + 8, ByVal 4

End Function

Function instrArray(strArray, strWanted, _
    Optional CaseCrit As Boolean = False, _
    Optional FirstOnly As Boolean = True, _
    Optional Location As String = "exact") As Long
     '
     '****************************************************************************************
     '       Title       instrArray
     '       Target Application:  any
     '       Function:   searches string array for some "wanted" text
     '       Limitations:
     '       Passed Values:
     '           strArray    [in, string array]  array to be searched
     '           strWanted   [in, string]  text for which strArray is searched
     '           CaseCrit    [in, Boolean, Optional]
     '               if true, case (upper/lower) of each character is critical and must match
     '               if false, case is not critical {default}
     '           FirstOnly   [in, Boolean, Optional]
     '               if true, proc exits after first instance is found {default}
     '               if false, proc search to end of array and last instance # is returned
     '           Location    [in, string, Optional] text matching constraint:
     '               = "any"     as long as strWanted is found anywhere in strArray(k),i.e.,
     '                               instr(strArray(k),strWanted) > 0, then instrArray = K
     '               = "left"    match is successful only if
     '                               Left(strArray(K),Len(strWanted) = StrWanted
     '               = "right"    match is successful only if
     '                               Right(strArray(K),Len(strWanted) = StrWanted
     '               = "exact"    match is successful only if
     '                               strArray(K) = StrWanted       {default}
     '
     '****************************************************************************************
     '
     '
    Dim I       As Long
    Dim Locn    As String
    Dim strA    As String
    Dim strB    As String

    instrArray = 0
    Locn = LCase(Location)
    Select Case FirstOnly
        Case True
            For I = LBound(strArray) To UBound(strArray)
                Select Case CaseCrit
                Case True
                    strA = strArray(I):     strB = strWanted
                Case False
                    strA = LCase(strArray(I)):  strB = LCase(strWanted)
                End Select
                If instrArray2(Locn, strA, strB) > 0 Then
                    instrArray = I
                    Exit Function
                End If
            Next I
        Case False
            For I = UBound(strArray) To LBound(strArray) Step -1
                Select Case CaseCrit
                Case True
                    strA = strArray(I):     strB = strWanted
                Case False
                    strA = LCase(strArray(I)):  strB = LCase(strWanted)
                End Select
                If instrArray2(Locn, strA, strB) > 0 Then
                    instrArray = I
                    Exit Function
                End If
            Next I
    End Select

End Function

Function instrArray2(Locn, strA, strB)
     '
     '****************************************************************************************
     '       Title       instrArray2
     '       Target Application:  any
     '       Function    called by instrArray to complete test of strB in strA
     '       Limitations:    NONE
     '       Passed Values:
     '           Locn    [input, string] text matching constraint (see instrArray)
     '           strA    [input, string] 1st character string
     '           strB    [input, string] 2nd character string
     '
     '****************************************************************************************
     '
     '

    Select Case Locn
    Case "any"
        instrArray2 = InStr(strA, strB)
    Case "left"
        If Left(strA, Len(strB)) = strB Then instrArray2 = 1
    Case "right"
        If Right(strA, Len(strB)) = strB Then instrArray2 = 1
    Case "exact"
        If strA = strB Then instrArray2 = 1
    Case Else
    End Select

End Function

Код утилиты был найден здесь и здесь.

0

В зависимости от размера этих двух файлов вы также можете попробовать использовать Query from Excel Files:

  • Определите имя для первой таблицы Excel (вкладка Формулы -> Определить имя)
  • Определить имя для второй таблицы Excel
  • Перейдите на вкладку "Данные", выберите "Из других источников" и в раскрывающемся списке выберите "Из Microsoft Query".
  • Выберите файл рабочей книги и подтвердите, что вы хотите объединить столбцы вручную
  • В следующем окне "Запрос из файлов Excel" перетащите первый столбец первой таблицы в первый столбец второй таблицы - будет создана связь между этими столбцами.
  • Зайдите в меню "Файл", нажмите "Вернуть данные в MS Office Excel", появится диалоговое окно "Импорт данных".
  • Выберите лист, на который вы хотите импортировать сопоставленные данные
  • Нажмите OK -> вы должны увидеть совпадающие данные с колонками из обеих таблиц

Если вы не можете работать с Excel или локальной базой данных, вы можете загрузить файлы в онлайн-сервис, например http://www.gridoc.com/join-tables, и объединить таблицы с помощью перетаскивания (Отказ от ответственности: я автор инструмент).

Надеюсь это поможет.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .