У меня есть таблица, которая выглядит так:

Существует два набора столбцов, пусть левый и правый должны быть в идеале одинаковыми (строка за строкой), но это не так, и мне нужно отфильтровать их так, чтобы можно было вручную проверять и проверять их.

Мне нужно отфильтровать и отсортировать их так, чтобы IDs объединились, но в каждой группе (группе идентификаторов) мы сортируем их по date . И если есть записи, которые отсутствуют, оставьте пустым.

Список, который я хочу создать, будет выглядеть так:

Есть ли способ сделать это в Microsoft Excel или Libre Office Calc ?

  • Сортировать их по группам и оставить места, где нет записей.

Даже с использованием Python NumPy или сценариев Google-таблиц должно быть хорошо.

1 ответ1

0

Это был дан ответ здесь

import pandas as pd
dict1 = {"ID": ["X\\191","R\\192","733","X215","BL000002"], "Inv": [4,4,1,3,3]}
df1 = pd.DataFrame.from_dict(dict1)

dict2 = {"ID": ["X191","X215","BL000002"], "Inv": [4,3,3]}
df2 = pd.DataFrame.from_dict(dict2)

u = df1.assign(Cnt=df1.groupby('Inv').cumcount())
v = df2.assign(Cnt=df2.groupby('Inv').cumcount())
u.merge(v, on=['Inv', 'Cnt'], how='left').drop('Cnt', 1)

       ID_x  Inv      ID_y
0     X\191    4      X191
1     R\192    4       NaN
2       733    1       NaN
3      X215    3      X215
4  BL000002    3  BL000002

По сути, объедините две таблицы по индексам и идентификаторам.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .