9

У меня есть файл Excel, который содержит данные в двух столбцах, таких как:

Operator ID           MXS1268
Name                  ramesh    

Мне нужно проверить наличие дубликатов в нескольких файлах Excel, которые имеют одинаковое значение для идентификатора оператора, и отобразить или поместить его в какой-нибудь файл журнала.

3 ответа3

5

Все еще нет приличных ответов? Так как вы сказали grep, я предполагаю, что вы знаете, как использовать оболочку;

$ link=http://wizard.ae.krakow.pl/~jb/xls2txt/xls2txt-0.13.tar.gz
$ wget -nv "$link" && \
  tar xf `basename "$link"` && \
  cd $(basename "$link" .tar.gz) &&\
   make
2013-07-24 URL:(...)/xls2txt-0.13.tar.gz [12419/12419] -> "xls2txt-0.13.tar.gz"
cc -O2 -g -DVERSION=0.13 -c xls2txt.c -o xls2txt.o
cc -O2 -g   -c -o ole.o ole.c
cc -O2 -g   -c -o cp.o cp.c
cc -O2 -g   -c -o ummap.o ummap.c
cc -O2 -g   -c -o ieee754.o ieee754.c
cc -lm  xls2txt.o ole.o cp.o ummap.o ieee754.o   -o xls2txt

$ awkf() { awk -F\\t '{ printf "%20s | %-20s\n", $1, $2 }' ; }
$ x2t() { ./xls2txt $1 C4:D5 | awkf > `basename "$1" .xls`.txt ; }
$ x2t ramesh2.xls ; x2t ramesh.xls

И отчет:

$ grep MXS1268 ramesh*txt
ramesh.txt:         Operator ID | MXS1268
ramesh2.txt:         Operator ID | MXS1268
1

В Linux или Cygwin:

$ xlsx2csv myfile.xlsx | grep MXS1268 
1

Вы можете попробовать использовать openpyxl - или любое количество пакетов Python - если вы знаете базовый Python. Если у вас не получается использовать grep, выведите excel в текст и передайте его через grep. Или просто напишите скрипт pygrep, чтобы сделать все это.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .