1

На этом сайте есть несколько похожих вопросов, но мой немного другой.

У меня есть текстовый файл 30 ГБ, и мне нужно разбить его на более мелкие файлы в соответствии с различными значениями записи.

Например;

   NAME       DATE      AMOUNT  
    AA      02.03.2014  768,30
    AA      03.03.2014  234,15
    BB      12.01.2014  238,00
    BB      15.09.2014  567,00
    BB      06.12.2014  323,00
    CC      08.02.2015  456,00
    CC      09.02.2015  213,00

в ---->

AA.TXT

   NAME       DATE      AMOUNT  
    AA      02.03.2014  768,30
    AA      03.03.2014  234,15

BB.TXT

   NAME      DATE        AMOUNT 
    BB       12.01.2014  238,00
    BB       15.09.2014  567,00
    BB       06.12.2014  323,00

CC.TXT

   NAME     DATE         AMOUNT
   CC      08.02.2015    456,00
   CC      09.02.2015    213,00

Здесь я нашел подсказку, но я почти не знаю скриптов Powershell, поэтому я не мог найти способ разделить файлы по значению NAME.

В ответе, который я цитировал выше, он ищет скобку [ , то, что я ищу, это значение, отличное от приведенного выше в столбце ИМЯ.

А ТАКЖЕ;

Меньшие файлы в форматах .txt сделают свою работу, но ценится следующее:

- Если число строк <1.000.000, извлеките записи в файл .xls (или .xlsx).

Любые решения на любых других языках также приветствуются.

Благодарю.

1 ответ1

2

Python:

cpath="C:/Path/to/File"
infile=cpath+"/data.txt"

with open(infile) as f:
for line in f:
         content = line.split()

         outfile = cpath + "/" + content[0] + ".txt"

         with open(outfile,'a') as f2: 
              f2.write(line)

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .