Я хотел удалить определенный шаблон содержимого, основанный на регулярном выражении, из CSV-файла очень большого размера, содержащего более 100 000 записей, как это возможно с помощью командной строки Windows? Я также установил sed и awk в командной строке Windows

Он зависает при открытии в любом процессоре электронных таблиц или текстовом редакторе (включая Notepad++).

1 ответ1

2

Возможно, вы захотите попробовать Google Refine.

Он может выполнять сложный рефакторинг CSV с использованием нескольких методов, включая REGEX.

Я использовал его для очистки и обработки очень больших пользовательских баз данных в форме CSV.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .