Я занимался программированием, которое включало запись данных в большой файл CSV (700 МБ). Я иногда открывал файл, используя libre office, чтобы проверить поступающие данные.

Этим утром я открыл файл (пока он записывался) и скопировал некоторые данные в другой пустой CSV-файл, чтобы я мог написать скрипт для правильного чтения данных из него, чтобы я мог быть готов к тому, когда большой CSV-файл будет готов ,

Однако после того, как я скопировал пример строки, я закрыл большой файл и открыл его несколько минут спустя, и теперь мои данные выглядят так в предварительном просмотре:

Что впечатляет, поскольку в моих данных вообще нет китайских или японских символов. Открытие файла в libre office calc дает мне сообщение "слишком много символов в ячейке", зависание, а затем libre office вылетает.

Если я смотрю на файл в bash, он выглядит так:

Правильные слова показывают и все. Если я читаю файл с помощью скрипта Python или открываю как текстовый файл, он также показывает строки правильно. Что это за странная ошибка?

1 ответ1

-1

Хорошо, я был глуп, набор символов был изменен на Unicode, и я не заметил.

Да.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .