Формат файла CSV не полностью стандартизирован, даже если существует RFC4180
(этот стандарт определяет только обработку текстовых полей).
Требования RFC4180 :
- Строки в стиле MS-DOS, заканчивающиеся символами (CR/LF) (необязательно для последней строки).
- Необязательная запись заголовка (нет точного способа определить, присутствует ли она, поэтому при импорте необходимо соблюдать осторожность).
- Каждая запись "должна" содержать одинаковое количество полей, разделенных запятыми.
- Любое поле может быть заключено в кавычки (с двойными кавычками).
- Поля, содержащие разрыв строки, двойные кавычки и / или запятые, должны быть заключены в кавычки. (Если это не так, файл, скорее всего, будет невозможно правильно обработать).
- Символ двойной кавычки в поле должен быть представлен двумя символами двойной кавычки.
Вернуться к вашему вопросу:
У меня есть список адресов электронной почты через запятую, например
friend1@example.xyz, friend2@example.xyz, friend3@example.xyz
Но мне нужно будет преобразовать его в правильный формат CSV. Итак, заменив пробелы, я предполагаю
Чтобы удалить пробелы:
- Нажмите Ctrl+H.
- В поле
Find what
тип [ \t]+
- Поле
Replace with
должно быть пустым.
- В разделе «
Search mode
» переключите переключатель на regular expression
и нажмите кнопку Заменить все
Когда вы очищаете текст от пробелов, вы можете заключить данные столбца в кавычки:
- Нажмите Ctrl+H.
- В поле
Find what
тип ([^,\r\n]+)
- В поле
Replace with
тип \"\1\"
- В разделе «
Search mode
» переключите переключатель на regular expression
и нажмите кнопку Заменить все
Примечание: это (окружающие данные в кавычках) относится к тексту, сохраненному в формате DOS/Windows, если вы обрабатываете данные из Linux, то удалите \r
форму Find what
поле.