8

Каков наиболее эффективный способ преобразования данных, разделенных табуляцией, например:

a   b   c   d   cat
NULL    NULL    NULL    NULL    NULL
NULL    NULL    NULL    d   d
NULL    NULL    c   NULL    c
NULL    NULL    c   d   c; d
NULL    b   NULL    NULL    b
NULL    b   NULL    d   b; d
NULL    b   c   NULL    b; c
NULL    b   c   d   b; c; d
a   NULL    NULL    NULL    a
a   NULL    NULL    d   a; d
a   NULL    c   NULL    a; c
a   NULL    c   d   a; c; d
a   b   NULL    NULL    a; b
a   b   NULL    d   a; b; d
a   b   c   NULL    a; b; c
a   b   c   d   a; b; c; d

Нечто близкое к этому:

a    | b    | c    | d    | cat
-----+------+------+------+-----------
NULL | NULL | NULL | NULL | NULL
NULL | NULL | NULL | d    | d
NULL | NULL | c    | NULL | c
NULL | NULL | c    | d    | c; d
NULL | b    | NULL | NULL | b
NULL | b    | NULL | d    | b; d
NULL | b    | c    | NULL | b; c
NULL | b    | c    | d    | b; c; d
a    | NULL | NULL | NULL | a
a    | NULL | NULL | d    | a; d
a    | NULL | c    | NULL | a; c
a    | NULL | c    | d    | a; c; d
a    | b    | NULL | NULL | a; b
a    | b    | NULL | d    | a; b; d
a    | b    | c    | NULL | a; b; c
a    | b    | c    | d    | a; b; c; d

В настоящее время я использую Notepad++ следующим образом:

  1. Преобразовать вкладки в пробелы
  2. Выровняйте данные вручную
  3. Используйте режим столбца, чтобы вставить трубы

Второй шаг самый утомительный, и я бы предпочел автоматизировать хотя бы эту часть.

Примечание: я использую браузер при работе, и иногда у меня есть открытый текстовый редактор. Эффективное решение - это то, которое требует минимальных усилий. Я могу использовать:

  • Notepad++
  • Универсальный текстовый редактор с поддержкой регулярных выражений поиск / замена
  • JavaScript набран внутри консоли браузера
  • Интернет веб-сервис
  • PHP в командной строке (php -a)

3 ответа3

8

Как я могу преобразовать разделенные табуляцией значения в таблицу ASCII?

Я использую генератор текстовых таблиц для такого рода задач.

Я вставил ваши данные на эту страницу, и она создала следующую таблицу:

+------+------+------+------+------------+
| a    | b    | c    | d    | cat        |
+------+------+------+------+------------+
| NULL | NULL | NULL | NULL | NULL       |
+------+------+------+------+------------+
| NULL | NULL | NULL | d    | d          |
+------+------+------+------+------------+
| NULL | NULL | c    | NULL | c          |
+------+------+------+------+------------+
| NULL | NULL | c    | d    | c; d       |
+------+------+------+------+------------+
| NULL | b    | NULL | NULL | b          |
+------+------+------+------+------------+
| NULL | b    | NULL | d    | b; d       |
+------+------+------+------+------------+
| NULL | b    | c    | NULL | b; c       |
+------+------+------+------+------------+
| NULL | b    | c    | d    | b; c; d    |
+------+------+------+------+------------+
| a    | NULL | NULL | NULL | a          |
+------+------+------+------+------------+
| a    | NULL | NULL | d    | a; d       |
+------+------+------+------+------------+
| a    | NULL | c    | NULL | a; c       |
+------+------+------+------+------------+
| a    | NULL | c    | d    | a; c; d    |
+------+------+------+------+------------+
| a    | b    | NULL | NULL | a; b       |
+------+------+------+------+------------+
| a    | b    | NULL | d    | a; b; d    |
+------+------+------+------+------------+
| a    | b    | c    | NULL | a; b; c    |
+------+------+------+------+------------+
| a    | b    | c    | d    | a; b; c; d |
+------+------+------+------+------------+

Затем вы можете скопировать этот вывод (генератор выполнил большую часть тяжелой работы), вставить в notepad++ и очистить соответствующим образом.

5

Если вам нужно решение для командной строки, вы также можете использовать pandoc с фильтром pandoc-placetable.

Поместите вашу таблицу в foo.txt и выполните:

pandoc-placetable --file=foo.txt --delimiter="\t" --header | pandoc -f json -t markdown-simple_tables-multiline_tables -o output.md

Что приводит к следующему output.md:

| a    | b    | c    | d    | cat        |
|------|------|------|------|------------|
| NULL | NULL | NULL | NULL | NULL       |
| NULL | NULL | NULL | d    | d          |
| NULL | NULL | c    | NULL | c          |
| NULL | NULL | c    | d    | c; d       |
| NULL | b    | NULL | NULL | b          |
| NULL | b    | NULL | d    | b; d       |
| NULL | b    | c    | NULL | b; c       |
| NULL | b    | c    | d    | b; c; d    |
| a    | NULL | NULL | NULL | a          |
| a    | NULL | NULL | d    | a; d       |
| a    | NULL | c    | NULL | a; c       |
| a    | NULL | c    | d    | a; c; d    |
| a    | b    | NULL | NULL | a; b       |
| a    | b    | NULL | d    | a; b; d    |
| a    | b    | c    | NULL | a; b; c    |
| a    | b    | c    | d    | a; b; c; d |

Чтобы читать из STDIN, пропустите аргумент --file . Чтобы печатать в STDOUT, не указывайте аргумент -o .

2

Идея Руслана использовать команду column Unix/Linux хороша, но приведенная в ответе командная строка не совсем работает. Прежде всего, column не распознает \t (или \\t) в командной строке как вкладку.  Если у вас есть bash , вы можете сделать

column -t -s$'\t' foo.txt

В противном случае вы можете сделать

column -t -s"$(printf '\t')" foo.txt

Но даже это не отвечает на вопрос.  Вы можете получить вертикальные полосы, выполнив

column -t -s$'\t' -o' | ' foo.txt

который производит вывод, как

a    | b    | c    | d    | cat
NULL | NULL | NULL | NULL | NULL
NULL | NULL | NULL | d    | d
NULL | NULL | c    | NULL | c
NULL | NULL | c    | d    | c; d
NULL | b    | NULL | NULL | b
NULL | b    | NULL | d    | b; d
NULL | b    | c    | NULL | b; c
NULL | b    | c    | d    | b; c; d
a    | NULL | NULL | NULL | a
a    | NULL | NULL | d    | a; d
a    | NULL | c    | NULL | a; c
a    | NULL | c    | d    | a; c; d
a    | b    | NULL | NULL | a; b
a    | b    | NULL | d    | a; b; d
a    | b    | c    | NULL | a; b; c
a    | b    | c    | d    | a; b; c; d

Добавление штриховой линии после заголовка вручную не так утомительно.


Если у вас нет доступа к полноценной системе Unix/Linux, вы можете использовать Cygwin или один из других Unix-лайков для этого.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .