Я ищу инструмент или процесс, которые помогут автоматизировать повторяющиеся задачи рабочего процесса, которые требуют, чтобы файл Excel или CSV был в определенном формате.

Например, мы работаем с поставщиками, которые присылают нам список клиентов. Данные в электронной таблице, которые мы получаем, одинаковы, но они могут иметь несколько иную форму. Например, мы можем получить файл с этими столбцами:

[ID][FName][LName][Birthday]

Однако, давайте предположим, что наша система должна иметь такую форму:

[ID][FirstName][LastName][Birthdate]

Кроме того, данные могут быть в несколько ином формате, чем ожидает наша система. Например, предположим, что столбец даты рождения должен быть в определенном формате (ММ / ДД / ГГГГ), где поставщик может предоставить его в виде (ГГГГ-ММ-ДД).

Предполагая, что файл, который мы получаем от поставщика, всегда отправляется в одном и том же формате, мы хотели бы быстро преобразовать эти файлы для совместимости с нашей системой.

На мой взгляд, в идеале это будет приложение со следующими функциями:

  • Возможность работы с файлами Excel или CSV
  • Определите, как переименовать столбцы
  • Определите формат данных для каждого столбца
  • Очистите неверные данные (иногда клиенты имеют строку # N/A в поле, которая в нашей системе должна рассматриваться как пустая)
  • Вывод как CSV
  • Объединение строк путем сопоставления столбцов (иногда нам предоставляется несколько файлов, которые необходимо объединить по идентификатору)
  • Графический интерфейс был бы хорош для определения правил, тогда запуск его с использованием CLI, вероятно, был бы полезен для автоматизации / будущих запусков
  • Возможность сохранить эти настройки, чтобы мы могли быстро перезапустить их в будущем, загрузив новые данные с ранее определенными настройками.

Есть ли инструмент или рабочий процесс, который бы достигал этого с минимальным трением? Мы можем разработать что-то внутренне, если это необходимо, но если уже есть инструмент, который облегчает это, это было бы идеально.

1 ответ1

2

Ваш вопрос читается как описание продукта Power Query. Это бесплатная надстройка от Microsoft, которая работает с Excel 2010 и 2013.

Получите это здесь: https://www.microsoft.com/en-us/download/details.aspx?id=39379

Вы можете открыть файл CSV, переименовать столбцы, заменить значения, определить форматы данных и т.д. Каждое действие записывается и может быть отредактировано. Запрос может быть сохранен и повторен в любое время. Вывод может быть помещен в лист Excel, который можно сохранить в формате CSV.

Изменить: Power Query теперь доступен для всех выпусков Office 2013. Цитирование из системных требований на странице загрузки

Поддерживаются следующие версии Office:

  • Microsoft Office 2010 Professional Plus с программным обеспечением
  • Microsoft Office 2013:
  • Power Query Premium: все функции Power Query доступны для: Professional Plus, Office 365 ProPlus или Excel 2013 Standalone
  • Общедоступный запрос Power: доступен для всех остальных SKU Office 2013 для настольных ПК. Включает все функции Power Query, кроме следующих: корпоративный каталог данных Power BI, источники данных на основе Azure, Active Directory, HDFS, списки SharePoint, Oracle, DB2, MySQL, PostgreSQL, Sybase, Teradata, Exchange, Dynamics CRM, SAP BusinessObjects , Salesforce.

Microsoft Power Query для Excel требует Internet Explorer 9 или выше.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .