1

Я использую MS Excel 2013 на настольном компьютере Windows.

Исходный рабочий лист, над которым я работаю, содержит около 200 000 строк или 4 000 000 ячеек и предназначен для людей, которые скачали файл .pdf, заказали издание в мягкой обложке и / или приобрели определенный продукт впоследствии.

Я хотел бы ответить на следующие вопросы для себя:

  1. Что было заказано в первую очередь, .pdf или файл в мягкой обложке, прежде чем сделать окончательный заказ? Всего по годам, месяцам и т.д.
  2. Сколько процентов клиентов сначала заказали файл PDF, а сколько процентов заказали листовку в первую очередь?

Дополнительная информация:

  • Некоторые люди заказывали только PDF-файл
  • Другие люди заказали только файл в мягкой обложке
  • И другие заказали PDF также файл в мягкой обложке.

Эти заказы регистрируются отдельно, потому что заказы выполняются в разное время и / или даты.

Я уже пробовал много вариантов фильтрации в Excel, но пока ничего не получалось. Я уже отфильтровал строки по имени и времени, даже в сводных таблицах, но не могу получить ответ:

Около ...% времени, когда PDF (или тип файла в мягкой обложке) заказывается первым.

Вы можете взглянуть на пример примера файла рабочей таблицы здесь (этот файл я создал, поэтому весь контент в ячейках не имеет смысла, на самом деле :-)

Можно ли отфильтровать это за период времени? Как по годам / месяцам / и т.д.? И возможно ли это в сводной таблице или я должен искать другое решение?

Я просто не могу получить желаемый результат (который был заказан первым? .Pdf или файл в мягкой обложке, прежде чем сделать окончательный заказ продукта?).

Может кто-нибудь, пожалуйста, помогите?

Ох ... еще один (второй) вопрос ...: Как узнать, сколько дубликатов имен в этом листе?(так: сколько клиентов получили один или несколько продуктов? Это не то же самое, что общее количество заказанных товаров, потому что некоторые из них заказали два или более товара. В примере таблицы легко сосчитать, но в файле из 200 000 строк это не так просто).

1 ответ1

0

Я бы использовал Power Query Add-In для этого. У него много возможностей для преобразования данных, но, вероятно, ключевыми шагами для вашей задачи будут:

  1. Создайте "базовый" запрос на основе вашей таблицы и добавьте столбец индекса (для дальнейшего использования).
  2. Создайте запрос "Клиент", ссылаясь на первый запрос, и используйте Группу по группам для Клиента, покажите столбец «Мин. Индекс».
  3. Создайте запрос, ссылаясь на запрос "Base", затем объедините его с запросом "Customer", используя Customer и Index (= Min Index) - это может показать вам, каким был первый заказ каждого клиента.

Я надеюсь, что вы начали.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .