У меня есть набор данных из 100 000 строк. Он настроен таким образом, что столбец A содержит имя группы, а затем повторяет имя группы для числа уникальных членов этой группы. Я пытаюсь подсчитать, сколько раз значение появляется дважды и только дважды.

  • Значение никогда не появится только один раз - за ним всегда будет "имя группы", за которым сразу следует, сколько членов в этой группе, в отдельных строках. Таким образом, для любой отдельной сущности всегда есть как минимум 2 строки.
  • Чаще всего значение будет появляться 3 или более раз.
  • Если значение появляется 3 или более раз, я не хочу включать какие-либо из этих строк в число. Я действительно ищу количество раз, когда появляется отдельная пара.

2 ответа2

0

Предполагая, что ваши данные в A1:A100000

1) Скопируйте все уникальные значения в отдельный столбец (используя Данные -> расширенный фильтр) - я буду использовать столбец C для моего примера.

2) Поместите следующую формулу: =Countif(A$1:A$100000, C1) в D1, затем заполните каждую ячейку в D для каждого уникального значения в C.

3) В другой ячейке используйте следующую формулу: =Countif(D1:D??, 2) (где ?? последний ряд столбцов C и D)

0

Скопируйте следующую формулу в столбец b:

=COUNTIF($A$1:$A$100000,A1)=2

Это позволит идентифицировать все пары. Однако он покажет обе записи в паре. В этих случаях я обычно делаю (хотя это нарушает провидение данных), копируя этот отфильтрованный список на другой лист и удаляя дубликаты.

Если вы хотите сделать это повторяемым способом, который поддерживает провидение, то я рекомендую использовать уникальную формулу массива типа списка после выполнения подсчета

Вариант B, это использование сводной таблицы, размещение значений в столбце A в строках, count(A) в значениях и фильтрация строк в значениях, где count = 2

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .