Поиск и удаление дубликатов в Excel - полное руководство

Посмотреть видео - Как найти и удалить дубликаты в Excel

С большим количеством данных … приходит много повторяющихся данных.

Дубликаты в Excel могут доставить массу неприятностей. Независимо от того, импортируете ли вы данные из базы данных, получаете их от коллеги или сопоставляете сами, дубликаты данных всегда могут закрасться. А если данные, с которыми вы работаете, огромны, тогда становится действительно сложно найти и удалить эти дубликаты в Excel. .

В этом руководстве я покажу вам, как найти и удалить дубликаты в Excel.

СОДЕРЖАНИЕ:

  1. НАЙДИТЕ и ВЫДЕЛЯЙТЕ дубликаты в Excel.
    • Найдите и выделите дубликаты в одном столбце.
    • Найдите и выделите дубликаты в нескольких столбцах.
    • Найдите и выделите повторяющиеся строки.
  2. УДАЛИТЬ Дубликаты в Excel.
    • Удалите дубликаты из одного столбца.
    • Удалите дубликаты из нескольких столбцов.
    • Удалите повторяющиеся строки.

Найдите и выделите дубликаты в Excel

Дубликаты в Excel могут быть разных форм. Вы можете разместить его в одном столбце или в нескольких столбцах. Также может быть дублирование всей строки.

Поиск и выделение дубликатов в одном столбце в Excel

Условное форматирование упрощает выделение дубликатов в Excel.

Вот как это сделать:

  • Выберите данные, в которых вы хотите выделить дубликаты.

  • Перейдите на главную -> Условное форматирование -> Выделить правила ячеек -> Повторяющиеся значения.

  • В диалоговом окне «Повторяющиеся значения» выберите «Дублировать» в раскрывающемся списке слева и укажите формат, в котором вы хотите выделить повторяющиеся значения. Вы можете выбрать один из готовых вариантов формата (в раскрывающемся списке справа) или указать собственный формат.

  • Это выделит все значения, у которых есть дубликаты.

Быстрая подсказка: Не забудьте проверить наличие начальных или конечных пробелов. Например, «Джон» и «Джон» считаются разными, поскольку в последнем есть дополнительный пробел. Хорошей идеей было бы использовать функцию TRIM для очистки ваших данных.

Поиск и выделение дубликатов в нескольких столбцах в Excel

Если у вас есть данные, охватывающие несколько столбцов, и вам нужно искать в них дубликаты, процесс в точности такой же, как описано выше.

Вот как это сделать:

  • Выберите данные.
  • Перейдите на главную -> Условное форматирование -> Выделить правила ячеек -> Повторяющиеся значения.
  • В диалоговом окне «Повторяющиеся значения» выберите «Дублировать» в раскрывающемся списке слева и укажите формат, в котором вы хотите выделить повторяющиеся значения.
  • Это выделит все ячейки, которые имеют повторяющиеся значения в выбранном наборе данных.

Поиск и выделение повторяющихся строк в Excel

Поиск повторяющихся данных и поиск повторяющихся строк данных - это две разные вещи. Взгляни:

Найти повторяющиеся строки немного сложнее, чем найти повторяющиеся ячейки.

Вот шаги:

  • В соседнем столбце используйте следующую формулу:
    = A2, B2, C2 и D2
    Перетащите его вниз для всех строк. Эта формула объединяет все значения ячеек в одну строку. (Вы также можете использовать функцию СЦЕПИТЬ для объединения текстовых строк)

Таким образом, мы создали одну строку для каждой строки. Если в этом наборе данных есть повторяющиеся строки, эти строки будут для него точно такими же.

Теперь, когда у нас есть объединенные строки для каждой строки, мы можем использовать условное форматирование для выделения повторяющихся строк. Выделенная строка означает, что строка имеет дубликат.

Вот шаги, чтобы выделить повторяющиеся строки:

  • Выберите диапазон, содержащий объединенные строки (в этом примере E2: E16).
  • Перейдите на главную страницу -> Условное форматирование -> Выделите правила ячеек -> Повторяющиеся значения.
  • В диалоговом окне «Повторяющиеся значения» убедитесь, что выбран параметр «Дублировать», а затем укажите цвет, которым вы хотите выделить повторяющиеся значения.

Это выделит повторяющиеся значения в столбце E.

В описанном выше подходе мы выделили только те строки, которые мы создали.

Но что, если вы хотите выделить все повторяющиеся строки (вместо выделения ячеек в одном столбце)?

Вот шаги, чтобы выделить повторяющиеся строки:

  • В соседнем столбце используйте следующую формулу:
    = A2, B2, C2 и D2
    Перетащите его вниз для всех строк. Эта формула объединяет все значения ячеек в одну строку.

  • Выберите данные A2: D16.
  • Выбрав данные, перейдите в раздел «Главная» -> «Условное форматирование» -> «Новое правило».

  • В диалоговом окне «Новое правило форматирования» нажмите «Использовать формулу, чтобы определить, какие ячейки нужно форматировать».
  • В поле ниже используйте следующую функцию СЧЁТЕСЛИ:
    = СЧЁТЕСЛИ ($ E $ 2: $ E $ 16, $ E2)> 1

  • Выберите формат и нажмите ОК.

Эта формула выделит все строки, у которых есть дубликаты.

Удалить дубликаты в Excel

В приведенном выше разделе мы узнали, как находить и выделять дубликаты в Excel. В этом разделе я покажу вам, как избавиться от этих дубликатов.

Удаление дубликатов из одного столбца в Excel

Если у вас есть данные в одном столбце и вы хотите удалить все дубликаты, выполните следующие действия:

  • Выберите данные.
  • Перейдите в Данные -> Инструменты для работы с данными -> Удалить дубликаты.
  • В диалоговом окне «Удалить дубликаты»:
    • Если у ваших данных есть заголовки, убедитесь, что установлен флажок «Мои данные содержат заголовки».
    • Убедитесь, что столбец выбран (в этом случае есть только один столбец).

  • Щелкните ОК.

Это удалит все повторяющиеся значения из столбца, и вы получите только уникальные значения.

ОСТОРОЖНОСТЬ: Это изменяет ваш набор данных, удаляя дубликаты. Убедитесь, что у вас есть резервная копия исходного набора данных. Если вы хотите извлечь уникальные значения в каком-то другом месте, скопируйте этот набор данных в это место, а затем выполните вышеупомянутые шаги. Кроме того, вы также можете использовать расширенный фильтр для извлечения уникальных значений в другое место.

Удалить дубликаты из нескольких столбцов в Excel

Предположим, у вас есть данные, как показано ниже:

В приведенных выше данных строки №2 и №16 содержат одинаковые данные для торгового представителя, региона и суммы, но разные даты (так же обстоит дело со строками №10 и №13). Это может быть ошибка ввода, когда одна и та же запись была записана дважды с разными датами.

Чтобы удалить повторяющуюся строку в этом случае:

  • Выберите данные.
  • Перейдите в Данные -> Инструменты для работы с данными -> Удалить дубликаты.
  • В диалоговом окне «Удалить дубликаты»:
    • Если у ваших данных есть заголовки, убедитесь, что установлен флажок «Мои данные содержат заголовки».
    • Выберите все столбцы, кроме столбца Дата.

  • Щелкните ОК.

Это приведет к удалению 2 повторяющихся записей.

ПРИМЕЧАНИЕ. При этом сохраняется первое вхождение и удаляются все оставшиеся повторяющиеся вхождения.

Удалить повторяющиеся строки в Excel

Чтобы удалить повторяющиеся строки, выполните следующие действия:

  • Выделите все данные.
  • Перейдите в Данные -> Инструменты для работы с данными -> Удалить дубликаты.
  • В диалоговом окне «Удалить дубликаты»:
    • Если у ваших данных есть заголовки, убедитесь, что установлен флажок «Мои данные содержат заголовки».
    • Выделите все столбцы.

  • Щелкните ОК.

Используйте вышеупомянутые методы, чтобы очистить свои данные и избавиться от дубликатов.

Вам также могут понравиться следующие руководства по Excel:

  • 10 способов очистки данных в таблицах Excel.
  • Удалите начальные и конечные пробелы в Excel.
  • 24 ежедневных проблемы с Excel и их быстрые решения.
  • Как найти объединенные ячейки в Excel.

Вы поможете развитию сайта, поделившись страницей с друзьями

wave wave wave wave wave