Сравнение неупорядоченных списков на равенство в Python

Пройдите тест, узнайте какой профессии подходите

Я предпочитаю
0%
Работать самостоятельно и не зависеть от других
Работать в команде и рассчитывать на помощь коллег
Организовывать и контролировать процесс работы

Быстрый ответ

В качестве первоначального варианта сравнения неупорядоченных списков можно использовать collections.Counter:

Python
Скопировать код
from collections import Counter

# Есть ли эквивалентность между нашими списками? Проверим это.
эквивалентны = Counter(список1) == Counter(список2) 

# Например:
эквивалентны = Counter([1, 2, 3]) == Counter([3, 2, 1])  # Это правда

collections.Counter рассматривает списки как мультимножества, поэтому порядок элементов при сравнении не учитывается.

Кинга Идем в IT: пошаговый план для смены профессии

Проблема дублирующихся элементов

Функция Python set() эффективна при работе с неупорядоченными множествами, однако она игнорирует дублированные элементы, так как имеет дело только с уникальными значениями:

Python
Скопировать код
эквивалентны_с_множеством = set(['яблоко', 'яблоко', 'банан']) == set(['банан', 'яблоко'])  # Это неверно, так как set() не учел второе яблоко.

Для учёта дубликатов следует использовать collections.Counter(), который подсчитывает количество элементов каждого типа:

Python
Скопировать код
from collections import Counter

эквивалентны = Counter(['яблоко', 'яблоко', 'банан']) == Counter(['банан', 'яблоко', 'яблоко'])  # Это правда, ведь Counter() учел каждое "яблоко".

Когда важен порядок: сортировка списков

Если порядок элементов играет ключевую роль, то можно воспользоваться функцией sorted():

Python
Скопировать код
эквивалентны = sorted(список1) == sorted(список2)  

# Например:
эквивалентны = sorted(['яблоко', 'банан', 'яблоко']) == sorted(['банан', 'яблоко', 'яблоко'])  # Это правда, отсортированные списки идентичны.

Помните, что использование sorted() – это путь к восстановлению порядка в данных!

Эффективное программирование — залог успешной работы

Когда обрабатываете большие списки, не забудьте об эффективности вашего кода. Подсчёт длины списков позволяет избежать ненужных операций:

Python
Скопировать код
# Эффективная стратегия обнаружения различий
if len(список1) != len(список2):
    эквивалентны = False
else:
    эквивалентны = Counter(список1) == Counter(список2)

Визуализация

Самый визуальный путь понять – визуализировать.

Представим, что мы хотим сравнить две горсти цветных бусинок и установить, одинаковы ли они по составу, не обращая внимания на их порядок:

Markdown
Скопировать код
Набор А: [🔵, 🔴, 🟢, 🟡]
Набор B: [🟢, 🔴, 🔵, 🟡]

Для определения эквивалентности, устанавливаем взаимное соответствие между бусинками из разных наборов:

Markdown
Скопировать код
🔵 ↔️ 🔵
🔴 ↔️ 🔴
🟢 ↔️ 🟢
🟡 ↔️ 🟡

Итак, оба набора оказались эквивалентными.

Решение проблем: При возникновении трудностей

Беда с нехешируемыми типами

collections.Counter() и set() предназначены для работы с хешируемыми типами. Но если вы имеете дело с нехешируемыми типами, такими как списки или словари, следует:

  • Преобразовывать их в хешируемые объекты (например, list в tuple).
  • Реализовать собственный способ сравнения, основанный на последовательной проверке элементов списков.
Подробнее об этом расскажет наш спикер на видео
skypro youtube speaker

Оценка сложности выполнения

Python – замечательный язык, но большая вычислительная сложность может вызывать трудности. Сравнение с Counter займет времени O(N), а для создания Counter также необходимо O(N). Сортировка, в свою очередь, потребует времени O(N log N).

Мудрый выбор инструментов основан на анализе и разумном принятии решения!

А что если ваши данные особенного типа?

При сравнении списков собственных объектов учитывайте следующее: корректно реализованные методы __eq__ и __hash__ обеспечат успешное сравнение объектов, как будто они точно знают, что от них ожидается.

Полезные материалы

  1. 5. Структуры данных — Документация Python 3.12.2
  2. Как эффективно сравнивать два неупорядоченных списка (не множества)? – Stack Overflow
  3. Python | Проверка идентичности двух списков – GeeksforGeeks
  4. collections — Типы контейнеров данных — Документация Python 3.12.2
  5. Множество Python (С примерами)
  6. 3. Модель данных — Документация Python 3.12.2
  7. HowTo/Sorting – Python Wiki
Проверь как ты усвоил материалы статьи
Пройди тест и узнай насколько ты лучше других читателей
Какой модуль можно использовать для сравнения неупорядоченных списков с учетом дубликатов?
1 / 5