Выборка строк из PostgreSQL, отсутствующих в другой таблице

Пройдите тест, узнайте какой профессии подходите

Я предпочитаю
0%
Работать самостоятельно и не зависеть от других
Работать в команде и рассчитывать на помощь коллег
Организовывать и контролировать процесс работы

Быстрый ответ

Для извлечения данных из table1, которые не встречаются в table2, лучше всего использовать конструкцию NOT EXISTS с подзапросом в контексте table2. Таким образом, мы можем эффективно сопоставлять наши записи в table1:

SQL
Скопировать код
SELECT *
FROM table1 t1
WHERE NOT EXISTS (
    SELECT 1
    FROM table2
    WHERE table2.id = t1.id
);

Этот метод изящно отсеивает записи из table1, для которых в table2 нет соответствий по полю id.

Кинга Идем в IT: пошаговый план для смены профессии

Расширенный запрос: Альтернативы и распространенные ошибки

Метод с LEFT JOIN / IS NULL

Применение LEFT JOIN / IS NULL является эффективным, если СУБД хорошо оптимизирует join-операции:

SQL
Скопировать код
SELECT t1.*
FROM table1 t1
LEFT JOIN table2 t2 ON t1.id = t2.id
WHERE t2.id IS NULL;
Подробнее об этом расскажет наш спикер на видео
skypro youtube speaker

EXCEPT и ALL: Мощное сочетание

Если нужны только уникальные строки, EXCEPT может стать отличным решением:

SQL
Скопировать код
SELECT id 
FROM table1
EXCEPT
SELECT id 
FROM table2;

Запомните, что EXCEPT по умолчанию удаляет дубликаты. Для сравнения с учётом повторений используйте ALL.

NOT IN – применяйте с осмотрительностью

Оператор NOT IN может казаться привлекательным своей простотой, однако с ним связаны определенные трудности. Например, наличие NULL значений в table2.id приводит к некорректным результатам, и данная конструкция может быть неэффективна при масштабировании базы данных:

SQL
Скопировать код
SELECT *
FROM table1
WHERE id NOT IN (SELECT id FROM table2);

Дьявол в мелочах: Оптимизация запросов

Поиск общих свойств

Анализируя данные в различных таблицах, всегда сопоставляйте колонки с аналогичным значением или содержимым.

Уточнение условий в WHERE

Ключом к эффективным результатам запросов является грамотно составленный предикат в WHERE. Четкое определение условий обеспечивает большую вероятность оптимизации запроса.

Оптимизируем SELECT

Составляя SELECT, следуйте правилу включения только необходимых для анализа колонок. Это снижает нагрузку на сервер и ускоряет обработку запросов.

Визуализация

Представим, что table1 (🏘️🅰️) содержит дома наших друзей, а table2 (🏘️🅱️) — дома незнакомцев. Мы хотим послать приглашения (💌) только нашим друзьям.

Markdown
Скопировать код
🏘️🅰️: [Дом 1, Дом 2, Дом 3]
🏘️🅱️: [Дом 2, Дом 3, Дом 4]
SQL
Скопировать код
SELECT НомерДома FROM 🏘️🅰️
EXCEPT
SELECT НомерДома FROM 🏘️🅱️;

Результат будет следующим:

Markdown
Скопировать код
💌🚚: [Дом 1]

Здесь 💌🚚 означает дома, получившие от нас приглашения. В результате только Дом 1 из table1 (🏘️🅰️) не совпадает с table2 (🏘️🅱️), и именно он получает приглашение.

Практическое применение

Рассмотрим пример поиска IP-адресов, которые зарегистрированы в login_log, но отсутствуют в ip_location:

SQL
Скопировать код
SELECT ip
FROM login_log
WHERE NOT EXISTS (
    SELECT 1
    FROM ip_location
    WHERE ip_location.ip = login_log.ip
);

Это помогает идентифицировать незарегистрированные IP для дальнейшего анализа с точки зрения безопасности, или для очистки данных.

Логика и отладка

Синтаксические ошибки и неоптимальность запросов могут проявиться в самый неподходящий момент. Используйте встроенные инструменты СУБД, например, EXPLAIN plans, чтобы выявить проблемы производительности.

Дополнительные фильтры для точности

Иногда, добавляя дополнительные фильтры, можно повысить точность выборки данных:

SQL
Скопировать код
SELECT ip
FROM login_log
WHERE NOT EXISTS (
   SELECT 1
   FROM ip_location
   WHERE ip_location.ip = login_log.ip
)
AND login_log.date >= '2023-01-01';

Добавление колонки date позволяет фильтровать данные за конкретный период времени.

Полезные материалы

  1. SQL LEFT JOIN Keyword — подробное изучение SQL JOIN, одной из ключевых особенностей работы с реляционными базами данных.
  2. Select rows which are not present in other table – Stack Overflowпрактический опыт коллег и обсуждение вопроса выборки строк, отсутствующих в другой таблице SQL.
  3. Different Ways to Compare SQL Server Tables Schema and Data — статья об опциях сравнения схем и данных таблиц в SQL Server, помогающая выявить отсутствующие данные.
  4. PostgreSQL: Documentation: Joins Between Tablesполезный ресурс из официальной документации PostgreSQL, рассказывающий о соединении таблиц и методах выделения уникальных записей.
Проверь как ты усвоил материалы статьи
Пройди тест и узнай насколько ты лучше других читателей
Какой метод SQL лучше всего использовать для извлечения данных из table1, которые отсутствуют в table2?
1 / 5