ПРИХОДИТЕ УЧИТЬСЯ НОВОЙ ПРОФЕССИИ ЛЕТОМ СО СКИДКОЙ ДО 70%Забронировать скидку

Как подсчитать количество объединенных строк в SQL

Пройдите тест, узнайте какой профессии подходите и получите бесплатную карьерную консультацию
В конце подарим скидку до 55% на обучение
Я предпочитаю
0%
Работать самостоятельно и не зависеть от других
Работать в команде и рассчитывать на помощь коллег
Организовывать и контролировать процесс работы

Быстрый ответ

Для подсчета строк в конструкции LEFT JOIN примените функцию COUNT к уникальному столбцу присоединяемой таблицы и сгруппируйте данные по идентификатору основной таблицы. В качестве примера рассмотрим следующий SQL-запрос:

SQL
Скопировать код
SELECT u.id, COUNT(p.id) AS post_count
FROM users u
LEFT JOIN posts p ON u.id = p.user_id
GROUP BY u.id;

Такой запрос подсчитывает количество постов для каждого пользователя, включая тех у кого постов нет. Рекомендуется использовать уникальное поле присоединяемой таблицы (p.id) для подсчета и группировать результат по уникальному поле основной таблицы (u.id) для корректности полученной информации.

Пройдите тест и узнайте подходит ли вам сфера IT
Пройти тест

Применение функций COALESCE и SUM (CASE)

Функция COALESCE позволяет заменить NULL на 0. Вот как её можно применить на практике:

SQL
Скопировать код
SELECT u.id, COALESCE(COUNT(p.id), 0) AS post_count
FROM users u
LEFT JOIN posts p ON u.id = p.user_id
GROUP BY u.id;

Если необходимо провести подсчет событий, выполняющих определенное условие, полезной окажется конструкция SUM(CASE):

SQL
Скопировать код
SELECT u.id, SUM(CASE WHEN p.published = 'true' THEN 1 ELSE 0 END) AS post_count
FROM users u
LEFT JOIN posts p ON u.id = p.user_id
GROUP BY u.id;

Тактики работы с JOIN в сложных ситуациях

Улучшение производительности с помощью предварительной агрегации

При работе с большими объемами данных рекомендуется применять подзапросы для предварительной агрегации данных до выполнения операции JOIN:

SQL
Скопировать код
SELECT u.id, COALESCE(p.post_count, 0)
FROM users u
LEFT JOIN (
    SELECT user_id, COUNT(*) AS post_count
    FROM posts
    GROUP BY user_id
) p ON u.id = p.user_id;

Избегание повторного подсчета

Применяйте COUNT(DISTINCT), чтобы исключить учет повторяющихся записей в подсчете:

SQL
Скопировать код
SELECT u.id, COUNT(DISTINCT p.id) AS post_count
FROM users u
LEFT JOIN posts p ON u.id = p.user_id
GROUP BY u.id;

Включение первичных ключей в оператор SELECT

Для повышения точности результатов включайте первичные ключи в SELECT при группировке:

SQL
Скопировать код
SELECT u.id, COUNT(p.id) AS post_count
FROM users u
LEFT JOIN posts p ON u.id = p.user_id
GROUP BY u.id;

Как правильно создавать JOIN в SQL

При формировании JOIN-ов всегда:

  • Ясно определите связь между таблицами через условие ON.
  • Применяйте алиасы для названий таблиц с целью упрощения кода и повышения его читаемости: u для users и p для posts.
  • Будьте внимательны при размещении условий в WHERE, так как это может влиять на конечный результат операции соединения таблиц.

Визуализация

Можно представить левую таблицу как главную звезду концерта и правую таблицу как передзвездного исполнителя:

Главный исполнитель (🔈 Левая таблица):Звезда 1, Звезда 2, Звезда 3
Передзвездный исполнитель (🎤 Правая таблица):Группа А, Группа А, Группа B, Группа C, Группа C, Группа C

Если посчитать бисы (сколько раз каждая группа выступала до или после главных звезд):

Передзвездный исполнительКоличество бисов
Группа А🎸🎸
Группа B🎸
Группа С🎸🎸🎸

Каждая иконка 🎸 символизирует выступление группы в роли передзвездного исполнителя.

Опасности при работе с JOIN в SQL

Убедитесь, что вы:

  • Правильно обрабатываете совпадения с NULL.
  • Осторожно применяете нестандартные условия соединения, чтобы избежать ошибок.
  • Не злоупотребляете соединением таблиц, поскольку это может привести к снижению производительности и усложнению интерпретации результатов.

Полезные материалы

  1. Понимание LEFT JOIN в SQL – StackOverflow
  2. SQL LEFT JOIN — W3Schools
  3. Обработка NULL в SQL COUNT — StackExchange
  4. Продвинутый SQL: COUNT с CASE — Mode Analytics
  5. Реляционные базы данных: Понимание JOIN-ов — IBM
  6. Различие между SQL DISTINCT и GROUP BY — SQLShack
  7. Настройка производительности SQL для JOIN-ов — Brent Ozar