Сложные задачи и кейсы по SQL: практикум для профессионалов

#Разное

Пройдите тест, узнайте какой профессии подходите

Сколько вам лет

До 18

От 18 до 24

От 25 до 34

От 35 до 44

От 45 до 49

От 50 до 54

Больше 55

Для кого эта статья:

SQL-разработчики уровня senior и специалисты по данным
Люди, готовящиеся к техническим собеседованиям на позиции с высоким уровнем требований
Профессионалы, стремящиеся углубить свои знания в области оптимизации SQL-запросов и сложных аналитических задач

Профессиональное владение SQL давно перестало ограничиваться базовыми SELECT-запросами и простыми JOIN-операциями. Сегодняшние собеседования на позиции senior-разработчиков и data scientists изобилуют задачами, способными поставить в тупик даже специалистов с опытом. Рекурсивные CTE с глубиной вложенности более трёх уровней, многооконные аналитические конструкции и параллельная оптимизация запросов для high-load систем — вот реальный уровень, отделяющий профессионалов от тех, кто просто "знаком с SQL". Погрузимся в практикум по SQL, который не просто расширит ваш технический арсенал, но и даст конкурентное преимущество в мире, где данные — новая нефть. 💻📊

Многоуровневые SQL-задачи для профессионалов баз данных

Настоящее мастерство в работе с SQL проявляется при решении задач, требующих многоуровневого мышления и глубокого понимания механизмов работы СУБД. Рассмотрим несколько задач, которые позволят вам проверить и повысить свою квалификацию.

Александр Коршунов, Lead Database Engineer
На собеседовании с кандидатом на должность старшего разработчика я предложил ему решить задачу, которая выявляет пробелы в понимании иерархических структур данных. У нас была таблица сотрудников с self-референсным полем manager_id. Требовалось найти цепочки подчинения глубиной более 5 уровней, с подсчётом общей зарплаты команды для каждого руководителя третьего уровня.
Кандидат начал строить последовательность вложенных подзапросов, быстро запутался в JOIN-ах и попросил подсказку. Я направил его к использованию рекурсивного CTE с правильным терминирующим условием и агрегированием результатов на каждом уровне. Когда он увидел элегантность этого решения, в его глазах появилось понимание — именно такие моменты трансформируют обычного SQL-разработчика в архитектора баз данных.

Задача 1: Анализ иерархической структуры

WITH RECURSIVE employee_hierarchy AS (
SELECT id, name, manager_id, salary, 1 as level
FROM employees
WHERE manager_id IS NULL

UNION ALL

SELECT e.id, e.name, e.manager_id, e.salary, eh.level + 1
FROM employees e
JOIN employee_hierarchy eh ON e.manager_id = eh.id
WHERE eh.level < 10
)
SELECT 
manager_id,
COUNT(DISTINCT id) as team_size,
SUM(salary) as total_salary,
MAX(level) as hierarchy_depth
FROM employee_hierarchy
WHERE level > 1
GROUP BY manager_id
HAVING MAX(level) >= 5
ORDER BY total_salary DESC;

Эта задача демонстрирует работу с древовидными структурами данных, используя рекурсивные CTE — мощный инструмент для анализа иерархических отношений.

Задача 2: Островные последовательности

Другая классическая проблема — поиск "островов" последовательных значений в данных. Например, нахождение непрерывных периодов активности пользователя:

WITH numbered AS (
SELECT 
user_id, 
activity_date,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY activity_date) as rn,
DATE_SUB(activity_date, INTERVAL ROW_NUMBER() OVER 
(PARTITION BY user_id ORDER BY activity_date) DAY) as grp
FROM user_activities
)
SELECT 
user_id,
MIN(activity_date) as period_start,
MAX(activity_date) as period_end,
COUNT(*) as days_active
FROM numbered
GROUP BY user_id, grp
HAVING COUNT(*) >= 7
ORDER BY user_id, period_start;

Эта техника использует комбинацию оконных функций и GROUP BY для идентификации непрерывных последовательностей — навык, незаменимый при анализе временных рядов и событийных данных.

Категория задач	Ключевые техники	Уровень сложности
Иерархические запросы	Рекурсивные CTE, self-join	Высокий
Временные ряды	Оконные функции, LAG/LEAD	Средний
Островные последовательности	ROW_NUMBER, GROUP BY с математическими трюками	Высокий
Сводные отчеты	PIVOT, динамический SQL	Очень высокий

Для максимального эффекта от практикума создавайте сложные тестовые наборы данных с граничными условиями, аномалиями и дубликатами. Такой подход помогает выявить потенциальные проблемы в реальных системах. 🔍

Продвинутые техники оптимизации сложных SQL-запросов

Оптимизация SQL-запросов — искусство, балансирующее между читабельностью кода и производительностью. Продвинутый SQL-разработчик должен не только писать корректные запросы, но и понимать, как они будут выполняться на уровне движка базы данных.

Елена Сорокина, Senior Data Engineer
В одном из проектов мы столкнулись с проблемой производительности аналитической системы. Критический отчёт, агрегирующий данные о транзакциях клиентов за год, выполнялся более 40 минут. После профилирования выяснилось, что запрос содержал несколько подзапросов, каждый из которых многократно сканировал одни и те же таблицы.
Я переписала запрос, используя технику материализации промежуточных результатов через CTE вместо подзапросов и добавила подсказки оптимизатору для правильного порядка соединения таблиц. Также была проведена денормализация некоторых часто используемых вычисляемых значений. Время выполнения сократилось до 2 минут.
Это наглядно продемонстрировало, что знание теории реляционных баз и механизмов работы конкретной СУБД — не академический интерес, а практическая необходимость для профессионала.

Рассмотрим ключевые техники оптимизации, которые должен знать каждый профессионал:

Материализация промежуточных результатов

Вместо:

SELECT 
customer_id,
(SELECT SUM(amount) FROM orders WHERE customer_id = c.id) as total_orders,
(SELECT COUNT(*) FROM support_tickets WHERE customer_id = c.id) as tickets_count
FROM customers c
WHERE (SELECT MAX(created_at) FROM orders WHERE customer_id = c.id) > '2023-01-01';

Оптимизированная версия:

WITH customer_orders AS (
SELECT 
customer_id, 
SUM(amount) as total_orders,
MAX(created_at) as last_order_date
FROM orders
GROUP BY customer_id
),
customer_tickets AS (
SELECT 
customer_id,
COUNT(*) as tickets_count
FROM support_tickets
GROUP BY customer_id
)
SELECT 
c.id as customer_id,
COALESCE(co.total_orders, 0) as total_orders,
COALESCE(ct.tickets_count, 0) as tickets_count
FROM customers c
LEFT JOIN customer_orders co ON c.id = co.customer_id
LEFT JOIN customer_tickets ct ON c.id = ct.customer_id
WHERE co.last_order_date > '2023-01-01';

Оптимизация JOIN-операций

Порядок соединения таблиц критически влияет на производительность. Используйте следующие принципы:

Соединяйте сначала меньшие таблицы, потом большие
Добавляйте предикаты фильтрации до JOIN, когда это возможно
Используйте подсказки оптимизатору (HASH JOIN, MERGE JOIN) для сложных случаев
Избегайте CROSS JOIN, если не требуется декартово произведение

Индексная оптимизация

Правильные индексы — фундамент быстрых запросов. Но их избыток также вреден, как и недостаток:

-- Анализ использования индексов
EXPLAIN ANALYZE
SELECT 
c.region_id,
COUNT(DISTINCT c.id) as customers,
SUM(o.amount) as total_sales
FROM customers c
JOIN orders o ON c.id = o.customer_id
WHERE o.created_at BETWEEN '2023-01-01' AND '2023-12-31'
AND c.status = 'active'
GROUP BY c.region_id;

Оптимизация подзапросов

Замена коррелированных подзапросов на JOIN-ы часто дает значительный прирост производительности:

-- Вместо
SELECT
department_name,
(SELECT AVG(salary) FROM employees WHERE department_id = d.id) as avg_salary
FROM departments d;

-- Лучше использовать
SELECT
d.department_name,
AVG(e.salary) as avg_salary
FROM departments d
LEFT JOIN employees e ON d.id = e.department_id
GROUP BY d.id, d.department_name;

Техника оптимизации	Когда применять	Потенциальный выигрыш
Материализация через CTE	При повторном использовании подзапросов	5x-20x ускорение
Переписывание подзапросов в JOIN	Для коррелированных подзапросов	3x-10x ускорение
Избирательная индексация	Для частых условий фильтрации и соединения	10x-100x ускорение
Партиционирование таблиц	Для очень больших таблиц с временной компонентой	5x-50x ускорение

Помните, что оптимизация — это итеративный процесс. Используйте инструменты профилирования, чтобы определить узкие места и фокусироваться на них. 🚀

Решение бизнес-кейсов через аналитические SQL-конструкции

Настоящую ценность SQL проявляет при решении комплексных бизнес-задач, где требуется не просто извлечь данные, но и преобразовать их в значимую информацию для принятия решений.

Рассмотрим несколько распространенных бизнес-кейсов и их решения с использованием продвинутых SQL-конструкций:

Кейс 1: Анализ когортной удержанности (Retention Analysis)

Задача: определить, как разные когорты пользователей (сгруппированные по месяцу регистрации) сохраняют активность с течением времени.

WITH user_cohorts AS (
SELECT 
user_id,
DATE_TRUNC('month', registration_date) as cohort_month
FROM users
),
user_activities AS (
SELECT 
a.user_id,
uc.cohort_month,
DATE_TRUNC('month', a.activity_date) as activity_month,
DATEDIFF('month', uc.cohort_month, DATE_TRUNC('month', a.activity_date)) as month_number
FROM activities a
JOIN user_cohorts uc ON a.user_id = uc.user_id
WHERE a.activity_date >= uc.cohort_month
),
cohort_size AS (
SELECT cohort_month, COUNT(DISTINCT user_id) as users
FROM user_cohorts
GROUP BY cohort_month
),
retention AS (
SELECT 
cohort_month,
month_number,
COUNT(DISTINCT user_id) as active_users
FROM user_activities
GROUP BY cohort_month, month_number
)
SELECT 
r.cohort_month,
r.month_number,
r.active_users,
cs.users as cohort_size,
ROUND(100.0 * r.active_users / cs.users, 2) as retention_rate
FROM retention r
JOIN cohort_size cs ON r.cohort_month = cs.cohort_month
ORDER BY r.cohort_month, r.month_number;

Этот запрос визуализирует, как разные когорты пользователей сохраняют активность на протяжении нескольких месяцев, что позволяет оценить эффективность удержания и выявить проблемные периоды.

Кейс 2: Выявление аномалий в транзакционных данных

Задача: обнаружить подозрительные транзакции на основе исторических паттернов расходов клиента.

WITH customer_stats AS (
SELECT 
customer_id,
AVG(amount) as avg_transaction,
STDDEV(amount) as std_transaction,
COUNT(*) as transaction_count
FROM transactions
WHERE transaction_date > CURRENT_DATE – INTERVAL '180 days'
GROUP BY customer_id
HAVING COUNT(*) >= 10
),
recent_transactions AS (
SELECT 
t.*,
cs.avg_transaction,
cs.std_transaction,
(t.amount – cs.avg_transaction) / NULLIF(cs.std_transaction, 0) as z_score
FROM transactions t
JOIN customer_stats cs ON t.customer_id = cs.customer_id
WHERE t.transaction_date > CURRENT_DATE – INTERVAL '7 days'
)
SELECT 
transaction_id,
customer_id,
transaction_date,
amount,
avg_transaction,
z_score,
CASE 
WHEN z_score > 3 THEN 'High Anomaly'
WHEN z_score > 2 THEN 'Medium Anomaly'
ELSE 'Normal'
END as anomaly_type
FROM recent_transactions
WHERE z_score > 2
ORDER BY z_score DESC;

Данный запрос использует статистический подход (z-score) для определения транзакций, существенно отклоняющихся от обычного паттерна расходов клиента.

Кейс 3: Расчет Customer Lifetime Value (CLV)

Задача: определить ожидаемую ценность клиента на протяжении всего времени сотрудничества.

WITH customer_periods AS (
SELECT 
customer_id,
DATE_TRUNC('month', order_date) as order_month,
SUM(order_total) as monthly_revenue
FROM orders
WHERE order_date >= CURRENT_DATE – INTERVAL '2 years'
GROUP BY customer_id, DATE_TRUNC('month', order_date)
),
customer_metrics AS (
SELECT 
customer_id,
COUNT(DISTINCT order_month) as active_months,
COUNT(DISTINCT order_month)::float / 
NULLIF(DATEDIFF('month', MIN(order_month), MAX(order_month)) + 1, 0) as activity_rate,
SUM(monthly_revenue) / COUNT(DISTINCT order_month) as avg_monthly_revenue
FROM customer_periods
GROUP BY customer_id
HAVING COUNT(DISTINCT order_month) >= 3
)
SELECT 
customer_id,
active_months,
activity_rate,
avg_monthly_revenue,
activity_rate * avg_monthly_revenue * 36 as projected_36_month_value, -- 3 года
NTILE(5) OVER (ORDER BY activity_rate * avg_monthly_revenue * 36) as clv_quintile
FROM customer_metrics
ORDER BY projected_36_month_value DESC;

Этот запрос прогнозирует потенциальную ценность клиента на основе его исторической активности и среднемесячных трат, сегментируя клиентов по квинтилям для стратегического управления взаимоотношениями.

При решении бизнес-кейсов с помощью SQL важно помнить о следующих аспектах:

Учитывайте бизнес-логику и специфику предметной области
Уделяйте внимание обработке пограничных случаев и выбросов
Документируйте предположения и ограничения вашего анализа
Проверяйте результаты на подмножестве данных, где ответ известен заранее
Оптимизируйте запросы для производительности, особенно при работе с большими объемами данных

Сложные бизнес-кейсы часто требуют интеграции нескольких техник SQL, включая оконные функции, рекурсивные CTE и продвинутое агрегирование, что позволяет трансформировать сырые данные в стратегические бизнес-инсайты. 📊

Оконные функции и рекурсивные CTE в реальных SQL-задачах

Оконные функции и рекурсивные CTE представляют собой мощный инструментарий современного SQL-разработчика, позволяющий элегантно решать задачи, которые ранее требовали громоздких процедурных конструкций или обработки данных на стороне приложения.

Оконные функции позволяют выполнять вычисления над набором строк, связанных с текущей строкой, без необходимости группировки результатов. Рекурсивные CTE предоставляют механизм для обработки иерархических и графовых структур данных. Рассмотрим их применение в реальных сценариях.

Пример 1: Скользящие агрегаты для финансовой аналитики

Задача: рассчитать скользящее среднее объема торгов за 7 и 30 дней для биржевых инструментов.

SELECT 
trading_date,
symbol,
volume,
AVG(volume) OVER (
PARTITION BY symbol 
ORDER BY trading_date 
ROWS BETWEEN 6 PRECEDING AND CURRENT ROW
) as moving_avg_7d,
AVG(volume) OVER (
PARTITION BY symbol 
ORDER BY trading_date 
ROWS BETWEEN 29 PRECEDING AND CURRENT ROW
) as moving_avg_30d,
(volume – AVG(volume) OVER (
PARTITION BY symbol 
ORDER BY trading_date 
ROWS BETWEEN 29 PRECEDING AND CURRENT ROW
)) / NULLIF(
STDDEV(volume) OVER (
PARTITION BY symbol 
ORDER BY trading_date 
ROWS BETWEEN 29 PRECEDING AND CURRENT ROW
), 0
) as z_score_30d
FROM stock_trades
WHERE trading_date BETWEEN '2023-01-01' AND '2023-12-31'
ORDER BY symbol, trading_date;

Этот запрос не только вычисляет скользящие средние, но и демонстрирует, как можно комбинировать различные оконные функции для расчета нормализованных отклонений (z-score) от среднего.

Пример 2: Ранжирование и нумерация в аналитических отчетах

Задача: ранжировать продукты по объему продаж внутри каждой категории, с определением процентильного ранга.

WITH product_sales AS (
SELECT 
p.category_id,
p.product_id,
p.product_name,
SUM(oi.quantity * oi.unit_price) as total_sales
FROM products p
JOIN order_items oi ON p.product_id = oi.product_id
JOIN orders o ON oi.order_id = o.order_id
WHERE o.order_date BETWEEN '2023-01-01' AND '2023-12-31'
GROUP BY p.category_id, p.product_id, p.product_name
)
SELECT 
ps.*,
ROW_NUMBER() OVER (
PARTITION BY category_id 
ORDER BY total_sales DESC
) as sales_rank_in_category,
RANK() OVER (
PARTITION BY category_id 
ORDER BY total_sales DESC
) as rank_with_ties,
DENSE_RANK() OVER (
PARTITION BY category_id 
ORDER BY total_sales DESC
) as dense_rank,
PERCENT_RANK() OVER (
PARTITION BY category_id 
ORDER BY total_sales DESC
)::numeric(5,4) as percent_rank_in_category,
CUME_DIST() OVER (
PARTITION BY category_id 
ORDER BY total_sales DESC
)::numeric(5,4) as cumulative_distribution,
total_sales / SUM(total_sales) OVER (
PARTITION BY category_id
) as category_sales_share
FROM product_sales
ORDER BY category_id, sales_rank_in_category;

Данный запрос иллюстрирует разнообразие функций ранжирования и их применение для сложного аналитического отчета, включая расчет доли продаж каждого продукта в общем объеме категории.

Пример 3: Рекурсивный CTE для анализа графов отношений

Задача: найти все возможные пути между двумя пунктами в сети авиаперелетов, с ограничением максимум 3 пересадки.

WITH RECURSIVE flight_paths AS (
-- База рекурсии: прямые рейсы из начального аэропорта
SELECT 
from_airport,
to_airport,
flight_number,
departure_time,
arrival_time,
1 as stops,
ARRAY[from_airport, to_airport] as path,
ARRAY[flight_number] as flights
FROM flights
WHERE from_airport = 'JFK' -- начальный аэропорт
AND departure_date = '2023-05-15'

UNION ALL

-- Рекурсивный шаг: добавляем по одному перелету к существующим путям
SELECT 
fp.from_airport,
f.to_airport,
f.flight_number,
f.departure_time,
f.arrival_time,
fp.stops + 1,
fp.path || f.to_airport,
fp.flights || f.flight_number
FROM flight_paths fp
JOIN flights f ON fp.to_airport = f.from_airport
WHERE f.departure_date = '2023-05-15'
AND f.departure_time >= fp.arrival_time + INTERVAL '2 hours'
AND f.to_airport != ALL(fp.path) -- избегаем циклов
AND fp.stops < 3 -- ограничиваем глубину рекурсии
)
SELECT 
path,
flights,
stops,
MIN(arrival_time – departure_time) as min_total_duration
FROM flight_paths
WHERE to_airport = 'LAX' -- конечный аэропорт
GROUP BY path, flights, stops
ORDER BY stops, min_total_duration;

Этот запрос демонстрирует мощь рекурсивных CTE для решения графовых задач, находя все возможные маршруты между аэропортами с учетом ограничений по времени стыковок и количеству пересадок.

Пример 4: Комбинирование оконных функций и рекурсивных CTE

Задача: построить дерево комментариев с глубиной вложенности и дополнительными метриками по каждому комментарию.

WITH RECURSIVE comment_tree AS (
-- Base case: top-level comments
SELECT 
id,
post_id,
user_id,
content,
created_at,
parent_id,
0 as depth,
ARRAY[id] as path
FROM comments
WHERE parent_id IS NULL

UNION ALL

-- Recursive step: replies to comments
SELECT 
c.id,
c.post_id,
c.user_id,
c.content,
c.created_at,
c.parent_id,
ct.depth + 1,
ct.path || c.id
FROM comments c
JOIN comment_tree ct ON c.parent_id = ct.id
),
comment_metrics AS (
SELECT 
ct.*,
COUNT(l.id) as likes_count,
RANK() OVER (
PARTITION BY ct.post_id 
ORDER BY COUNT(l.id) DESC
) as popularity_rank
FROM comment_tree ct
LEFT JOIN likes l ON ct.id = l.comment_id
GROUP BY ct.id, ct.post_id, ct.user_id, ct.content, ct.created_at, 
ct.parent_id, ct.depth, ct.path
)
SELECT 
id,
post_id,
user_id,
REPEAT(' ', depth) || content as indented_content,
depth,
likes_count,
popularity_rank,
path
FROM comment_metrics
WHERE post_id = 12345 -- ID конкретного поста
ORDER BY path;

Данный запрос сочетает рекурсивный CTE для построения дерева комментариев с оконными функциями для ранжирования комментариев по популярности внутри каждого поста.

При работе с оконными функциями и рекурсивными CTE следует помнить о следующем:

Оконные функции могут существенно снизить сложность запросов, но могут быть ресурсоемкими на больших наборах данных
В рекурсивных CTE всегда необходимо иметь условие завершения рекурсии, чтобы избежать бесконечных циклов
Многие СУБД имеют ограничения на глубину рекурсии, которые можно настроить
Комбинирование этих техник с другими продвинутыми возможностями SQL расширяет диапазон задач, решаемых на уровне базы данных

Овладение оконными функциями и рекурсивными CTE — важный этап эволюции SQL-разработчика, открывающий новые горизонты для решения сложных аналитических и алгоритмических задач. 🌟

Подготовка к техническим собеседованиям через SQL-практикум

Технические собеседования на позиции, связанные с работой с данными, почти всегда включают задачи по SQL. Уровень их сложности варьируется от базовых запросов для junior-позиций до комплексных кейсов для senior-специалистов и team lead'ов. Подготовка к таким собеседованиям требует системного подхода и практики решения разнообразных задач.

Рассмотрим типичные категории SQL-задач на собеседованиях и стратегии подготовки к ним:

1. Агрегация и группировка данных с условиями

Пример задачи: "Найдите средний чек для каждого клиента, который совершил более 5 покупок, и выведите только тех клиентов, у которых средний чек выше среднего по всей базе".

WITH customer_averages AS (
SELECT 
customer_id,
COUNT(*) as orders_count,
AVG(total_amount) as avg_order_value
FROM orders
GROUP BY customer_id
HAVING COUNT(*) > 5
),
global_average AS (
SELECT AVG(total_amount) as global_avg_order
FROM orders
)
SELECT 
ca.customer_id,
ca.orders_count,
ca.avg_order_value,
ga.global_avg_order,
(ca.avg_order_value / ga.global_avg_order – 1) * 100 as percent_above_average
FROM customer_averages ca
CROSS JOIN global_average ga
WHERE ca.avg_order_value > ga.global_avg_order
ORDER BY percent_above_average DESC;

2. Многоуровневые подзапросы и временные таблицы

Пример задачи: "Для каждого отдела найдите сотрудника с самой высокой зарплатой и сотрудника, работающего дольше всех. Если это один и тот же сотрудник, отметьте это".

WITH department_salary_leaders AS (
SELECT 
d.department_id,
d.department_name,
e.employee_id as top_salary_employee_id,
e.employee_name as top_salary_employee,
e.salary,
ROW_NUMBER() OVER (PARTITION BY d.department_id ORDER BY e.salary DESC) as salary_rank
FROM departments d
JOIN employees e ON d.department_id = e.department_id
),
department_tenure_leaders AS (
SELECT 
d.department_id,
d.department_name,
e.employee_id as longest_tenure_employee_id,
e.employee_name as longest_tenure_employee,
e.hire_date,
ROW_NUMBER() OVER (PARTITION BY d.department_id ORDER BY e.hire_date ASC) as tenure_rank
FROM departments d
JOIN employees e ON d.department_id = e.department_id
)
SELECT 
dsl.department_id,
dsl.department_name,
dsl.top_salary_employee,
dsl.salary,
dtl.longest_tenure_employee,
dtl.hire_date,
CASE 
WHEN dsl.top_salary_employee_id = dtl.longest_tenure_employee_id 
THEN 'Same person' 
ELSE 'Different people' 
END as comparison
FROM department_salary_leaders dsl
JOIN department_tenure_leaders dtl ON dsl.department_id = dtl.department_id
WHERE dsl.salary_rank = 1 AND dtl.tenure_rank = 1
ORDER BY dsl.department_name;

3. Решение задач на нахождение дубликатов и аномалий

Пример задачи: "Найдите клиентов, которые сделали два или более заказа в один день, причем сумма этих заказов превышает их средний месячный оборот за последний год".

WITH daily_orders AS (
SELECT 
customer_id,
DATE(order_date) as order_day,
COUNT(*) as orders_per_day,
SUM(total_amount) as daily_total
FROM orders
WHERE order_date >= CURRENT_DATE – INTERVAL '1 year'
GROUP BY customer_id, DATE(order_date)
HAVING COUNT(*) >= 2
),
monthly_averages AS (
SELECT 
customer_id,
AVG(monthly_total) as avg_monthly_total
FROM (
SELECT 
customer_id, 
DATE_TRUNC('month', order_date) as order_month,
SUM(total_amount) as monthly_total
FROM orders
WHERE order_date >= CURRENT_DATE – INTERVAL '1 year'
GROUP BY customer_id, DATE_TRUNC('month', order_date)
) monthly_orders
GROUP BY customer_id
)
SELECT 
do.customer_id,
c.customer_name,
do.order_day,
do.orders_per_day,
do.daily_total,
ma.avg_monthly_total,
(do.daily_total / ma.avg_monthly_total) * 100 as percent_of_monthly_avg
FROM daily_orders do
JOIN monthly_averages ma ON do.customer_id = ma.customer_id
JOIN customers c ON do.customer_id = c.customer_id
WHERE do.daily_total > ma.avg_monthly_total
ORDER BY percent_of_monthly_avg DESC;

Стратегии подготовки к SQL-собеседованиям:

Создайте личный каталог решенных задач. Систематизируйте задачи по типам, уровню сложности и используемым техникам. Регулярно возвращайтесь к ранее решенным задачам для закрепления.
Практикуйтесь на реальных данных. Используйте общедоступные наборы данных или создайте собственную тестовую базу с достаточным объемом и разнообразием данных.
Решайте задачи на время. На собеседовании у вас будет ограниченное время, поэтому важно уметь быстро формулировать решение.
Объясняйте свое решение вслух. Практикуйте не только написание SQL-кода, но и его объяснение — это важный навык для технического собеседования.
Изучите особенности разных СУБД. Знайте синтаксические различия между MySQL, PostgreSQL, MS SQL Server и Oracle, поскольку собеседование может проходить на любой из этих платформ.

Распространенные ошибки на SQL-собеседованиях:

Неправильное использование JOIN-типов (особенно LEFT JOIN vs INNER JOIN)
Забытые условия фильтрации, приводящие к декартову произведению таблиц
Неоптимальные запросы с избыточными подзапросами
Игнорирование краевых случаев (NULL-значения, пустые результаты)
Недостаточное внимание к проверке синтаксиса и логики решения

Ресурсы для подготовки:

LeetCode и HackerRank имеют разделы с SQL-задачами различной сложности
SQLZoo предлагает интерактивные уроки и упражнения
Mode Analytics имеет серию учебных материалов по SQL для аналитиков
PostgreSQL и MySQL документация содержит углубленные разделы по продвинутому SQL
StackOverflow — отличный ресурс для изучения реальных проблем и их решений

И, наконец, ключевые темы, которые следует изучить и практиковать перед SQL-собеседованием:

Тема	Важность (1-10)	Типичные задачи
Оконные функции	9	Скользящие агрегаты, ранжирование, кумулятивные суммы
Рекурсивные CTE	8	Иерархические данные, графы, траверс деревьев
Сложные JOIN-операции	10	Многотабличные соединения с условиями, self-join
Агрегирование и группировка	10	GROUP BY с HAVING, сложные агрегаты
Оптимизация запросов	9	Переписывание подзапросов, использование индексов
Временные ряды	7	Анализ трендов, скользящие окна, сезонность
Обработка NULL-значений	8	COALESCE, NULLIF, IS NULL/IS NOT NULL

Регулярная практика и систематический подход к решению SQL-задач — ключ к успешному прохождению технических собеседований и, что более важно, к развитию навыков, необходимых для эффективной работы с данными в реальных проектах. 💪

Профессиональный рост в SQL — это марафон, а не спринт. Решение сложных задач и оптимизация запросов требуют не только технических знаний, но и глубокого понимания структур данных, бизнес-логики и особенностей конкретных СУБД. Постоянно расширяйте свой арсенал приемов, экспериментируйте с различными подходами к решению одной задачи и анализируйте планы выполнения запросов. Помните: настоящий SQL-мастер не тот, кто знает все синтаксические конструкции, а тот, кто умеет подбирать оптимальный инструмент для каждой конкретной задачи, балансируя между производительностью, читаемостью кода и поддерживаемостью решения.

Читайте также

Проверь как ты усвоил материалы статьи

Пройди тест и узнай насколько ты лучше других читателей

Какой SQL-запрос можно использовать для определения региона, который приносит наибольшую прибыль?

1 / 5

Владимир Титов

редактор про сервисные сферы

Свежие материалы

Вставка и редактирование изображений в Google Презентациях

6 сентября 2024

Вопросы по SQL на собеседовании для тестировщиков

6 сентября 2024

Основные принципы работы HTTPS

6 сентября 2024

Сложные задачи и кейсы по SQL: практикум для профессионалов

Многоуровневые SQL-задачи для профессионалов баз данных

Продвинутые техники оптимизации сложных SQL-запросов

Решение бизнес-кейсов через аналитические SQL-конструкции

Оконные функции и рекурсивные CTE в реальных SQL-задачах

Подготовка к техническим собеседованиям через SQL-практикум

Загрузка...