sql что такое коррелированный запрос
Подзапросы
Выполнение подзапросов
T-SQL поддерживает функциональность подзапросов (subquery), то есть таких запросов, которые могут встроены в другие запросы.
Например, создадим таблицы для товаров, покупателей и заказов:
Таблица Orders содержит ссылки на две другие таблицы через поля ProductId и CustomerId.
Добавим в таблицы некоторые данные:
Подзапрос выполняет команду SELECT и заключается в скобки. В данном же случае при добавлении одного товара выполняется три подзапроса. Каждый подзапрос возвращает одного скалярное значение, например, числовой идентификатор.
В данном случае подзапросы выполнялись к другой таблице, но могут выполняться и к той же, к которой вызывается основной запрос. Например, найдем товары из таблицы Products, которые имеют минимальную цену:
Или найдем товары, цена которых выше средней:
Коррелирующие подзапросы
Подзапросы бывают коррелирующими и некоррелирующими. В примерах выше команды SELECT выполняли фактически один подзапрос для всей команды, например, подзапрос возвращает минимальную или среднюю цену, которая не изменится, сколько бы мы строк не выбирали в основном запросе. То есть результат подзапроса не зависел от строк, которые выбираются в основном запросе. И такой подзапрос выполняется один раз для всего внешнего запроса.
Но также существуют коррелирующие подзапросы (correlated subquery), результаты которых зависят от строк, которые выбираются в основном запросе.
Например, выберем все заказы из таблицы Orders, добавив к ним информацию о товаре:
Здесь для каждой строки из таблицы Orders будет выполняться подзапрос, результат которого зависит от столбца ProductId. И каждый подзапрос может возвращать различные данные.
Коррелирующий подзапрос может выполняться и для той же таблицы, к которой выполняется основной запрос. Например, выберем из таблицы Products те товары, стоимость которых выше средней цены товаров для данного производителя:
В данном случае определено два коррелирующих подзапроса. Первый подзапрос определяет спецификацию столбца AvgPrice. Он будет выполняться для каждой строки, извлекаемой из таблицы Products. В подзапрос передается производитель товара и на его основе выбирается средняя цена для товаров именно этого производителя. И так как производитель у товаров может отличаться, то и результат подзапроса в каждом случае также может отличаться.
Второй подзапрос аналогичен, только он используется для фильтрации извлекаемых из таблицы Products. И также он будет выполняться для каждой строки.
Чтобы избежать двойственности при фильтрации в подзапросе при сравнении производителей ( SubProds.Manufacturer=Prods.Manufacturer ) для внешней выборки установлен псевдоним Prods, а для выборки из подзапросов определен псевдоним SubProds.
Следует учитывать, что коррелирующие подзапросы выполняются для каждой отдельной строки выборки, то выполнение таких подзапросов может замедлять выполнение всего запроса в целом.
Коррелирующие подзапросы
Коррелирующие подзапросы позволяют иногда очень кратко написать запросы, которые могут выглядеть весьма громоздко при использовании других языковых средств. Напомним, что коррелирующий подзапрос — это подзапрос, который содержит ссылку на столбцы из включающего его запроса (назовем его основным). Таким образом, коррелирующий подзапрос будет выполняться для каждой строки основного запроса, так как значения столбцов основного запроса будут меняться.
Требуется определить дату и рейсы каждого пассажира, совершенные им в свой последний полетный день.
Иными словами, нужно определить максимальную дату полета для каждого пассажира и найти все его рейсы за эту дату. С определением максимальной даты нет никаких проблем:
Однако тут нет рейса. Если мы попытаемся включить рейс в список вывода:
|
Здесь для каждого рейса проверяется, совершен ли он в последний полетный день данного пассажира. При этом если таких рейсов было несколько, мы получим их все.
Очевидным недостатком приведенного решения как раз и является то, что подзапрос должен вычисляться для каждой строки основного запроса. Чтобы избежать этого, можно предложить альтернативное решение, использующее соединение таблицы Pass_in_trip с приведенным в самом начале подзапросом, который вычисляет максимальные даты по каждому пассажиру:
Напомним, что приведенные здесь примеры можно выполнить непосредственно на сайте, установив флажок «Без проверки» на странице с упражнениями на SELECT.
Коррелированные подзапросы SQL
Коррелированные подзапросы
Коррелированные подзапросы SQL используются для выбора данных из таблицы, на которую ссылается внешний запрос. Подзапрос известен как коррелированный, потому что подзапрос связан с внешним запросом. В запросах этого типа необходимо использовать псевдоним таблицы (также называемый именем корреляции), чтобы указать, какую ссылку на таблицу следует использовать.
Пример: SQL-коррелированные подзапросы
код агента в таблице заказов должен совпадать с кодом агента в таблице агентов, а имя агента в таблице агентов должно быть Alex ,
можно использовать следующий оператор SQL:
Пример таблицы: заказы
Пример таблицы: агенты
Код SQL:
Внутренняя часть вышеприведенного запроса возвращает код агента A003.
Упрощенная форма приведенного выше кода:
Код SQL:
Наглядная презентация:
Использование EXISTS с коррелированным подзапросом
Мы уже использовали оператор EXISTS для проверки существования результата подзапроса. Оператор EXISTS также может использоваться в коррелированных подзапросах. Используя EXISTS, в следующем запросе отображаются employee_id, manager_id, first_name и last_name тех сотрудников, которые управляют другими сотрудниками.
Код SQL:
Пример таблицы: сотрудники
Иллюстрированная презентация:
Использование NOT EXISTS с коррелированным подзапросом
NOT EXISTS логически противоположен оператору EXISTS. NOT EXISTS используется, когда нам нужно проверить, не существуют ли строки в результатах, возвращаемых подзапросом. Используя NOT EXISTS, в следующем запросе отображаются employee_id, manager_id, first_name и last_name тех сотрудников, которые не имеют статуса менеджера. Этот запрос противоположен предыдущему.
Код SQL:
Пример таблицы: сотрудники
Иллюстрированная презентация:
Упражнения по SQL
Хотите улучшить вышеуказанную статью? Вносите свои заметки / комментарии / примеры через Disqus.
Коррелированный подзапрос
Коррелированным подзапросом называется подзапрос, который ссылается на значения столбцов внешнего запроса.
Коррелированный подзапрос выполняется для каждой строки основного запроса. В момент выполнения подзапроса значения столбцов внешнего запроса являются константами.
Пример. Для каждого товара найдем магазины, в которых его можно купить по минимальной цене.
Весь каталог товаров:
# | product_id | store_id | price |
---|---|---|---|
1 | 1 | 300 | 10500.00 |
2 | 1 | 800 | 12000.00 |
3 | 1 | 301 | 12500.00 |
4 | 2 | 500 | 26100.00 |
5 | 2 | 600 | 27500.00 |
. | . | . | . |
13 | 5 | 201 | 23500.00 |
14 | 5 | 500 | 23500.00 |
15 | 5 | 800 | 24600.00 |
. | . | . | . |
Оставим записи с минимальной ценой:
# | product_id | store_id | price |
---|---|---|---|
1 | 1 | 300 | 10500.00 |
2 | 2 | 500 | 26100.00 |
3 | 3 | 500 | 22000.00 |
4 | 4 | 400 | 20000.00 |
5 | 5 | 201 | 23500.00 |
6 | 5 | 500 | 23500.00 |
. | . | . | . |
Разберем, как получился такой результат. Для каждой строки, полученной в результате соединения таблицы из предложения FROM
# | product_id | store_id | price |
---|---|---|---|
1 | 1 | 300 | 10500.00 |
2 | 1 | 800 | 12000.00 |
3 | 1 | 301 | 12500.00 |
4 | 2 | 500 | 26100.00 |
5 | 2 | 600 | 27500.00 |
. | . | . | . |
13 | 5 | 201 | 23500.00 |
14 | 5 | 500 | 23500.00 |
15 | 5 | 800 | 24600.00 |
. | . | . | . |
в котором pp.product_id заменяется значеним product_id из обрабатываемой строки.
# | product_id | store_id | price |
---|---|---|---|
1 | 1 | 300 | 10500.00 |
# | product_id | store_id | price |
---|---|---|---|
2 | 1 | 800 | 12000.00 |
вернет значение 10500.00. Во второй строке pp.price = 12000.00. Строка исключается из результата выполнения запроса.
Третья строка исключается аналогично второй.
Для четвертой строки будет выполняться подзапрос
Вложенные запросы (SQL Server)
В примерах из этой статьи используется база данных AdventureWorks2016. Образцы баз данных AdventureWorks можно скачать здесь.
Основы вложенных запросов
Вложенный запрос по-другому называют внутренним запросом или внутренней операцией выбора, в то время как инструкцию, содержащую вложенный запрос, называют внешним запросом или внешней операцией выбора.
Многие инструкции языка Transact-SQL, включающие подзапросы, можно записать в виде соединений. Другие запросы могут быть осуществлены только с помощью подзапросов. В языке Transact-SQL обычно не бывает разницы в производительности между инструкцией, включающей вложенный запрос, и семантически эквивалентной версией без вложенного запроса. Дополнительные сведения о том, как SQL Server обрабатывает запросы, см. в разделе Обработка инструкций SQL. Однако в некоторых случаях, когда проверяется существование, соединения показывают лучшую производительность. В противном случае для устранения дубликатов вложенный запрос должен обрабатываться для получения каждого результата внешнего запроса. В таких случаях метод работы соединений дает лучшие результаты.
Вложенный во внешнюю инструкцию SELECT запрос, имеет следующие компоненты:
Запрос SELECT вложенного запроса всегда заключен в скобки. Он не может включать предложения COMPUTE или FOR BROWSE и может включать предложение ORDER BY только вместе с предложением TOP.
Если таблица появляется только во вложенном запросе, а не во внешнем запросе, в этом случае столбцы данной таблицы не могут быть включены в выходные данные (список выборки внешнего запроса).
Инструкции, включающие вложенные запросы, обычно имеют один из следующих форматов:
В некоторых инструкциях языка Transact-SQL вложенный запрос может рассматриваться как отдельный запрос. Обычно результаты вложенного запроса подставляются во внешний запрос (хотя SQL Server может обрабатывать инструкции Transact-SQL с вложенными запросами и по-другому).
Существуют три основных типа подзапросов, которые:
Правила вложенных запросов
На вложенный запрос распространяются следующие ограничения:
Уточнение имен столбцов во вложенных запросах
В следующем примере столбец BusinessEntityID в предложении WHERE внешнего запроса неявно уточняется именем таблицы, используемой в предложении FROM внешнего запроса (Sales.Store). Ссылка на столбец CustomerID в списке выборки вложенного запроса уточняется именем таблицы с помощью предложения FROM вложенного запроса, то есть Sales.Customer.
Общее правило состоит в том, что имена столбцов в инструкции неявно уточняются именем таблицы, указанной в предложении FROM того же уровня вложенности. Если столбец не существует в таблице, на которую ссылается предложение FROM вложенного запроса, он неявно уточняется именем таблицы, указанной в предложении FROM внешнего запроса.
Вот как выглядит этот запрос с явно указанными неявными соглашениями:
Никогда не будет ошибочным явно указать имя таблицы; также всегда можно перекрыть неявные соглашения об именах таблиц полностью уточненными именами столбцов
Если столбец, на который есть ссылка во вложенном запросе, не существует в таблице, указанной в предложении FROM вложенного запроса, но существует в таблице, на которую ссылается предложение FROM внешнего запроса, запрос будет выполнен без ошибок. SQL Server неявно уточнит имя столбца во вложенном запросе с помощью имени таблицы внешнего запроса.
Множественные уровни вложенности
Каждый вложенный запрос, в свою очередь, может содержать один или более вложенных запросов. В инструкцию можно вложить любое количество вложенных запросов.
Следующий запрос осуществляет поиск сотрудников, занимающих должность менеджера по продажам.
Самый глубоко вложенный запрос возвращает идентификаторы указанных сотрудников. Запрос уровнем выше оперирует с полученными идентификаторами и возвращает контактные идентификаторы сотрудников. Наконец, во внешнем запросе по полученным контактным идентификаторам извлекаются имена сотрудников.
Этот запрос также можно выразить с помощью соединения:
Связанные вложенные запросы
Результат для нескольких запросов может быть получен путем выполнения одного вложенного запроса и подстановки полученного результата или результатов в предложение WHERE внешнего запроса. В запросах, содержащих коррелированные вложенные запросы (также называемые повторяющимися вложенными запросами), вложенный запрос зависит по значению от внешнего запроса. Это означает, что выполнение вложенного запроса повторяется по одному разу для каждой строки, которая может быть выбрана внешним запросом. Такой запрос получает по одной записи для имени и фамилии каждого сотрудника, который в таблице SalesPerson имеет сумму премиальных, равную 5000, с соответствующими идентификаторами сотрудников в таблицах Employee и SalesPerson.
Результатом является 0.00 ( Syed Abbas не получал премиальных, потому что не является менеджером по продажам), поэтому выполнение внешнего запроса приводит к следующему результату:
Коррелированные вложенные запросы могут также включать в предложение FROM функции с табличным значением, указывая для них в качестве аргументов столбцы таблиц из внешнего запроса. В этом случае для каждой строки внешнего запроса выполняется функция с табличным значением, как и в случае с вложенным запросом.
Типы вложенных запросов
Вложенные запросы могут быть указаны во многих местах:
Вложенные запросы с псевдонимами таблицы
Многие инструкции, где вложенный и внешний запросы ссылаются на одну и ту же таблицу, могут быть переформулированы как самосоединения (соединения таблицы с самой собой). Например, можно найти адреса сотрудников из конкретного региона с помощью вложенного запроса:
Можно также использовать самосоединение:
Псевдонимы таблиц e1 и e2 необходимы, так как соединенная сама с собой таблица выступает в двух ролях. Псевдонимы можно также использовать во вложенных запросах, где и внешний, и внутренний запросы ссылаются на одну и ту же таблицу.
При использовании явных псевдонимов таблицы понятно, что ссылка на Person.Address во вложенном запросе означает не то же, что и ссылка во внешнем запросе.
Вложенные запросы с ключевым словом IN
Результат вложенного запроса, в котором присутствует ключевое слово IN (или NOT IN ) — это список из нуля или более значений. После того как вложенный запрос вернул результат, он используется внешним запросом.
Следующий запрос ищет названия всех колес, произведенных компанией Adventure Works Cycles.
Эта инструкция выполняется в два шага. Сначала внутренний запрос возвращает номер идентификатора подкатегории по соответствию названию «Wheel» (17). Затем это значение подставляется во внешний запрос, который находит все названия изделий, имеющих соответствующие идентификаторы подкатегорий в столбце Production.Product.
Единственная разница в использовании соединения и вложенного запроса для этой и аналогичных задач заключается в том, что объединение позволяет включить в результат столбцы, содержащиеся в нескольких таблицах. Например: если нужно включить в результат название подкатегории, следует пользоваться соединением:
Следующий запрос ищет названия всех поставщиков, имеющих высокий кредитный рейтинг, у которых компания Adventure Works Cycles заказала как минимум 20 позиций, и средний срок поставки у которых не превышает 16 дней.
Выполняется внутренний запрос и возвращаются номера идентификаторов поставщиков, которые соответствуют определениям вложенного запроса. Затем выполняется внешний запрос. Обратите внимание, что в предложение WHERE как внутреннего, так и внешнего запроса может быть включено несколько условий.
При использовании соединения тот же запрос будет выражен так:
Соединение всегда может быть выражено в виде вложенного запроса. Вложенный запрос часто, но не всегда может быть выражен в виде соединения. Это происходит потому, что соединения симметричны: можно соединить таблицы A и B в любом порядке и получить одинаковый результат. Для вложенных запросов это не всегда справедливо.
Вложенные запросы с ключевым словом NOT IN
Вложенные запросы с ключевым словом NOT IN также возвращают список из нуля или более значений.
В следующем запросе выполняется поиск названий продуктов, не являющихся готовыми велосипедами.
Эту инструкцию нельзя преобразовать в соединение. Аналогичное соединение по неравенству имеет другой смысл: оно находит названия продуктов, которые принадлежат какой-либо подкатегории, отличной от готового велосипеда.
В следующем примере удваивается значение столбца ListPrice таблицы Production.Product. Вложенный запрос в предложении WHERE ссылается на таблицу Purchasing.ProductVendor для ограничения количества обновляемых строк таблицы Product только теми, у которых идентификатор BusinessEntity равен 1540.
Для ясности, если на одну и ту же таблицу ссылаются в других вложенных запросах, используйте псевдонимы целевой таблицы:
Вложенные запросы с операторами сравнения
Чтобы использовать подзапрос, начинающийся с немодифицированного оператора сравнения, необходимо достаточно хорошо знать свои данные и природу проблемы, чтобы быть уверенным, что вложенный запрос возвратит точно одно значение.
Однако если сотрудник Linda Mitchell работал более чем с одной территорией продаж, вы получите сообщение об ошибке. Вместо оператора сравнения = может использоваться формулировка IN (также может использоваться =ANY ).
Вложенные запросы, начинающиеся с немодифицированных операторов сравнения, часто включают агрегатные функции, потому что они возвращают одиночное значение. Например, следующая инструкция находит названия всех продуктов, у которых цена по прейскуранту больше, чем средняя цена по прейскуранту.
Так как вложенные запросы, начинающиеся с неизмененных операторов сравнения, должны возвращать одиночное значение, они не могут включать предложения GROUP BY или HAVING (за исключением случаев, когда достоверно известно, что предложение GROUP BY или HAVING возвратит одиночное значение). Например, следующий запрос находит продукты, оцененные выше, чем самый дешевый продукт, который находится в столбце ProductSubcategoryID 14.
Рассмотрим, например оператор сравнения >: >ALL будет означать «больше любого значения». Другими словами, это сравнение с максимальным значением. Например, >ALL (1, 2, 3) означает «больше 3». >ANY означает «больше по крайней мере одного значения», т. е. «больше минимума». Поэтому >ANY (1, 2, 3) означает «больше 1». Чтобы строка результата вложенного запроса с >ALL удовлетворяла условию, заданному внешним запросом, значение в столбце, для которого вводится вложенный запрос, должно быть больше каждого значения из списка, возвращаемого вложенным запросом.
Аналогичным образом, чтобы строка результата вложенного запроса с >ANY удовлетворяла условию, заданному внешним запросом, значение в столбце, для которого вводится вложенный запрос, должно быть больше хотя бы одного значения из списка, возвращаемого вложенным запросом.
Если вложенный запрос не возвращает значений, весь запрос не возвратит никаких значений.
Вот результирующий набор, возвращаемый любым из этих запросов:
Однако оператор <>ANY отличается от NOT IN :
Например, следующий запрос отобразит заказчиков, находящихся на территории, где не работает ни один менеджер по продажам.
В результат включены все заказчики, кроме тех, чьим территориям продаж соответствует NULL, так как любая территория, назначенная заказчику, обслуживается менеджером по продажам. Внутренний запрос находит все территории продаж, обслуживаемые менеджерами по продажам, а затем для каждой территории внешний запрос находит заказчиков, которые ей не принадлежат.
По этой же причине, если использовать NOT IN в этом запросе, в результат не войдет ни один из заказчиков.
Вложенные запросы с ключевым словом EXISTS
Вложенный запрос, созданный с помощью ключевого слова EXISTS, имеет следующий синтаксис:
WHERE [NOT] EXISTS (subquery)
Следующий запрос ищет названия всех продуктов, которые находятся в подкатегории Wheels:
Обратите внимание на то, что вложенные запросы, введенные с помощью ключевого слова EXISTS, отличаются от других вложенных запросов следующим образом.
Вложенные запросы с ключевым словом NOT EXISTS
Например чтобы найти имена продуктов, не находящихся в подкатегории wheels:
Вложенные запросы, используемые вместо выражения
Следующий пример показывает, как можно использовать это улучшение. Запрос находит цены на все горные велосипеды, их среднюю цену и разницу между средней ценой и ценой каждого горного велосипеда.