SQL/GROUP BY

Материал из Энциклопедия о программировании
Перейти к: навигация, поиск

GROUP BY (группировка по) — оператор языка SQL служащий для группировки (сливания воедино) выбранного набора строк для получения набора сводных строк по значениям одного или нескольких столбцов, или выражений в выходных данных (таблице результата). Т.о. возвращается одна строка для каждой группы.

Данный оператор, по своей работе, очень похож на DISTINCT т.к. тоже сортирует данные по уникальности/неповторимости. Т.е. считаются все значение для какого-либо уникального значения столбца и сливаются (группируются) в один результат, причём группировка производится по значениям указанных столбцов.

GROUP BY это группировка результата по конкретным полям, т.е. на выходе строки с указанными в группировке столбцами с одинаковыми значениями сливаются в одну строку, происходит группировка.

Агрегатные функции в списке предложения SELECT предоставляют инфо о каждой группе, а не об отдельных строках.

Предложение GROUP BY имеет 2 синтаксиса: совместимый и несовместимый с ISO. В каждой отдельной инструкции SELECT может использоваться только 1 стиль синтаксиса. Во всех новых разработках используйте совместимый с ISO синтаксис. Синтаксис, несовместимый с ISO, служит для обеспечения обратной совместимости.

Общее предложение GROUP BY включает конструкции GROUPING SETS, CUBE, ROLLUP, WITH CUBE и WITH ROLLUP (с общим итогом).

Простое предложение GROUP BY не включает конструкции GROUPING SETS, CUBE, ROLLUP, WITH CUBE и WITH ROLLUP. Предложение GROUP BY (), предназначенное для определения общего итога, рассматривается как простое предложение GROUP BY.

Подробнее

Предложение GROUP BY используется для определения групп выходных строк, к которым могут применяться агрегатные функции (COUNT, MIN, MAX, AVG и SUM). Если это предложение отсутствует, и используются агрегатные функции, то все столбцы с именами, упомянутыми в SELECT, должны быть включены в агрегатные функции, и эти функции будут применяться ко всему набору строк, что удовлетворяют предикату запроса. В противном случае все столбцы списка SELECT, не вошедшие в агрегатные функции, должны быть указаны в предложении GROUP BY. В результате чего все выходные строки запроса разбиваются на группы, характеризуемые одинаковыми комбинациями значений в этих столбцах. После чего к каждой группе будут применены агрегатные функции. Для GROUP BY все значения NULL трактуются как равные, т.е. при группировке по полю, содержащему NULL-значения, все такие строки попадут в одну группу.

Если при наличии предложения GROUP BY, в предложении SELECT отсутствуют агрегатные функции, то запрос просто вернет по одной строке из каждой группы. Эту возможность, наряду с ключевым словом DISTINCT, можно использовать для исключения дубликатов строк в результирующем наборе.

Пример:

SELECT model, COUNT(model) AS Qty_model, AVG(price) AS Avg_price
FROM PC
GROUP BY model;

В этом запросе для каждой модели ПК определяется их количество и средняя стоимость. Все строки с одинаковыми значениями model (номер модели) образуют группу, и на выходе SELECT вычисляются кол-во значений и средняя цена для каждой группы. Результатом выполнения запроса будет следующая таблица:

model Qty_model Avg_price
1121 3 850
1232 4 425
1233 3 843,333333333333
1260 1 350

Если бы в SELECTприсутствовал столбец с датой, то можно было бы вычислять эти показатели для каждой конкретной даты. Для этого нужно добавить дату в качестве группирующего столбца, и тогда агрегатные функции вычислялись бы для каждой комбинации значений {модель, дата}.

Существует несколько определенных правил выполнения агрегатных функций.

  • Если в результате выполнения запроса не получено ни одной строки (или ни одной строки для данной группы), то исходные данные для вычисления любой из агрегатных функций отсутствуют. В этом случае результатом выполнения функций COUNT будет нуль, а результатом всех других функций — NULL.
    Данное свойство может дать не всегда очевидный результат. Рассмотрим, например, такой запрос:
    1. SELECT 1 a WHERE
    2. EXISTS(SELECT MAX(price)
    3. FROM PC
    4. WHERE price<0)
    select 1 a where
    exists(select MAX(price)
             from PC 
             where price<0)
    
  • Подзапрос в предикате EXISTS возвращает одну строку с NULL в качестве значения столбца. Поэтому, несмотря на то, что ПК с отрицательными ценами нет в базе данных, запрос в примере вернет 1.
  • Аргумент агрегатной функции не может сам содержать агрегатные функции (функция от функции). То есть в простом запросе (без подзапросов) нельзя, скажем, получить максимум средних значений.
  • Результат выполнения функции COUNT есть целое число (INTEGER). Другие агрегатные функции наследуют типы данных обрабатываемых значений.
  • Если при выполнении функции SUM будет получен результат, превышающий максимально возможное значение для используемого типа данных, возникает ошибка.

Итак, агрегатные функции, включенные в предложение SELECT запроса, не содержащего предложения GROUP BY, исполняются над всеми результирующими строками этого запроса. Если же запрос содержит предложение GROUP BY, каждый набор строк, который имеет одинаковые значения столбца или группы столбцов, заданных в предложении GROUP BY, составляют группу, и агрегатные функции выполняются для каждой группы отдельно.

См. так же

Подробная информация

http://technet.microsoft.com/ru-ru/library/ms177673.aspx

Эта статья относится к ЯЗ SQL.