GROUP BYとHAVINGの考え方：SQLで集計する基本 | 仕組み解説

SQLでは、行をそのまま読むだけでなく、件数、合計、平均などを集計できます。その中心になるのが GROUP BY です。

一言でいうと

GROUP BYは、行をグループに分けて、グループごとにCOUNTやSUMを計算するための仕組みです。

まず、代表的な集計関数を整理します。

たとえば、注文の件数を数えるSQLです。

SELECT COUNT(*) AS order_count
FROM orders;

GROUP BY は、同じ値を持つ行をまとめます。

SELECT user_id, COUNT(*) AS order_count
FROM orders
GROUP BY user_id;

これは、ユーザーごとの注文数を数えるSQLです。

GROUP BYを使うと、結果は「元の行」ではなく「グループごとの行」になります。

WHERE と HAVING はどちらも絞り込みですが、タイミングが違います。

句	いつ絞るか	例
`WHERE`	集計する前	2026年の注文だけにする
`HAVING`	集計した後	注文数が3件以上のユーザーだけにする

SELECT user_id, COUNT(*) AS order_count
FROM orders
WHERE ordered_at >= '2026-01-01'
GROUP BY user_id
HAVING COUNT(*) >= 3;

このSQLは、2026年以降の注文だけを対象にし、その中で注文数が3件以上のユーザーを取得します。

GROUP BY を使うときは、SELECT に書ける列に注意が必要です。

SELECT user_id, COUNT(*)
FROM orders
GROUP BY user_id;

これは自然です。user_id ごとにまとめているため、user_id と集計結果を表示できます。

一方、グループ化していない列をそのまま出すと、どの行の値を表示すればよいか曖昧になります。

SELECT user_id, status, COUNT(*)
FROM orders
GROUP BY user_id;

このようなSQLは、多くのデータベースでエラーになります。status も表示したいなら、GROUP BY user_id, status のようにグループに含めます。

集計SQLは、次の順番で読むと整理しやすいです。

GROUP BY は、行をグループに分けて集計するために使います。WHERE は集計前の絞り込み、HAVING は集計後の絞り込みです。集計SQLは、元の行を見るのではなく、グループごとの結果を見るものとして考えると理解しやすくなります。