]> granicus.if.org Git - postgresql/commit
Remove GROUP BY columns that are functionally dependent on other columns.
authorTom Lane <tgl@sss.pgh.pa.us>
Thu, 11 Feb 2016 22:34:59 +0000 (17:34 -0500)
committerTom Lane <tgl@sss.pgh.pa.us>
Thu, 11 Feb 2016 22:34:59 +0000 (17:34 -0500)
commitd4c3a156cb46dcd1f9f97a8011bd94c544079bb5
treede2632c1e1aa4cdde39198995903a6f75434096a
parent72eee410d48dfb4e6f3a0b751c4b0057ca8adc81
Remove GROUP BY columns that are functionally dependent on other columns.

If a GROUP BY clause includes all columns of a non-deferred primary key,
as well as other columns of the same relation, those other columns are
redundant and can be dropped from the grouping; the pkey is enough to
ensure that each row of the table corresponds to a separate group.
Getting rid of the excess columns will reduce the cost of the sorting or
hashing needed to implement GROUP BY, and can indeed remove the need for
a sort step altogether.

This seems worth testing for since many query authors are not aware of
the GROUP-BY-primary-key exception to the rule about queries not being
allowed to reference non-grouped-by columns in their targetlists or
HAVING clauses.  Thus, redundant GROUP BY items are not uncommon.  Also,
we can make the test pretty cheap in most queries where it won't help
by not looking up a rel's primary key until we've found that at least
two of its columns are in GROUP BY.

David Rowley, reviewed by Julien Rouhaud
src/backend/catalog/pg_constraint.c
src/backend/optimizer/plan/planner.c
src/include/catalog/pg_constraint_fn.h
src/test/regress/expected/aggregates.out
src/test/regress/expected/join.out
src/test/regress/sql/aggregates.sql
src/test/regress/sql/join.sql