]> granicus.if.org Git - postgresql/commit
Sync up our various ways of estimating pg_class.reltuples.
authorTom Lane <tgl@sss.pgh.pa.us>
Thu, 22 Mar 2018 19:47:29 +0000 (15:47 -0400)
committerTom Lane <tgl@sss.pgh.pa.us>
Thu, 22 Mar 2018 19:47:41 +0000 (15:47 -0400)
commit7c91a0364fcf5d739a09cc87e7adb1d4a33ed112
treee355ce8d4e6a1a1c152f8ab8601931a07b190826
parentcc415a56d09a8da7c919088036b6097b70f10791
Sync up our various ways of estimating pg_class.reltuples.

VACUUM thought that reltuples represents the total number of tuples in
the relation, while ANALYZE counted only live tuples.  This can cause
"flapping" in the value when background vacuums and analyzes happen
separately.  The planner's use of reltuples essentially assumes that
it's the count of live (visible) tuples, so let's standardize on having
it mean live tuples.

Another issue is that the definition of "live tuple" isn't totally clear;
what should be done with INSERT_IN_PROGRESS or DELETE_IN_PROGRESS tuples?
ANALYZE's choices in this regard are made on the assumption that if the
originating transaction commits at all, it will happen after ANALYZE
finishes, so we should ignore the effects of the in-progress transaction
--- unless it is our own transaction, and then we should count it.
Let's propagate this definition into VACUUM, too.

Likewise propagate this definition into CREATE INDEX, and into
contrib/pgstattuple's pgstattuple_approx() function.

Tomas Vondra, reviewed by Haribabu Kommi, some corrections by me

Discussion: https://postgr.es/m/16db4468-edfa-830a-f921-39a50498e77e@2ndquadrant.com
contrib/pgstattuple/pgstatapprox.c
doc/src/sgml/catalogs.sgml
src/backend/catalog/index.c
src/backend/commands/vacuum.c
src/backend/commands/vacuumlazy.c