]> granicus.if.org Git - postgresql/commit
Fix race conditions in replication slot operations
authorAlvaro Herrera <alvherre@alvh.no-ip.org>
Tue, 25 Jul 2017 17:26:49 +0000 (13:26 -0400)
committerAlvaro Herrera <alvherre@alvh.no-ip.org>
Tue, 25 Jul 2017 17:26:49 +0000 (13:26 -0400)
commit9915de6c1cb2c9b87f5f504c97832cdf3a809753
treea13c697f0eaa0b518c92b0384afec2752a8c762b
parent4132dbec69dd4d437e132e57a74a98a40cdcf776
Fix race conditions in replication slot operations

It is relatively easy to get a replication slot to look as still active
while one process is in the process of getting rid of it; when some
other process tries to "acquire" the slot, it would fail with an error
message of "replication slot XYZ is active for PID N".

The error message in itself is fine, except that when the intention is
to drop the slot, it is unhelpful: the useful behavior would be to wait
until the slot is no longer acquired, so that the drop can proceed.  To
implement this, we use a condition variable so that slot acquisition can
be told to wait on that condition variable if the slot is already
acquired, and we make any change in active_pid broadcast a signal on the
condition variable.  Thus, as soon as the slot is released, the drop
will proceed properly.

Reported by: Tom Lane
Discussion: https://postgr.es/m/11904.1499039688@sss.pgh.pa.us
Authors: Petr Jelínek, Álvaro Herrera
src/backend/replication/logical/logicalfuncs.c
src/backend/replication/slot.c
src/backend/replication/slotfuncs.c
src/backend/replication/walsender.c
src/include/replication/slot.h