]> granicus.if.org Git - postgresql/commit
Fix walsender failure at promotion.
authorHeikki Linnakangas <heikki.linnakangas@iki.fi>
Wed, 8 May 2013 17:10:17 +0000 (20:10 +0300)
committerHeikki Linnakangas <heikki.linnakangas@iki.fi>
Wed, 8 May 2013 17:30:17 +0000 (20:30 +0300)
commit2ffa66f4975c99e52984f7ee81b47d137b5b4751
treed48756b7959f7bb63d9ea8513ff68e0dfa88d4ed
parentcb953d8b1bf7386ff20300cd80b29b7e8657dcbd
Fix walsender failure at promotion.

If a standby server has a cascading standby server connected to it, it's
possible that WAL has already been sent up to the next WAL page boundary,
splitting a WAL record in the middle, when the first standby server is
promoted. Don't throw an assertion failure or error in walsender if that
happens.

Also, fix a variant of the same bug in pg_receivexlog: if it had already
received WAL on previous timeline up to a segment boundary, when the
upstream standby server is promoted so that the timeline switch record falls
on the previous segment, pg_receivexlog would miss the segment containing
the timeline switch. To fix that, have walsender send the position of the
timeline switch at end-of-streaming, in addition to the next timeline's ID.
It was previously assumed that the switch happened exactly where the
streaming stopped.

Note: this is an incompatible change in the streaming protocol. You might
get an error if you try to stream over timeline switches, if the client is
running 9.3beta1 and the server is more recent. It should be fine after a
reconnect, however.

Reported by Fujii Masao.
doc/src/sgml/protocol.sgml
src/backend/access/transam/xlog.c
src/backend/replication/libpqwalreceiver/libpqwalreceiver.c
src/backend/replication/walreceiverfuncs.c
src/backend/replication/walsender.c
src/bin/pg_basebackup/pg_receivexlog.c
src/bin/pg_basebackup/receivelog.c