Use a fd opened for read/write when syncing slots during startup, take 2.
authorAndres Freund <andres@anarazel.de>
Fri, 4 Oct 2019 20:08:51 +0000 (13:08 -0700)
committerAndres Freund <andres@anarazel.de>
Fri, 4 Oct 2019 20:34:39 +0000 (13:34 -0700)
Cribbing from dfbaed45975:
    Some operating systems, including the reporter's windows, return EBADFD
    or similar when fsync() is invoked on a O_RDONLY file descriptor.
    Unfortunately RestoreSlotFromDisk() does exactly that; which causes
    failures after restarts in at least some scenarios.

    If you hit the bug the error message will be something like
    ERROR: could not fsync file "pg_replslot/$name/state": Bad file descriptor

    Simply use O_RDWR instead of O_RDONLY when opening the relevant file
    descriptor to fix the bug.

Unfortunately this fix was undone in 82a5649fb9db. Re-apply, and add a
comment.

Bug: 16039
Reported-By: Hans Buschmann
Author: Andres Freund
Discussion: https://postgr.es/m/16039-196fc97cc05e141c@postgresql.org
Backpatch: 12-, as 82a5649fb9db

src/backend/replication/slot.c

index 3861b8f583c626b47c17c35c2f1f6472561ee074..f2fd8f336ed5e1a031782aa9c2b51d2518a5b09f 100644 (file)
@@ -1386,7 +1386,8 @@ RestoreSlotFromDisk(const char *name)
 
        elog(DEBUG1, "restoring replication slot from \"%s\"", path);
 
-       fd = OpenTransientFile(path, O_RDONLY | PG_BINARY);
+       /* on some operating systems fsyncing a file requires O_RDWR */
+       fd = OpenTransientFile(path, O_RDWR | PG_BINARY);
 
        /*
         * We do not need to handle this as we are rename()ing the directory into