In WAL replay, restore GIN metapage unconditionally to avoid torn page.
authorHeikki Linnakangas <heikki.linnakangas@iki.fi>
Wed, 12 Mar 2014 07:59:49 +0000 (09:59 +0200)
committerHeikki Linnakangas <heikki.linnakangas@iki.fi>
Wed, 12 Mar 2014 08:07:22 +0000 (10:07 +0200)
We don't take a full-page image of the GIN metapage; instead, the WAL record
contains all the information required to reconstruct it from scratch. But
to avoid torn page hazards, we must re-initialize it from the WAL record
every time, even if it already has a greater LSN, similar to how normal full
page images are restored.

This was highly unlikely to cause any problems in practice, because the GIN
metapage is small. We rely on an update smaller than a 512 byte disk sector
to be atomic elsewhere, at least in pg_control. But better safe than sorry,
and this would be easy to overlook if more fields are added to the metapage
so that it's no longer small.

Reported by Noah Misch. Backpatch to all supported versions.

src/backend/access/gin/ginxlog.c

index 4536c9c63dc99e8c59ad02bc4495161a5ff7a786..bd4b0427f503daaffb3ccaf4d914e5d5a2502e01 100644 (file)
@@ -513,18 +513,20 @@ ginRedoUpdateMetapage(XLogRecPtr lsn, XLogRecord *record)
        Page            metapage;
        Buffer          buffer;
 
+       /*
+        * Restore the metapage. This is essentially the same as a full-page image,
+        * so restore the metapage unconditionally without looking at the LSN, to
+        * avoid torn page hazards.
+        */
        metabuffer = XLogReadBuffer(data->node, GIN_METAPAGE_BLKNO, false);
        if (!BufferIsValid(metabuffer))
                return;                                 /* assume index was deleted, nothing to do */
        metapage = BufferGetPage(metabuffer);
 
-       if (!XLByteLE(lsn, PageGetLSN(metapage)))
-       {
-               memcpy(GinPageGetMeta(metapage), &data->metadata, sizeof(GinMetaPageData));
-               PageSetLSN(metapage, lsn);
-               PageSetTLI(metapage, ThisTimeLineID);
-               MarkBufferDirty(metabuffer);
-       }
+       memcpy(GinPageGetMeta(metapage), &data->metadata, sizeof(GinMetaPageData));
+       PageSetLSN(metapage, lsn);
+       PageSetTLI(metapage, ThisTimeLineID);
+       MarkBufferDirty(metabuffer);
 
        if (data->ntuples > 0)
        {
@@ -677,13 +679,10 @@ ginRedoDeleteListPages(XLogRecPtr lsn, XLogRecord *record)
                return;                                 /* assume index was deleted, nothing to do */
        metapage = BufferGetPage(metabuffer);
 
-       if (!XLByteLE(lsn, PageGetLSN(metapage)))
-       {
-               memcpy(GinPageGetMeta(metapage), &data->metadata, sizeof(GinMetaPageData));
-               PageSetLSN(metapage, lsn);
-               PageSetTLI(metapage, ThisTimeLineID);
-               MarkBufferDirty(metabuffer);
-       }
+       memcpy(GinPageGetMeta(metapage), &data->metadata, sizeof(GinMetaPageData));
+       PageSetLSN(metapage, lsn);
+       PageSetTLI(metapage, ThisTimeLineID);
+       MarkBufferDirty(metabuffer);
 
        /*
         * In normal operation, shiftList() takes exclusive lock on all the