]> granicus.if.org Git - postgresql/commitdiff
Update minimum recovery point on truncation.
authorHeikki Linnakangas <heikki.linnakangas@iki.fi>
Mon, 10 Dec 2012 13:54:42 +0000 (15:54 +0200)
committerHeikki Linnakangas <heikki.linnakangas@iki.fi>
Mon, 10 Dec 2012 14:57:16 +0000 (16:57 +0200)
If a file is truncated, we must update minRecoveryPoint. Once a file is
truncated, there's no going back; it would not be safe to stop recovery
at a point earlier than that anymore.

Per report from Kyotaro HORIGUCHI. Backpatch to 8.4. Before that,
minRecoveryPoint was not updated during recovery at all.

src/backend/access/transam/xact.c
src/backend/catalog/storage.c

index a36c8061a2bb2f7846798c7b3ce5dc237919582d..dbf82010e0e143303df51734a1dcd5ef22e2cb57 100644 (file)
@@ -4617,23 +4617,44 @@ xact_redo_commit_internal(TransactionId xid, XLogRecPtr lsn,
        }
 
        /* Make sure files supposed to be dropped are dropped */
-       for (i = 0; i < nrels; i++)
+       if (nrels > 0)
        {
-               SMgrRelation srel = smgropen(xnodes[i], InvalidBackendId);
-               ForkNumber      fork;
+               /*
+                * First update minimum recovery point to cover this WAL record. Once
+                * a relation is deleted, there's no going back. The buffer manager
+                * enforces the WAL-first rule for normal updates to relation files,
+                * so that the minimum recovery point is always updated before the
+                * corresponding change in the data file is flushed to disk, but we
+                * have to do the same here since we're bypassing the buffer manager.
+                *
+                * Doing this before deleting the files means that if a deletion fails
+                * for some reason, you cannot start up the system even after restart,
+                * until you fix the underlying situation so that the deletion will
+                * succeed. Alternatively, we could update the minimum recovery point
+                * after deletion, but that would leave a small window where the
+                * WAL-first rule would be violated.
+                */
+               XLogFlush(lsn);
 
-               for (fork = 0; fork <= MAX_FORKNUM; fork++)
-                       XLogDropRelation(xnodes[i], fork);
-               smgrdounlink(srel, true);
-               smgrclose(srel);
+               for (i = 0; i < nrels; i++)
+               {
+                       SMgrRelation srel = smgropen(xnodes[i], InvalidBackendId);
+                       ForkNumber      fork;
+
+                       for (fork = 0; fork <= MAX_FORKNUM; fork++)
+                               XLogDropRelation(xnodes[i], fork);
+                       smgrdounlink(srel, true);
+                       smgrclose(srel);
+               }
        }
 
        /*
         * We issue an XLogFlush() for the same reason we emit ForceSyncCommit()
-        * in normal operation. For example, in DROP DATABASE, we delete all the
-        * files belonging to the database, and then commit the transaction. If we
-        * crash after all the files have been deleted but before the commit, you
-        * have an entry in pg_database without any files. To minimize the window
+        * in normal operation. For example, in CREATE DATABASE, we copy all files
+        * from the template database, and then commit the transaction. If we
+        * crash after all the files have been copied but before the commit, you
+        * have files in the data directory without an entry in pg_database. To
+        * minimize the window
         * for that, we use ForceSyncCommit() to rush the commit record to disk as
         * quick as possible. We have the same window during recovery, and forcing
         * an XLogFlush() (which updates minRecoveryPoint during recovery) helps
index 24462824937f759a849425ce9b58531738b9d992..8dc622a1add0ae07519ecfedf8a942b7a2f55c00 100644 (file)
@@ -482,6 +482,24 @@ smgr_redo(XLogRecPtr lsn, XLogRecord *record)
                 */
                smgrcreate(reln, MAIN_FORKNUM, true);
 
+               /*
+                * Before we perform the truncation, update minimum recovery point
+                * to cover this WAL record. Once the relation is truncated, there's
+                * no going back. The buffer manager enforces the WAL-first rule
+                * for normal updates to relation files, so that the minimum recovery
+                * point is always updated before the corresponding change in the
+                * data file is flushed to disk. We have to do the same manually
+                * here.
+                *
+                * Doing this before the truncation means that if the truncation fails
+                * for some reason, you cannot start up the system even after restart,
+                * until you fix the underlying situation so that the truncation will
+                * succeed. Alternatively, we could update the minimum recovery point
+                * after truncation, but that would leave a small window where the
+                * WAL-first rule could be violated.
+                */
+               XLogFlush(lsn);
+
                smgrtruncate(reln, MAIN_FORKNUM, xlrec->blkno);
 
                /* Also tell xlogutils.c about it */