]> granicus.if.org Git - postgresql/commitdiff
Make error handling in parallel pg_upgrade less bogus.
authorTom Lane <tgl@sss.pgh.pa.us>
Sun, 16 Dec 2018 19:51:48 +0000 (14:51 -0500)
committerTom Lane <tgl@sss.pgh.pa.us>
Sun, 16 Dec 2018 19:51:48 +0000 (14:51 -0500)
reap_child() basically ignored the possibility of either an error in
waitpid() itself or a child process failure on signal.  We don't really
need to do more than report and crash hard, but proceeding as though
nothing is wrong is definitely Not Acceptable.  The error report for
nonzero child exit status was pretty off-point, as well.

Noted while fooling around with child-process failure detection
logic elsewhere.  It's been like this a long time, so back-patch to
all supported branches.

src/bin/pg_upgrade/parallel.c

index 9ed55c0598cf706da22527986734557796af6ace..74c6242cc24c2dce20a6de97e1eb234be5fda680 100644 (file)
@@ -294,7 +294,7 @@ reap_child(bool wait_for_child)
 {
 #ifndef WIN32
        int                     work_status;
-       int                     ret;
+       pid_t           child;
 #else
        int                     thread_num;
        DWORD           res;
@@ -304,14 +304,13 @@ reap_child(bool wait_for_child)
                return false;
 
 #ifndef WIN32
-       ret = waitpid(-1, &work_status, wait_for_child ? 0 : WNOHANG);
-
-       /* no children or, for WNOHANG, no dead children */
-       if (ret <= 0 || !WIFEXITED(work_status))
-               return false;
-
-       if (WEXITSTATUS(work_status) != 0)
-               pg_fatal("child worker exited abnormally: %s\n", strerror(errno));
+       child = waitpid(-1, &work_status, wait_for_child ? 0 : WNOHANG);
+       if (child == (pid_t) -1)
+               pg_fatal("waitpid() failed: %s\n", strerror(errno));
+       if (child == 0)
+               return false;                   /* no children, or no dead children */
+       if (work_status != 0)
+               pg_fatal("child process exited abnormally: status %d\n", work_status);
 #else
        /* wait for one to finish */
        thread_num = WaitForMultipleObjects(parallel_jobs, thread_handles,