]> granicus.if.org Git - pgbadger/commitdiff
- Fix issue in handling SIGTERM/SIGINT that cause pgbadger to continue.
authorDarold Gilles <gilles@darold.net>
Tue, 5 Aug 2014 22:14:47 +0000 (00:14 +0200)
committerDarold Gilles <gilles@darold.net>
Tue, 5 Aug 2014 22:14:47 +0000 (00:14 +0200)
- Add autoclean feature to pgbadger in incremental mode. pgbadger will now removed automatically obsolete binary files unless you specify --noclean at command line. Take care that the old behaviour was to keep those unecessary binary files, now they will be removed if there's already a report in the day directory. In incremental mode (-I) only the binary files of the current parsed week are needed. This may help saving disk space.

pgbadger

index 2142c6bc29537d074a6f3ac5e3bee2787057354e..7f0cb109b9521e52955b1e09c1e6912194c03d0b 100755 (executable)
--- a/pgbadger
+++ b/pgbadger
@@ -59,6 +59,7 @@ my @LATENCY_PERCENTILE = sort {$a <=> $b} (99,95,90);
 my $graphid      = 1;
 my $NODATA       = '<div class="flotr-graph"><blockquote><b>NO DATASET</b></blockquote></div>';
 my $MAX_QUERY_LENGTH = 20480;
+my $terminate = 0;
 
 my $pgbadger_logo =
         '<img src="">';
@@ -164,7 +165,8 @@ my $csv_sep_char            = ',';
 my %current_sessions        = ();
 my $incr_date               = '';
 my $last_incr_date          = '';
-my $anonymize                = 0;
+my $anonymize               = 0;
+my $noclean                 = 0;
 
 my $NUMPROGRESS = 10000;
 my @DIMENSIONS  = (800, 300);
@@ -303,7 +305,8 @@ my $result = GetOptions(
         'ssh-option=s'             => \$ssh_options,
         'ssh-user=s'               => \$ssh_user,
         'ssh-timeout=i'            => \$ssh_timeout,
-       'anonymize!'                => \$anonymize,
+       'anonymize!'               => \$anonymize,
+       'noclean!'                 => \$noclean,
 );
 die "FATAL: use pgbadger --help\n" if (not $result);
 
@@ -872,6 +875,59 @@ if ($last_parsed && -e $last_parsed) {
 $tmp_last_parsed = 'tmp_' . basename($last_parsed) if ($last_parsed);
 $tmp_last_parsed = "$TMP_DIR/$tmp_last_parsed";
 
+# Clean the incremental directory if the feature is not disabled
+if (!$noclean && $saved_last_line{datetime}) {
+
+       # Search the current week following the last parse date
+       $saved_last_line{datetime} =~ /^(\d+)\-(\d+)\-(\d+) /;
+       my $last_year  = $1;
+       my $last_month = $2;
+       my $last_day   = $3;
+       # Get the week number following the date
+       my $wn = &get_week_number($last_year, $last_month, $last_day);
+       # Get the deys of the current week where binary files must be preserved
+       my @wdays = &get_wdays_per_month($wn - 1, "$last_year-$last_month");
+       # Find obsolete dir days that shoud be cleaned
+       unless(opendir(DIR, "$outdir")) {
+               die "Error: can't opendir $outdir: $!";
+       }
+       my @dyears = grep { $_ =~ /^\d+$/ } readdir(DIR);
+       closedir DIR;
+       my @obsolete_days = ();
+       foreach my $y (sort { $a <=> $b } @dyears) {
+               unless(opendir(DIR, "$outdir/$y")) {
+                       die "Error: can't opendir $outdir/$y: $!";
+               }
+               my @dmonths = grep { $_ =~ /^\d+$/ } readdir(DIR);
+               closedir DIR;
+               foreach my $m (sort { $a <=> $b } @dmonths) {
+                       unless(opendir(DIR, "$outdir/$y/$m")) {
+                               die "Error: can't opendir $outdir/$y/$m: $!";
+                       }
+                       my @ddays = grep { $_ =~ /^\d+$/ } readdir(DIR);
+                       closedir DIR;
+                       foreach my $d (sort { $a <=> $b } @ddays) {
+                               if ("$y-$m-$d" lt $wdays[0]) {
+                                       push(@obsolete_days, "$outdir/$y/$m/$d");
+                               }
+                       }
+               }
+       }
+       foreach my $p (@obsolete_days) {
+               unless(opendir(DIR, "$p")) {
+                       die "Error: can't opendir $p: $!";
+               }
+               my @hfiles = grep { $_ =~ /\.(html|txt|tsung|json)$/i } readdir(DIR);
+               next if ($#hfiles == -1); # do not remove files if report file has not been generated
+               seekdir(DIR, 0);
+               my @bfiles = grep { $_ =~ /\.bin$/i } readdir(DIR);
+               closedir DIR;
+               foreach my $f (@bfiles) {
+                       &logmsg('DEBUG', "Removing obsolete binary file: $p/$f");
+                       unlink("$p/$f");
+               }
+       }
+}
 
 # Main loop reading log files
 my $global_totalsize = 0;
@@ -1012,7 +1068,7 @@ if ( ($#given_log_files >= 0) && (($queue_size > 1) || ($job_per_file > 1)) ) {
        foreach my $f (@tempfiles) {
                next if (!-e "$f->[1]" || -z "$f->[1]");
                my $fht = new IO::File;
-               $fht->open("< $f->[1]") or die "FATAL: can't open file $f->[1], $!\n";
+               $fht->open("< $f->[1]") or die "FATAL: can't open temp file $f->[1], $!\n";
                &load_stats($fht);
                $fht->close();
        }
@@ -1057,6 +1113,8 @@ if ($last_parsed && $last_line{datetime} && $last_line{orig}) {
        }
 }
 
+exit 0 if ($terminate);
+
 my $t1 = Benchmark->new;
 my $td = timediff($t1, $t0);
 &logmsg('DEBUG', "the log statistics gathering took:" . timestr($td));
@@ -1173,7 +1231,7 @@ if (!$incremental && ($#given_log_files >= 0) ) {
                foreach $incr_date (@wdays) {
                        my $bpath = $incr_date;
                        $bpath =~ s/\-/\//g;
-                       $incr_date =~ /^(\d+)-(\d+)\-(\d+)$/;
+                       $incr_date =~ /^(\d+)\-(\d+)\-(\d+)$/;
                        $wdir = "$1/week-$wn";
 
                        # Load all data gathered by all the differents processes
@@ -1657,9 +1715,8 @@ sub process_file
                &logmsg('DEBUG', "Starting to parse remote log file: $remote_host:$logfile");
        }
 
-       my $terminate = 0;
-       local $SIG{INT} = sub { $terminate = 1 };
-       local $SIG{TERM} = sub { $terminate = 1 };
+       local $SIG{INT} = sub { print STDERR "Received SIGINT abort parsing...\n"; $terminate = 1; };
+       local $SIG{TERM} = sub { print STDERR "Received SIGTERM abort parsing...\n"; $terminate = 1 };
 
        my $curdate = localtime(time);
 
@@ -2110,6 +2167,12 @@ sub process_file
        }
        close $lfile;
 
+       # Inform the parent that it should stop parsing other files
+       if ($terminate) {
+               kill(12, $parent_pid);
+               return $terminate;
+       }
+
        # Get stats from all pending temporary storage
        foreach my $pid (sort {$cur_info{$a}{date} <=> $cur_info{$b}{date}} keys %cur_info) {
                # Stores last query information
@@ -10728,27 +10791,6 @@ sub get_wdays_per_month
        return @retdays;
 }
 
-# Returns all days following the week number
-sub get_wdays_per_year
-{
-       my $y = shift;
-       my %result = ();
-
-       foreach my $m ("01" .. "12") {
-               foreach my $day ("01" .. "31") {
-                       # Check if the date is valid first
-                       my $datefmt = POSIX::strftime("%Y-%m-%d", 1, 1, 1, $day, $m - 1, $y - 1900);
-                       if ($datefmt ne "$y-$m-$day") {
-                               next;
-                       }
-                       my $weekNumber = POSIX::strftime("%U", 1, 1, 1, $day, $m - 1, $y - 1900);
-                       push(@{$result{$weekNumber}}, "$y-$m-$day");
-               }
-       }
-
-       return %result;
-}
-
 sub IsLeapYear
 {
        return ((($_[0] & 3) == 0) && (($_[0] % 100 != 0) || ($_[0] % 400 == 0)));