]> granicus.if.org Git - postgresql/log
postgresql
10 years agoCompress GIN posting lists, for smaller index size.
Heikki Linnakangas [Wed, 22 Jan 2014 16:51:48 +0000 (18:51 +0200)]
Compress GIN posting lists, for smaller index size.

GIN posting lists are now encoded using varbyte-encoding, which allows them
to fit in much smaller space than the straight ItemPointer array format used
before. The new encoding is used for both the lists stored in-line in entry
tree items, and in posting tree leaf pages.

To maintain backwards-compatibility and keep pg_upgrade working, the code
can still read old-style pages and tuples. Posting tree leaf pages in the
new format are flagged with GIN_COMPRESSED flag, to distinguish old and new
format pages. Likewise, entry tree tuples in the new format have a
GIN_ITUP_COMPRESSED flag set in a bit that was previously unused.

This patch bumps GIN_CURRENT_VERSION from 1 to 2. New indexes created with
version 9.4 will therefore have version number 2 in the metapage, while old
pg_upgraded indexes will have version 1. The code treats them the same, but
it might be come handy in the future, if we want to drop support for the
uncompressed format.

Alexander Korotkov and me. Reviewed by Tomas Vondra and Amit Langote.

10 years agoReindent json.c and jsonfuncs.c.
Andrew Dunstan [Wed, 22 Jan 2014 13:46:51 +0000 (08:46 -0500)]
Reindent json.c and jsonfuncs.c.

This will help in preparation of clean patches for upcoming
json work.

10 years agoAllow type_func_name_keywords in even more places
Stephen Frost [Wed, 22 Jan 2014 03:49:22 +0000 (22:49 -0500)]
Allow type_func_name_keywords in even more places

A while back, 2c92edad48796119c83d7dbe6c33425d1924626d allowed
type_func_name_keywords to be used in more places, including role
identifiers.  Unfortunately, that commit missed out on cases where
name_list was used for lists-of-roles, eg: for DROP ROLE.  This
resulted in the unfortunate situation that you could CREATE a role
with a type_func_name_keywords-allowed identifier, but not DROP it
(directly- ALTER could be used to rename it to something which
could be DROP'd).

This extends allowing type_func_name_keywords to places where role
lists can be used.

Back-patch to 9.0, as 2c92edad48796119c83d7dbe6c33425d1924626d was.

10 years agoTweak parse location assignment for CURRENT_DATE and related constructs.
Tom Lane [Tue, 21 Jan 2014 21:34:28 +0000 (16:34 -0500)]
Tweak parse location assignment for CURRENT_DATE and related constructs.

All these constructs generate parse trees consisting of a Const and
a run-time type coercion (perhaps a FuncExpr or a CoerceViaIO).  Modify
the raw parse output so that we end up with the original token's location
attached to the type coercion node while the Const has location -1;
before, it was the other way around.  This makes no difference in terms
of what exprLocation() will say about the parse tree as a whole, so it
should not have any user-visible impact.  The point of changing it is that
we do not want contrib/pg_stat_statements to treat these constructs as
replaceable constants.  It will do the right thing if the Const has
location -1 rather than a valid location.

This is a pretty ugly hack, but then this code is ugly already; we should
someday replace this translation with special-purpose parse node(s) that
would allow ruleutils.c to reconstruct the original query text.

(See also commit 5d3fcc4c2e137417ef470d604fee5e452b22f6a7, which also
hacked location assignment rules for the benefit of pg_stat_statements.)

Back-patch to 9.2 where pg_stat_statements grew the ability to recognize
replaceable constants.

Kyotaro Horiguchi

10 years agoAdd a cardinality function for arrays.
Robert Haas [Tue, 21 Jan 2014 17:38:53 +0000 (12:38 -0500)]
Add a cardinality function for arrays.

Unlike our other array functions, this considers the total number of
elements across all dimensions, and returns 0 rather than NULL when the
array has no elements.  But it seems that both of those behaviors are
almost universally disliked, so hopefully that's OK.

Marko Tiikkaja, reviewed by Dean Rasheed and Pavel Stehule

10 years agoFix inadvertent semantics change in last patch to plug memory leaks.
Robert Haas [Tue, 21 Jan 2014 16:42:37 +0000 (11:42 -0500)]
Fix inadvertent semantics change in last patch to plug memory leaks.

Commit a5bca4ef034f71175d46462963af2329d22068c2 accidentally changed
the semantics when the "skipping missing configuration file" is
emitted, because it forced OK to true instead of leaving the value
untouched.

Spotted by Tom Lane.

10 years agoAvoid a possible relcache leak in get_object_address_attribute.
Robert Haas [Tue, 21 Jan 2014 15:02:37 +0000 (10:02 -0500)]
Avoid a possible relcache leak in get_object_address_attribute.

There's no apparent way to trigger this, so I'm not going to worry
about back-patching it for now.  But it's still wrong.

Marti Raudsepp

10 years agoPlug more memory leaks when reloading config file.
Robert Haas [Tue, 21 Jan 2014 14:41:40 +0000 (09:41 -0500)]
Plug more memory leaks when reloading config file.

Commit 138184adc5f7c60c184972e4d23f8cdb32aed77d plugged some but not
all of the leaks from commit 2a0c81a12c7e6c5ac1557b0f1f4a581f23fd4ca7.
This tightens things up some more.

Amit Kapila, per an observation by Tom Lane

10 years agoExpose a routine to print triggers during EXPLAIN ANALYZE
Alvaro Herrera [Mon, 20 Jan 2014 20:12:50 +0000 (17:12 -0300)]
Expose a routine to print triggers during EXPLAIN ANALYZE

This is so that auto_explain can use it.

Kyotaro HORIGUCHI

10 years agoRemove pg_stat_statements--1.1.sql.
Tom Lane [Mon, 20 Jan 2014 20:03:51 +0000 (15:03 -0500)]
Remove pg_stat_statements--1.1.sql.

Commit 91484409bdd17f330d10671d388b72d4ef1451d7 should have removed this
file, not just reduced it to zero size.

10 years agoFix to_timestamp/to_date's handling of consecutive spaces in format string.
Tom Lane [Mon, 20 Jan 2014 18:45:51 +0000 (13:45 -0500)]
Fix to_timestamp/to_date's handling of consecutive spaces in format string.

When there are consecutive spaces (or other non-format-code characters) in
the format, we should advance over exactly that many characters of input.
The previous coding mistakenly did a "skip whitespace" action between such
characters, possibly allowing more input to be skipped than the user
intended.  We only need to skip whitespace just before an actual field.

This is really a bug fix, but given the minimal number of field complaints
and the risk of breaking applications coded to expect the old behavior,
let's not back-patch it.

Jeevan Chalke

10 years agoFix typo in comment.
Fujii Masao [Mon, 20 Jan 2014 17:22:49 +0000 (02:22 +0900)]
Fix typo in comment.

Sawada Masahiko

10 years agoSpeed up COPY into tables with DEFAULT nextval()
Simon Riggs [Mon, 20 Jan 2014 17:22:38 +0000 (17:22 +0000)]
Speed up COPY into tables with DEFAULT nextval()

Previously the presence of a nextval() prevented the
use of batch-mode COPY.  This patch introduces a
special case just for nextval() functions. In future
we will introduce a general case solution for
labelling volatile functions as safe for use.

10 years agoRename msvc build option krb5 to gss
Magnus Hagander [Sun, 19 Jan 2014 16:07:15 +0000 (17:07 +0100)]
Rename msvc build option krb5 to gss

In the MSVC build system we've never separated krb5 from gss,
and always built them both. Since the removal of native krb5
support, this parameter only controls GSSAPI, so rename it
accordingly.

10 years agoRemove support for native krb5 authentication
Magnus Hagander [Wed, 15 Jan 2014 16:24:01 +0000 (17:24 +0100)]
Remove support for native krb5 authentication

krb5 has been deprecated since 8.3, and the recommended way to do
Kerberos authentication is using the GSSAPI authentication method
(which is still fully supported).

libpq retains the ability to identify krb5 authentication, but only
gives an error message about it being unsupported. Since all authentication
is initiated from the backend, there is no need to keep it at all
in the backend.

10 years agoAdjust the SSL connection notification message
Magnus Hagander [Sun, 19 Jan 2014 12:27:22 +0000 (13:27 +0100)]
Adjust the SSL connection notification message

Suggested by Tom

10 years agoAdd CREATE TABLESPACE ... WITH ... Options
Stephen Frost [Sun, 19 Jan 2014 01:59:31 +0000 (20:59 -0500)]
Add CREATE TABLESPACE ... WITH ... Options

Tablespaces have a few options which can be set on them to give PG hints
as to how the tablespace behaves (perhaps it's faster for sequential
scans, or better able to handle random access, etc).  These options were
only available through the ALTER TABLESPACE command.

This adds the ability to set these options at CREATE TABLESPACE time,
removing the need to do both a CREATE TABLESPACE and ALTER TABLESPACE to
get the correct options set on the tablespace.

Vik Fearing, reviewed by Michael Paquier.

10 years agoFix VACUUM's reporting of dead-tuple counts to the stats collector.
Tom Lane [Sun, 19 Jan 2014 00:24:20 +0000 (19:24 -0500)]
Fix VACUUM's reporting of dead-tuple counts to the stats collector.

Historically, VACUUM has just reported its new_rel_tuples estimate
(the same thing it puts into pg_class.reltuples) to the stats collector.
That number counts both live and dead-but-not-yet-reclaimable tuples.
This behavior may once have been right, but modern versions of the
pgstats code track live and dead tuple counts separately, so putting
the total into n_live_tuples and zero into n_dead_tuples is surely
pretty bogus.  Fix it to report live and dead tuple counts separately.

This doesn't really do much for situations where updating transactions
commit concurrently with a VACUUM scan (possibly causing double-counting or
omission of the tuples they add or delete); but it's clearly an improvement
over what we were doing before.

Hari Babu, reviewed by Amit Kapila

10 years agoAdd ALTER TABLESPACE ... MOVE command
Stephen Frost [Sat, 18 Jan 2014 23:56:40 +0000 (18:56 -0500)]
Add ALTER TABLESPACE ... MOVE command

This adds a 'MOVE' sub-command to ALTER TABLESPACE which allows moving sets of
objects from one tablespace to another.  This can be extremely handy and avoids
a lot of error-prone scripting.  ALTER TABLESPACE ... MOVE will only move
objects the user owns, will notify the user if no objects were found, and can
be used to move ALL objects or specific types of objects (TABLES, INDEXES, or
MATERIALIZED VIEWS).

10 years agoAllow SET TABLESPACE to database default
Stephen Frost [Sat, 18 Jan 2014 23:41:52 +0000 (18:41 -0500)]
Allow SET TABLESPACE to database default

We've always allowed CREATE TABLE to create tables in the database's default
tablespace without checking for CREATE permissions on that tablespace.
Unfortunately, the original implementation of ALTER TABLE ... SET TABLESPACE
didn't pick up on that exception.

This changes ALTER TABLE ... SET TABLESPACE to allow the database's default
tablespace without checking for CREATE rights on that tablespace, just as
CREATE TABLE works today.  Users could always do this through a series of
commands (CREATE TABLE ... AS SELECT * FROM ...; DROP TABLE ...; etc), so
let's fix the oversight in SET TABLESPACE's original implementation.

10 years agoMake various variables const (read-only).
Tom Lane [Sat, 18 Jan 2014 21:04:11 +0000 (16:04 -0500)]
Make various variables const (read-only).

These changes should generally improve correctness/maintainability.
A nice side benefit is that several kilobytes move from initialized
data to text segment, allowing them to be shared across processes and
probably reducing copy-on-write overhead while forking a new backend.
Unfortunately this doesn't seem to help libpq in the same way (at least
not when it's compiled with -fpic on x86_64), but we can hope the linker
at least collects all nominally-const data together even if it's not
actually part of the text segment.

Also, make pg_encname_tbl[] static in encnames.c, since there seems
no very good reason for any other code to use it; per a suggestion
from Wim Lewis, who independently submitted a patch that was mostly
a subset of this one.

Oskari Saarenmaa, with some editorialization by me

10 years agoExport a few more symbols required for test_shm_mq module.
Andrew Dunstan [Sat, 18 Jan 2014 20:29:45 +0000 (15:29 -0500)]
Export a few more symbols required for test_shm_mq module.

Patch from Amit Kapila.

10 years agoFix client-only installation
Peter Eisentraut [Sat, 18 Jan 2014 04:08:22 +0000 (23:08 -0500)]
Fix client-only installation

The psql Makefile was not creating $(datadir) before installing
psqlrc.sample there.

In most cases, the directory would be created in some other way, but for
the documented from-source client-only installation procedure, it could
fail.

Reported-by: Mike Blackwell <mike.blackwell@rrd.com>
10 years agoMinor code beautification in contrib/sslinfo.
Tom Lane [Sat, 18 Jan 2014 01:58:31 +0000 (20:58 -0500)]
Minor code beautification in contrib/sslinfo.

Static-ify some functions that didn't need to be exported, and improve
a couple of comments.

Gurjeet Singh

10 years agoAdd gen_random_uuid() to contrib/pgcrypto.
Tom Lane [Fri, 17 Jan 2014 21:52:06 +0000 (16:52 -0500)]
Add gen_random_uuid() to contrib/pgcrypto.

This function provides a way of generating version 4 (pseudorandom) UUIDs
based on pgcrypto's PRNG.  The main reason for doing this is that the
OSSP UUID library depended on by contrib/uuid-ossp is becoming more and
more of a porting headache, so we need an alternative for people who can't
install that.  A nice side benefit though is that this implementation is
noticeably faster than uuid-ossp's uuid_generate_v4() function.

Oskari Saarenmaa, reviewed by Emre Hasegeli

10 years agoExport set_latch_on_sigusr1 symbol for Windows.
Andrew Dunstan [Fri, 17 Jan 2014 17:48:23 +0000 (12:48 -0500)]
Export set_latch_on_sigusr1 symbol for Windows.

Per buildfarm currawong and grip from David Rowley.

10 years agoPrevent double macro definition of WIN32.
Andrew Dunstan [Fri, 17 Jan 2014 16:49:44 +0000 (11:49 -0500)]
Prevent double macro definition of WIN32.

David Rowley.

10 years agoShow SSL encryption information when logging connections
Magnus Hagander [Fri, 17 Jan 2014 12:27:18 +0000 (13:27 +0100)]
Show SSL encryption information when logging connections

Expand the messages when log_connections is enabled to include the
fact that SSL is used and the SSL cipher information.

Dr. Andreas Kunert, review by Marko Kreen

10 years agoDefine WIN32 when _WIN32 is set
Magnus Hagander [Fri, 17 Jan 2014 11:37:57 +0000 (12:37 +0100)]
Define WIN32 when _WIN32 is set

_WIN32 is set by the compiler, whereas our code uses WIN32 that is
normally set through our build system. To make it possible to build
extensions out of tree we cannot rely on that, so set the WIN32
symbol explicitly whenever the compiler has set _WIN32.

Not setting this symbol causes double inclusion of pg_config_os.h,
and possibly other errors as well.

Craig Ringer

10 years agoPrevent integer overflow with --progress >= 2148
Heikki Linnakangas [Fri, 17 Jan 2014 08:10:43 +0000 (10:10 +0200)]
Prevent integer overflow with --progress >= 2148

If --progress=2148 or higher was given, the calculation of the next time
to report overflowed, and pgbench would print a progress report very
frequently.

Kingter Wang

10 years agodoc: rename "Equals" to "Equal"
Bruce Momjian [Fri, 17 Jan 2014 00:38:22 +0000 (19:38 -0500)]
doc:  rename "Equals" to "Equal"

10 years agodoc: fix := description typo.
Bruce Momjian [Fri, 17 Jan 2014 00:28:50 +0000 (19:28 -0500)]
doc: fix := description typo.

10 years agodocs: update PL/pgSQL docs about the use of := and =
Bruce Momjian [Thu, 16 Jan 2014 21:40:17 +0000 (16:40 -0500)]
docs:  update PL/pgSQL docs about the use of := and =

10 years agoFix Hot Standby feedback sending when streaming busily.
Heikki Linnakangas [Thu, 16 Jan 2014 21:05:02 +0000 (23:05 +0200)]
Fix Hot Standby feedback sending when streaming busily.

Commit 6f60fdd7015b032bf49273c99f80913d57eac284 accidentally removed a
call to XLogWalRcvSendHSFeedback() after flushing received WAL to disk.
The consequence is that when walsender is busy streaming WAL, it doesn't
send HS feedback messages. One is sent if nothing is received from the
master for 100ms, but if there's a steady stream of WAL, it never happens.

Backpatch to 9.3.

Andres Freund and Amit Kapila

10 years agoSplit ecpg_execute() in constituent parts
Alvaro Herrera [Thu, 16 Jan 2014 21:06:50 +0000 (18:06 -0300)]
Split ecpg_execute() in constituent parts

Split the rather long ecpg_execute() function into ecpg_build_params(),
ecpg_autostart_transaction(), a smaller ecpg_execute() and
ecpg_process_output().  There is no user-visible change here, only code
reorganization to support future patches.

Author: Zoltán Böszörményi

Reviewed by Antonin Houska.  Larger, older versions of this patch were
reviewed by Noah Misch and Michael Meskes.

10 years agoAdd display of oprcode (the underlying function's name) to psql's \do+.
Tom Lane [Thu, 16 Jan 2014 20:29:18 +0000 (15:29 -0500)]
Add display of oprcode (the underlying function's name) to psql's \do+.

The + modifier of \do didn't use to do anything, but now it adds an oprcode
column.  This is useful both as an additional form of documentation of what
the operator does, and to save a step when finding out properties of the
underlying function.

Marko Tiikkaja, reviewed by Rushabh Lathia, adjusted a bit by me

10 years agoSplit ECPGdo() in constituent parts
Alvaro Herrera [Thu, 16 Jan 2014 19:36:41 +0000 (16:36 -0300)]
Split ECPGdo() in constituent parts

This splits ECPGdo() into ecpg_prologue(), ecpg_do() and
ecpg_epilogue(), and renames free_params() into ecpg_free_params() and
exports it.  This makes it possible for future code to use these
routines for their own purposes.

There is no user-visible functionality change here, only code
reorganization.

Zoltán Böszörményi

Reviewed by Antonin Houska.  Larger, older versions of this patch were
reviewed by Noah Misch and Michael Meskes.

10 years agoSuppress Coverity complaints in readfuncs.c.
Heikki Linnakangas [Thu, 16 Jan 2014 09:55:08 +0000 (11:55 +0200)]
Suppress Coverity complaints in readfuncs.c.

Coverity is complaining that the value returned by pg_strtok in
READ_LOCATION_FIELD and READ_BITMAPSET_FIELD macros is not used. In commit
39bfc94c86f1990e9db8ea3da0e82995cc1b76db, we did this to the other macros
to placate compilers that complained when the variable was completely
unused, this extends that to the last remaining macros.

10 years agoFix whitespace
Peter Eisentraut [Thu, 16 Jan 2014 02:14:28 +0000 (21:14 -0500)]
Fix whitespace

10 years agotest_shm_mq: Try again to fix compiler warning.
Robert Haas [Wed, 15 Jan 2014 17:44:22 +0000 (12:44 -0500)]
test_shm_mq: Try again to fix compiler warning.

Per complaints from Andres Freund and Tom Lane.

10 years agoLogging running transactions every 15 seconds.
Robert Haas [Wed, 15 Jan 2014 17:41:20 +0000 (12:41 -0500)]
Logging running transactions every 15 seconds.

Previously, we did this just once per checkpoint, but that could make
Hot Standby take a long time to initialize.  To avoid busying an
otherwise-idle system, we don't do this if no WAL has been written
since we did it last.

Andres Freund

10 years agoFix missing parentheses resulting in wrong order of dereference.
Robert Haas [Wed, 15 Jan 2014 15:53:07 +0000 (10:53 -0500)]
Fix missing parentheses resulting in wrong order of dereference.

This could result in referencing uninitialized memory.

Michael Paquier, in response to a complaint from Andres Freund

10 years agotest_shm_mq: Fix checks for negative queue size.
Robert Haas [Wed, 15 Jan 2014 15:50:00 +0000 (10:50 -0500)]
test_shm_mq: Fix checks for negative queue size.

Noted while addressing compiler warnings pointed out on pgsql-hackers.

10 years agoFix compiler warning.
Robert Haas [Wed, 15 Jan 2014 15:24:28 +0000 (10:24 -0500)]
Fix compiler warning.

Kevin Gritter reports that his compiler complains about inq and outq
being possibly-uninitialized at the point where they are passed to
shm_mq_attach().  They are initialized by the call to
setup_dynamic_shared_memory, but apparently his compiler is inlining
that function and then having doubts about whether the for loop will
always execute at least once.  Fix by initializing them to NULL.

10 years agoFix compiler warning: Size isn't 64 bits on 32 bit platforms.
Robert Haas [Wed, 15 Jan 2014 13:29:28 +0000 (08:29 -0500)]
Fix compiler warning: Size isn't 64 bits on 32 bit platforms.

Report by Peter Eisentraut.

11 years agoImprove FILES section of psql reference page.
Tom Lane [Wed, 15 Jan 2014 00:27:57 +0000 (19:27 -0500)]
Improve FILES section of psql reference page.

Primarily, explain where to find the system-wide psqlrc file, per recent
gripe from John Sutton.  Do some general wordsmithing and improve the
markup, too.

Also adjust psqlrc.sample so its comments about file location are somewhat
trustworthy.  (Not sure why we bother with this file when it's empty,
but whatever.)

Back-patch to 9.2 where the startup file naming scheme was last changed.

11 years agoFix multiple bugs in index page locking during hot-standby WAL replay.
Tom Lane [Tue, 14 Jan 2014 22:34:47 +0000 (17:34 -0500)]
Fix multiple bugs in index page locking during hot-standby WAL replay.

In ordinary operation, VACUUM must be careful to take a cleanup lock on
each leaf page of a btree index; this ensures that no indexscans could
still be "in flight" to heap tuples due to be deleted.  (Because of
possible index-tuple motion due to concurrent page splits, it's not enough
to lock only the pages we're deleting index tuples from.)  In Hot Standby,
the WAL replay process must likewise lock every leaf page.  There were
several bugs in the code for that:

* The replay scan might come across unused, all-zero pages in the index.
While btree_xlog_vacuum itself did the right thing (ie, nothing) with
such pages, xlogutils.c supposed that such pages must be corrupt and
would throw an error.  This accounts for various reports of replication
failures with "PANIC: WAL contains references to invalid pages".  To
fix, add a ReadBufferMode value that instructs XLogReadBufferExtended
not to complain when we're doing this.

* btree_xlog_vacuum performed the extra locking if standbyState ==
STANDBY_SNAPSHOT_READY, but that's not the correct test: we won't open up
for hot standby queries until the database has reached consistency, and
we don't want to do the extra locking till then either, for fear of reading
corrupted pages (which bufmgr.c would complain about).  Fix by exporting a
new function from xlog.c that will report whether we're actually in hot
standby replay mode.

* To ensure full coverage of the index in the replay scan, btvacuumscan
would emit a dummy WAL record for the last page of the index, if no
vacuuming work had been done on that page.  However, if the last page
of the index is all-zero, that would result in corruption of said page,
since the functions called on it weren't prepared to handle that case.
There's no need to lock any such pages, so change the logic to target
the last normal leaf page instead.

The first two of these bugs were diagnosed by Andres Freund, the other one
by me.  Fixes based on ideas from Heikki Linnakangas and myself.

This has been wrong since Hot Standby was introduced, so back-patch to 9.0.

11 years agoDocumentation for test_shm_mq.
Robert Haas [Tue, 14 Jan 2014 20:58:15 +0000 (15:58 -0500)]
Documentation for test_shm_mq.

Commit 4db3744f1f43554b03d8193da4645a0a5326eb18 added this contrib
module but neglected to document it.  Oops.

11 years agoMention that VACUUM FREEZE also effectively zeroes the table freeze age.
Robert Haas [Tue, 14 Jan 2014 19:48:57 +0000 (14:48 -0500)]
Mention that VACUUM FREEZE also effectively zeroes the table freeze age.

Maciek Sakrejda, reviewed by Amit Kapila

11 years agoFix typo in comment.
Robert Haas [Tue, 14 Jan 2014 19:34:43 +0000 (14:34 -0500)]
Fix typo in comment.

Etsuro Fujita

11 years agoTest code for shared memory message queue facility.
Robert Haas [Tue, 14 Jan 2014 17:24:12 +0000 (12:24 -0500)]
Test code for shared memory message queue facility.

This code is intended as a demonstration of how the dynamic shared
memory and dynamic background worker facilities can be used to establish
a group of coooperating processes which can coordinate their activities
using the shared memory message queue facility.  By itself, the code
does nothing particularly interesting: it simply allows messages to
be passed through a loop of workers and back to the original process.
But it's a useful unit test, in addition to its demonstration value.

11 years agoSingle-reader, single-writer, lightweight shared message queue.
Robert Haas [Tue, 14 Jan 2014 17:23:22 +0000 (12:23 -0500)]
Single-reader, single-writer, lightweight shared message queue.

This code provides infrastructure for user backends to communicate
relatively easily with background workers.  The message queue is
structured as a ring buffer and allows messages of arbitary length
to be sent and received.

Patch by me.  Review by KaiGai Kohei and Andres Freund.

11 years agoSimple table of contents for a shared memory segment.
Robert Haas [Tue, 14 Jan 2014 17:18:58 +0000 (12:18 -0500)]
Simple table of contents for a shared memory segment.

This interface is intended to make it simple to divide a dynamic shared
memory segment into different regions with distinct purposes.  It
therefore serves much the same purpose that ShmemIndex accomplishes for
the main shared memory segment, but it is intended to be more
lightweight.

Patch by me.  Review by Andres Freund.

11 years agoCode improvements for ALTER SYSTEM .. SET.
Robert Haas [Mon, 13 Jan 2014 19:54:00 +0000 (14:54 -0500)]
Code improvements for ALTER SYSTEM .. SET.

Move FreeConfigVariables() later to make sure ErrorConfFile is valid
when we use it, and get rid of an unnecessary string copy operation.

Amit Kapila, kibitzed by me.

11 years agoMake bitmap heap scans show exact/lossy block info in EXPLAIN ANALYZE.
Robert Haas [Mon, 13 Jan 2014 19:42:16 +0000 (14:42 -0500)]
Make bitmap heap scans show exact/lossy block info in EXPLAIN ANALYZE.

Etsuro Fujita

11 years agoFix possible buffer overrun in contrib/pg_trgm.
Tom Lane [Mon, 13 Jan 2014 18:07:10 +0000 (13:07 -0500)]
Fix possible buffer overrun in contrib/pg_trgm.

Allow for the possibility that folding a string to lower case makes it
longer (due to replacing a character with a longer multibyte character).
This doesn't change the number of trigrams that will be extracted, but
it does affect the required size of an intermediate buffer in
generate_trgm().  Per bug #8821 from Ufuk Kayserilioglu.

Also install some checks that the input string length is not so large
as to cause overflow in the calculations of palloc request sizes.

Back-patch to all supported versions.

11 years agoFix calculation of ISMN check digit.
Heikki Linnakangas [Mon, 13 Jan 2014 13:42:35 +0000 (15:42 +0200)]
Fix calculation of ISMN check digit.

This has always been broken, so back-patch to all supported versions.

Fabien COELHO

11 years agoAdd OVERLAPS to index in the docs.
Heikki Linnakangas [Mon, 13 Jan 2014 13:14:42 +0000 (15:14 +0200)]
Add OVERLAPS to index in the docs.

Per report from Adam Mackler and Jonathan Katz

11 years agoAlways use the same way to addres a descriptor in ecpg's regression tests.
Michael Meskes [Mon, 13 Jan 2014 09:41:53 +0000 (10:41 +0100)]
Always use the same way to addres a descriptor in ecpg's regression tests.

11 years agoFix pg_dumpall on pre-8.1 servers
Bruce Momjian [Mon, 13 Jan 2014 03:25:27 +0000 (22:25 -0500)]
Fix pg_dumpall on pre-8.1 servers

rolname did not exist in pg_shadow.

Backpatch to 9.3

Report by Andrew Gierth via IRC

11 years agoDisallow LATERAL references to the target table of an UPDATE/DELETE.
Tom Lane [Sun, 12 Jan 2014 00:03:12 +0000 (19:03 -0500)]
Disallow LATERAL references to the target table of an UPDATE/DELETE.

On second thought, commit 0c051c90082da0b7e5bcaf9aabcbd4f361137cdc was
over-hasty: rather than allowing this case, we ought to reject it for now.
That leaves the field clear for a future feature that allows the target
table to be re-specified in the FROM (or USING) clause, which will enable
left-joining the target table to something else.  We can then also allow
LATERAL references to such an explicitly re-specified target table.
But allowing them right now will create ambiguities or worse for such a
feature, and it isn't something we documented 9.3 as supporting.

While at it, add a convenience subroutine to avoid having several copies
of the ereport for disalllowed-LATERAL-reference cases.

11 years agoFix possible crashes due to using elog/ereport too early in startup.
Tom Lane [Sat, 11 Jan 2014 21:35:26 +0000 (16:35 -0500)]
Fix possible crashes due to using elog/ereport too early in startup.

Per reports from Andres Freund and Luke Campbell, a server failure during
set_pglocale_pgservice results in a segfault rather than a useful error
message, because the infrastructure needed to use ereport hasn't been
initialized; specifically, MemoryContextInit hasn't been called.
One known cause of this is starting the server in a directory it
doesn't have permission to read.

We could try to prevent set_pglocale_pgservice from using anything that
depends on palloc or elog, but that would be messy, and the odds of future
breakage seem high.  Moreover there are other things being called in main.c
that look likely to use palloc or elog too --- perhaps those things
shouldn't be there, but they are there today.  The best solution seems to
be to move the call of MemoryContextInit to very early in the backend's
real main() function.  I've verified that an elog or ereport occurring
immediately after that is now capable of sending something useful to
stderr.

I also added code to elog.c to print something intelligible rather than
just crashing if MemoryContextInit hasn't created the ErrorContext.
This could happen if MemoryContextInit itself fails (due to malloc
failure), and provides some future-proofing against someone trying to
sneak in new code even earlier in server startup.

Back-patch to all supported branches.  Since we've only heard reports of
this type of failure recently, it may be that some recent change has made
it more likely to see a crash of this kind; but it sure looks like it's
broken all the way back.

11 years agoRevert fd2ace802811c333b0b4e1a28b138fd4774745f3
Bruce Momjian [Sat, 11 Jan 2014 19:00:32 +0000 (14:00 -0500)]
Revert fd2ace802811c333b0b4e1a28b138fd4774745f3

Seems we want to document '=' plpgsql assignment instead.

11 years agoFix compute_scalar_stats() for case that all values exceed WIDTH_THRESHOLD.
Tom Lane [Sat, 11 Jan 2014 18:41:41 +0000 (13:41 -0500)]
Fix compute_scalar_stats() for case that all values exceed WIDTH_THRESHOLD.

The standard typanalyze functions skip over values whose detoasted size
exceeds WIDTH_THRESHOLD (1024 bytes), so as to limit memory bloat during
ANALYZE.  However, we (I think I, actually :-() failed to consider the
possibility that *every* non-null value in a column is too wide.  While
compute_minimal_stats() seems to behave reasonably anyway in such a case,
compute_scalar_stats() just fell through and generated no pg_statistic
entry at all.  That's unnecessarily pessimistic: we can still produce
valid stanullfrac and stawidth values in such cases, since we do include
too-wide values in the average-width calculation.  Furthermore, since the
general assumption in this code is that too-wide values are probably all
distinct from each other, it seems reasonable to set stadistinct to -1
("all distinct").

Per complaint from Kadri Raudsepp.  This has been like this since roughly
neolithic times, so back-patch to all supported branches.

11 years agodocs: remove undocumented assign syntax in plpgsql examples
Bruce Momjian [Sat, 11 Jan 2014 18:41:01 +0000 (13:41 -0500)]
docs:  remove undocumented assign syntax in plpgsql examples

Pavel Stehule

11 years agoAdd another regression test cross-checking operator and function comments.
Tom Lane [Sat, 11 Jan 2014 05:16:08 +0000 (00:16 -0500)]
Add another regression test cross-checking operator and function comments.

Add a query that lists all the functions that are operator implementation
functions and have a SQL comment that doesn't just say "implementation of
XYZ operator".  (Note that the preceding test checks that such functions'
comments exactly match the corresponding operators' comments.)

While it's not forbidden to add more functions to this list, that should
only be done when we're encouraging users to use either the function or
operator syntax for the functionality, which is a fairly rare situation.

11 years agoRemove DESCR entries for json operator functions.
Andrew Dunstan [Sat, 11 Jan 2014 03:25:04 +0000 (22:25 -0500)]
Remove DESCR entries for json operator functions.

Per -hackers discussion.

11 years agoAdjust pg_upgrade for move of username lookup functions to /common
Bruce Momjian [Sat, 11 Jan 2014 01:56:47 +0000 (20:56 -0500)]
Adjust pg_upgrade for move of username lookup functions to /common

11 years agoMove username lookup functions from /port to /common
Bruce Momjian [Fri, 10 Jan 2014 23:03:28 +0000 (18:03 -0500)]
Move username lookup functions from /port to /common

Per suggestion from Peter E and Alvaro

11 years agoAccept pg_upgraded tuples during multixact freezing
Alvaro Herrera [Fri, 10 Jan 2014 21:03:18 +0000 (18:03 -0300)]
Accept pg_upgraded tuples during multixact freezing

The new MultiXact freezing routines introduced by commit 8e9a16ab8f7
neglected to consider tuples that came from a pg_upgrade'd database; a
vacuum run that tried to freeze such tuples would die with an error such
as
ERROR: MultiXactId 11415437 does no longer exist -- apparent wraparound

To fix, ensure that GetMultiXactIdMembers is allowed to return empty
multis when the infomask bits are right, as is done in other callsites.

Per trouble report from F-Secure.

In passing, fix a copy&paste bug reported by Andrey Karpov from VIVA64
from their PVS-Studio static checked, that instead of setting relminmxid
to Invalid, we were setting relfrozenxid twice.  Not an important
mistake because that code branch is about relations for which we don't
use the frozenxid/minmxid values at all in the first place, but seems to
warrants a fix nonetheless.

11 years agoRemove unnecessary local variables to work around an icc optimization bug.
Tom Lane [Thu, 9 Jan 2014 17:59:55 +0000 (12:59 -0500)]
Remove unnecessary local variables to work around an icc optimization bug.

Buildfarm member dunlin has been crashing since commit 8b49a60, but other
machines seem fine with that code.  It turns out that removing the local
variables in ordered_set_startup() that are copies of fields in "qstate"
dodges the problem.  This might cost a few cycles on register-rich
machines, but it's probably a wash on others, and in any case this code
isn't performance-critical.  Thanks to Jeremy Drake for off-list
investigation.

11 years agoChanged regression test to ecpg test suite for alignment problem just with last
Michael Meskes [Thu, 9 Jan 2014 15:18:12 +0000 (16:18 +0100)]
Changed regression test to ecpg test suite for alignment problem just with last
commit.

11 years agoFix descriptor output in ECPG.
Michael Meskes [Thu, 9 Jan 2014 14:41:51 +0000 (15:41 +0100)]
Fix descriptor output in ECPG.

While working on most platforms the old way sometimes created alignment
problems. This should fix it. Also the regresion tests were updated to test for
the reported case.

Report and fix by MauMau <maumau307@gmail.com>

11 years agoRefactor checking whether we've reached the recovery target.
Heikki Linnakangas [Thu, 9 Jan 2014 12:00:39 +0000 (14:00 +0200)]
Refactor checking whether we've reached the recovery target.

Makes the replay loop slightly more readable, by separating the concerns of
whether to stop and whether to delay, and how to extract the timestamp from
a record.

This has the user-visible change that the timestamp of the last applied
record is now updated after actually applying it. Before, it was updated
just before applying it. That meant that pg_last_xact_replay_timestamp()
could return the timestamp of a commit record that is in process of being
replayed, but not yet applied. Normally the difference is small, but if
min_recovery_apply_delay is set, there could be a significant delay between
reading a record and applying it.

Another behavioral change is that if you recover to a restore point, we stop
after the restore point record, not before it. It makes no difference as far
as running queries on the server is concerned, as applying a restore point
record changes nothing, but if examine the timeline history you will see
that the new timeline branched off just after the restore point record, not
before it. One practical consequence is that if you do PITR to the new
timeline, and set recovery target to the same named restore point again, it
will find and stop recovery at the same restore point. Conceptually, I think
it makes more sense to consider the restore point as part of the new
timeline's history than not.

In principle, setting the last-replayed timestamp before actually applying
the record was a bug all along, but it doesn't seem worth the risk to
backpatch, since min_recovery_apply_delay was only added in 9.4.

11 years agopgcrypto: Make header files stand alone
Peter Eisentraut [Thu, 9 Jan 2014 11:44:24 +0000 (06:44 -0500)]
pgcrypto: Make header files stand alone

pgp.h used to require including mbuf.h and px.h first.  Include those in
pgp.h, so that it can be used without prerequisites.  Remove mbuf.h
inclusions in .c files where mbuf.h features are not used
directly.  (px.h was always used.)

11 years agoWe don't need to include pg_sema.h in s_lock.h anymore.
Tom Lane [Thu, 9 Jan 2014 01:58:22 +0000 (20:58 -0500)]
We don't need to include pg_sema.h in s_lock.h anymore.

Minor improvement to commit daa7527afc2274432094ebe7ceb03aa41f916607:
s_lock.h no longer has any need to mention PGSemaphoreData, so we can
rip out the #include that supplies that.  In a non-HAVE_SPINLOCKS
build, this doesn't really buy much since we still need the #include
in spin.h --- but everywhere else, this reduces #include footprint by
some trifle, and helps keep the different locking facilities separate.

11 years agoFix "cannot accept a set" error when only some arms of a CASE return a set.
Tom Lane [Thu, 9 Jan 2014 01:18:06 +0000 (20:18 -0500)]
Fix "cannot accept a set" error when only some arms of a CASE return a set.

In commit c1352052ef1d4eeb2eb1d822a207ddc2d106cb13, I implemented an
optimization that assumed that a function's argument expressions would
either always return a set (ie multiple rows), or always not.  This is
wrong however: we allow CASE expressions in which some arms return a set
of some type and others just return a scalar of that type.  There may be
other examples as well.  To fix, replace the run-time test of whether an
argument returned a set with a static precheck (expression_returns_set).
This adds a little bit of query startup overhead, but it seems barely
measurable.

Per bug #8228 from David Johnston.  This has been broken since 8.0,
so patch all supported branches.

11 years agoReduce the number of semaphores used under --disable-spinlocks.
Robert Haas [Wed, 8 Jan 2014 23:49:14 +0000 (18:49 -0500)]
Reduce the number of semaphores used under --disable-spinlocks.

Instead of allocating a semaphore from the operating system for every
spinlock, allocate a fixed number of semaphores (by default, 1024)
from the operating system and multiplex all the spinlocks that get
created onto them.  This could self-deadlock if a process attempted
to acquire more than one spinlock at a time, but since processes
aren't supposed to execute anything other than short stretches of
straight-line code while holding a spinlock, that shouldn't happen.

One motivation for this change is that, with the introduction of
dynamic shared memory, it may be desirable to create spinlocks that
last for less than the lifetime of the server.  Without this change,
attempting to use such facilities under --disable-spinlocks would
quickly exhaust any supply of available semaphores.  Quite apart
from that, it's desirable to contain the quantity of semaphores
needed to run the server simply on convenience grounds, since using
too many may make it harder to get PostgreSQL running on a new
platform, which is mostly the point of --disable-spinlocks in the
first place.

Patch by me; review by Tom Lane.

11 years agoFix pause_at_recovery_target + recovery_target_inclusive combination.
Heikki Linnakangas [Wed, 8 Jan 2014 21:06:03 +0000 (23:06 +0200)]
Fix pause_at_recovery_target + recovery_target_inclusive combination.

If pause_at_recovery_target is set, recovery pauses *before* applying the
target record, even if recovery_target_inclusive is set. If you then
continue with pg_xlog_replay_resume(), it will apply the target record
before ending recovery. In other words, if you log in while it's paused
and verify that the database looks OK, ending recovery changes its state
again, possibly destroying data that you were tring to salvage with PITR.

Backpatch to 9.1, this has been broken since pause_at_recovery_target was
added.

11 years agoIf multiple recovery_targets are specified, use the latest one.
Heikki Linnakangas [Wed, 8 Jan 2014 20:26:39 +0000 (22:26 +0200)]
If multiple recovery_targets are specified, use the latest one.

The docs say that only one of recovery_target_xid, recovery_target_time, or
recovery_target_name can be specified. But the code actually did something
different, so that a name overrode time, and xid overrode both time and name.
Now the target specified last takes effect, whether it's an xid, time or
name.

With this patch, we still accept multiple recovery_target settings, even
though docs say that only one can be specified. It's a general property of
the recovery.conf file parser that you if you specify the same option twice,
the last one takes effect, like with postgresql.conf.

11 years agoAvoid extra AggCheckCallContext() checks in ordered-set aggregates.
Tom Lane [Wed, 8 Jan 2014 19:33:52 +0000 (14:33 -0500)]
Avoid extra AggCheckCallContext() checks in ordered-set aggregates.

In the transition functions, we don't really need to recheck this after the
first call.  I had been feeling paranoid about possibly getting a non-null
argument value in some other context; but it's probably game over anyway
if we have a non-null "internal" value that's not what we are expecting.

In the final functions, the general convention in pre-existing final
functions seems to be that an Assert() is good enough, so do it like that
here too.

This seems to save a few tenths of a percent of overall query runtime,
which isn't much, but still it's just overhead if there's not a plausible
case where the checks would fire.

11 years agoSave a few cycles in advance_transition_function().
Tom Lane [Wed, 8 Jan 2014 18:58:15 +0000 (13:58 -0500)]
Save a few cycles in advance_transition_function().

Keep a pre-initialized FunctionCallInfoData in AggStatePerAggData, and
re-use that at each row instead of doing InitFunctionCallInfoData each
time.  This saves only half a dozen assignments and maybe some stack
manipulation, and yet that seems to be good for a percent or two of the
overall query run time for simple aggregates such as count(*).  The cost
is that the FunctionCallInfoData (which is about a kilobyte, on 64-bit
machines) stays allocated for the duration of the query instead of being
short-lived stack data.  But we're already paying an equivalent space cost
for each regular FuncExpr or OpExpr node, so I don't feel bad about paying
it for aggregate functions.  The code seems a little cleaner this way too,
since the number of things passed to advance_transition_function decreases.

11 years agoFix bug in determining when recovery has reached consistency.
Heikki Linnakangas [Wed, 8 Jan 2014 09:39:55 +0000 (11:39 +0200)]
Fix bug in determining when recovery has reached consistency.

When starting WAL replay from an online checkpoint, the last replayed WAL
record variable was initialized using the checkpoint record's location, even
though the records between the REDO location and the checkpoint record had
not been replayed yet. That was noted as "slightly confusing" but harmless
in the comment, but in some cases, it fooled CheckRecoveryConsistency to
incorrectly conclude that we had already reached a consistent state
immediately at the beginning of WAL replay. That caused the system to accept
read-only connections in hot standby mode too early, and also PANICs with
message "WAL contains references to invalid pages".

Fix by initializing the variables to the REDO location instead.

In 9.2 and above, change CheckRecoveryConsistency() to use
lastReplayedEndRecPtr variable when checking if backup end location has
been reached. It was inconsistently using EndRecPtr for that check, but
lastReplayedEndRecPtr when checking min recovery point. It made no
difference before this patch, because in all the places where
CheckRecoveryConsistency was called the two variables were the same, but
it was always an accident waiting to happen, and would have been wrong
after this patch anyway.

Report and analysis by Tomonari Katsumata, bug #8686. Backpatch to 9.0,
where hot standby was introduced.

11 years agopg_upgrade: Fix fatal error handling
Peter Eisentraut [Wed, 8 Jan 2014 12:01:16 +0000 (07:01 -0500)]
pg_upgrade: Fix fatal error handling

Restore exiting when pg_log(PG_FATAL) is called directly instead of
calling pg_fatal().  Fault introduced in
264aa14a2f687eba8c8cc2a5b6cbd6397973da98.

11 years agoUpdate copyright for 2014
Bruce Momjian [Tue, 7 Jan 2014 21:05:30 +0000 (16:05 -0500)]
Update copyright for 2014

Update all files in head, and files COPYRIGHT and legal.sgml in all back
branches.

11 years agoFix LATERAL references to target table of UPDATE/DELETE.
Tom Lane [Tue, 7 Jan 2014 20:25:16 +0000 (15:25 -0500)]
Fix LATERAL references to target table of UPDATE/DELETE.

I failed to think much about UPDATE/DELETE when implementing LATERAL :-(.
The implemented behavior ended up being that subqueries in the FROM or
USING clause (respectively) could access the update/delete target table as
though it were a lateral reference; which seems fine if they said LATERAL,
but certainly ought to draw an error if they didn't.  Fix it so you get a
suitable error when you omit LATERAL.  Per report from Emre Hasegeli.

11 years agoSilence compiler warning on MSVC.
Heikki Linnakangas [Tue, 7 Jan 2014 19:47:54 +0000 (21:47 +0200)]
Silence compiler warning on MSVC.

MSVC doesn't know that elog(ERROR) doesn't return, and gives a warning about
missing return. Silence that.

Amit Kapila

11 years agoMove permissions check from do_pg_start_backup to pg_start_backup
Magnus Hagander [Tue, 7 Jan 2014 16:47:52 +0000 (17:47 +0100)]
Move permissions check from do_pg_start_backup to pg_start_backup

And the same for do_pg_stop_backup. The code in do_pg_* is not allowed
to access the catalogs. For manual base backups, the permissions
check can be handled in the calling function, and for streaming
base backups only users with the required permissions can get past
the authentication step in the first place.

Reported by Antonin Houska, diagnosed by Andres Freund

11 years agoAvoid including tablespaces inside PGDATA twice in base backups
Magnus Hagander [Tue, 7 Jan 2014 16:04:40 +0000 (17:04 +0100)]
Avoid including tablespaces inside PGDATA twice in base backups

If a tablespace was crated inside PGDATA it was backed up both as part
of the PGDATA backup and as the backup of the tablespace. Avoid this
by skipping any directory inside PGDATA that contains one of the active
tablespaces.

Dimitri Fontaine and Magnus Hagander

11 years agoAdd more use of psprintf()
Peter Eisentraut [Tue, 7 Jan 2014 02:30:26 +0000 (21:30 -0500)]
Add more use of psprintf()

11 years agoRemove bogus -K option from pg_dump.
Heikki Linnakangas [Mon, 6 Jan 2014 10:30:19 +0000 (12:30 +0200)]
Remove bogus -K option from pg_dump.

I added it to the getopt call by accident in commit
691e595dd9c7786d37d73ccd327f8c2b6f0dace6.

Amit Kapila

11 years agoCache catalog lookup data across groups in ordered-set aggregates.
Tom Lane [Sun, 5 Jan 2014 17:28:39 +0000 (12:28 -0500)]
Cache catalog lookup data across groups in ordered-set aggregates.

The initial commit of ordered-set aggregates just did all the setup work
afresh each time the aggregate function is started up.  But in a GROUP BY
query, the catalog lookups need not be repeated for each group, since the
column datatypes and sort information won't change.  When there are many
small groups, this makes for a useful, though not huge, performance
improvement.  Per suggestion from Andrew Gierth.

Profiling of these cases suggests that it might be profitable to avoid
duplicate lookups within tuplesort startup as well; but changing the
tuplesort APIs would have much broader impact, so I left that for
another day.

11 years agoFix translatability markings in psql, and add defenses against future bugs.
Tom Lane [Sat, 4 Jan 2014 21:05:16 +0000 (16:05 -0500)]
Fix translatability markings in psql, and add defenses against future bugs.

Several previous commits have added columns to various \d queries without
updating their translate_columns[] arrays, leading to potentially incorrect
translations in NLS-enabled builds.  Offenders include commit 893686762
(added prosecdef to \df+), c9ac00e6e (added description to \dc+) and
3b17efdfd (added description to \dC+).  Fix those cases back to 9.3 or
9.2 as appropriate.

Since this is evidently more easily missed than one would like, in HEAD
also add an Assert that the supplied array is long enough.  This requires
an API change for printQuery(), so it seems inappropriate for back
branches, but presumably all future changes will be tested in HEAD anyway.

In HEAD and 9.3, also clean up a whole lot of sloppiness in the emitted
SQL for \dy (event triggers): lack of translatability due to failing to
pass words-to-be-translated through gettext_noop(), inadequate schema
qualification, and sloppy formatting resulting in unnecessarily ugly
-E output.

Peter Eisentraut and Tom Lane, per bug #8702 from Sergey Burladyan

11 years agoFix header comment for bitncmp().
Tom Lane [Sat, 4 Jan 2014 19:01:51 +0000 (14:01 -0500)]
Fix header comment for bitncmp().

The result is an int less than, equal to, or greater than zero, in the
style of memcmp (and, in fact, exactly the output of memcmp in some cases).
This comment previously said -1, 1, or 0, which was an overspecification,
as noted by Emre Hasegeli.  All of the existing callers appear to be fine
with the actual behavior, so just fix the comment.

In passing, improve infelicitous formatting of some call sites.

11 years agoFix typo in comment.
Tom Lane [Sat, 4 Jan 2014 18:48:50 +0000 (13:48 -0500)]
Fix typo in comment.

classifyClauses was renamed to classifyConditions somewhere along the
line, but this comment didn't get the memo.

Ian Barwick

11 years agoRestore some comments lost during 15732b34e8c8
Alvaro Herrera [Fri, 3 Jan 2014 16:22:03 +0000 (13:22 -0300)]
Restore some comments lost during 15732b34e8c8

Michael Paquier

11 years agoOoops, should use double not single quotes in StaticAssertStmt().
Tom Lane [Fri, 3 Jan 2014 02:54:20 +0000 (21:54 -0500)]
Ooops, should use double not single quotes in StaticAssertStmt().

That's what I get for testing this on an older compiler.

11 years agoFix calculation of maximum statistics-message size.
Tom Lane [Fri, 3 Jan 2014 02:45:47 +0000 (21:45 -0500)]
Fix calculation of maximum statistics-message size.

The PGSTAT_NUM_TABENTRIES macro should have been updated when new fields
were added to struct PgStat_MsgTabstat in commit 644828908, but it wasn't.
Fix that.

Also, add a static assertion that we didn't overrun the intended size limit
on stats messages.  This will not necessarily catch every mistake in
computing the maximum array size for stats messages, but it will catch ones
that have practical consequences.  (The assertion in fact doesn't complain
about the aforementioned error in PGSTAT_NUM_TABENTRIES, because that was
not big enough to cause the array length to increase.)

No back-patch, as there's no actual bug in existing releases; this is just
in the nature of future-proofing.

Mark Dilger and Tom Lane

11 years agoHandle 5-char filenames in SlruScanDirectory
Alvaro Herrera [Thu, 2 Jan 2014 21:17:29 +0000 (18:17 -0300)]
Handle 5-char filenames in SlruScanDirectory

Original users of slru.c were all producing 4-digit filenames, so that
was all that that code was prepared to handle.  Changes to multixact.c
in the course of commit 0ac5ad5134f made pg_multixact/members create
5-digit filenames once a certain threshold was reached, which
SlruScanDirectory wasn't prepared to deal with; in particular,
5-digit-name files were not removed during truncation.  Change that
routine to make it aware of those files, and have it process them just
like any others.

Right now, some pg_multixact/members directories will contain a mixture
of 4-char and 5-char filenames.  A future commit is expected fix things
so that each slru.c user declares the correct maximum width for the
files it produces, to avoid such unsightly mixtures.

Noticed while investigating bug #8673 reported by Serge Negodyuck.

11 years agoWrap multixact/members correctly during extension
Alvaro Herrera [Thu, 2 Jan 2014 21:17:07 +0000 (18:17 -0300)]
Wrap multixact/members correctly during extension

In the 9.2 code for extending multixact/members, the logic was very
simple because the number of entries in a members page was a proper
divisor of 2^32, and thus at 2^32 wraparound the logic for page switch
was identical than at any other page boundary.  In commit 0ac5ad5134f I
failed to realize this and introduced code that was not able to go over
the 2^32 boundary.  Fix that by ensuring that when we reach the last
page of the last segment we correctly zero the initial page of the
initial segment, using correct uint32-wraparound-safe arithmetic.

Noticed while investigating bug #8673 reported by Serge Negodyuck, as
diagnosed by Andres Freund.