]> granicus.if.org Git - postgresql/log
postgresql
11 years agoClarify docs on hot standby lock release
Simon Riggs [Tue, 13 Nov 2012 18:56:28 +0000 (15:56 -0300)]
Clarify docs on hot standby lock release

Andres Freund and Simon Riggs

11 years agoFix multiple problems in WAL replay.
Tom Lane [Tue, 13 Nov 2012 03:05:14 +0000 (22:05 -0500)]
Fix multiple problems in WAL replay.

Most of the replay functions for WAL record types that modify more than
one page failed to ensure that those pages were locked correctly to ensure
that concurrent queries could not see inconsistent page states.  This is
a hangover from coding decisions made long before Hot Standby was added,
when it was hardly necessary to acquire buffer locks during WAL replay
at all, let alone hold them for carefully-chosen periods.

The key problem was that RestoreBkpBlocks was written to hold lock on each
page restored from a full-page image for only as long as it took to update
that page.  This was guaranteed to break any WAL replay function in which
there was any update-ordering constraint between pages, because even if the
nominal order of the pages is the right one, any mixture of full-page and
non-full-page updates in the same record would result in out-of-order
updates.  Moreover, it wouldn't work for situations where there's a
requirement to maintain lock on one page while updating another.  Failure
to honor an update ordering constraint in this way is thought to be the
cause of bug #7648 from Daniel Farina: what seems to have happened there
is that a btree page being split was rewritten from a full-page image
before the new right sibling page was written, and because lock on the
original page was not maintained it was possible for hot standby queries to
try to traverse the page's right-link to the not-yet-existing sibling page.

To fix, get rid of RestoreBkpBlocks as such, and instead create a new
function RestoreBackupBlock that restores just one full-page image at a
time.  This function can be invoked by WAL replay functions at the points
where they would otherwise perform non-full-page updates; in this way, the
physical order of page updates remains the same no matter which pages are
replaced by full-page images.  We can then further adjust the logic in
individual replay functions if it is necessary to hold buffer locks
for overlapping periods.  A side benefit is that we can simplify the
handling of concurrency conflict resolution by moving that code into the
record-type-specfic functions; there's no more need to contort the code
layout to keep conflict resolution in front of the RestoreBkpBlocks call.

In connection with that, standardize on zero-based numbering rather than
one-based numbering for referencing the full-page images.  In HEAD, I
removed the macros XLR_BKP_BLOCK_1 through XLR_BKP_BLOCK_4.  They are
still there in the header files in previous branches, but are no longer
used by the code.

In addition, fix some other bugs identified in the course of making these
changes:

spgRedoAddNode could fail to update the parent downlink at all, if the
parent tuple is in the same page as either the old or new split tuple and
we're not doing a full-page image: it would get fooled by the LSN having
been advanced already.  This would result in permanent index corruption,
not just transient failure of concurrent queries.

Also, ginHeapTupleFastInsert's "merge lists" case failed to mark the old
tail page as a candidate for a full-page image; in the worst case this
could result in torn-page corruption.

heap_xlog_freeze() was inconsistent about using a cleanup lock or plain
exclusive lock: it did the former in the normal path but the latter for a
full-page image.  A plain exclusive lock seems sufficient, so change to
that.

Also, remove gistRedoPageDeleteRecord(), which has been dead code since
VACUUM FULL was rewritten.

Back-patch to 9.0, where hot standby was introduced.  Note however that 9.0
had a significantly different WAL-logging scheme for GIST index updates,
and it doesn't appear possible to make that scheme safe for concurrent hot
standby queries, because it can leave inconsistent states in the index even
between WAL records.  Given the lack of complaints from the field, we won't
work too hard on fixing that branch.

11 years agoCheck for stack overflow in transformSetOperationTree().
Tom Lane [Mon, 12 Nov 2012 00:56:16 +0000 (19:56 -0500)]
Check for stack overflow in transformSetOperationTree().

Since transformSetOperationTree() recurses, it can be driven to stack
overflow with enough UNION/INTERSECT/EXCEPT clauses in a query.  Add a
check to ensure it fails cleanly instead of crashing.  Per report from
Matthew Gerber (though it's not clear whether this is the only thing
going wrong for him).

Historical note: I think the reasoning behind not putting a check here in
the beginning was that the check in transformExpr() ought to be sufficient
to guard the whole parser.  However, because transformSetOperationTree()
recurses all the way to the bottom of the set-operation tree before doing
any analysis of the statement's expressions, that check doesn't save it.

11 years agoXSLT stylesheet: Add slash to directory name
Peter Eisentraut [Fri, 9 Nov 2012 04:55:36 +0000 (23:55 -0500)]
XSLT stylesheet: Add slash to directory name

Some versions of the XSLT stylesheets don't handle the missing slash
correctly (they concatenate directory and file name without the slash).
This might never have worked correctly.

11 years agoFix WaitLatch() to return promptly when the requested timeout expires.
Tom Lane [Fri, 9 Nov 2012 01:04:54 +0000 (20:04 -0500)]
Fix WaitLatch() to return promptly when the requested timeout expires.

If the sleep is interrupted by a signal, we must recompute the remaining
time to wait; otherwise, a steady stream of non-wait-terminating interrupts
could delay return from WaitLatch indefinitely.  This has been shown to be
a problem for the autovacuum launcher, and there may well be other places
now or in the future with similar issues.  So we'd better make the function
robust, even though this'll add at least one gettimeofday call per wait.

Back-patch to 9.2.  We might eventually need to fix 9.1 as well, but the
code is quite different there, and the usage of WaitLatch in 9.1 is so
limited that it's not clearly important to do so.

Reported and diagnosed by Jeff Janes, though I rewrote his patch rather
heavily.

11 years agoDon't trash input list structure in does_not_exist_skipping().
Tom Lane [Thu, 8 Nov 2012 16:34:37 +0000 (11:34 -0500)]
Don't trash input list structure in does_not_exist_skipping().

The trigger and rule cases need to split up the input name list, but
they mustn't corrupt the passed-in data structure, since it could be part
of a cached utility-statement parsetree.  Per bug #7641.

11 years agoDon't try to use a unopened relation
Alvaro Herrera [Wed, 7 Nov 2012 19:23:39 +0000 (16:23 -0300)]
Don't try to use a unopened relation

Commit 4c9d0901 mistakenly introduced a call to
TransferPredicateLocksToHeapRelation() on an index relation that had
been closed a few lines above.  Moving up an index_open() call that's
below is enough to fix the problem.

Discovered by me while testing an unrelated patch.

11 years agoIn pg_upgrade docs, mention using base backup as part of rsync for
Bruce Momjian [Wed, 7 Nov 2012 18:36:08 +0000 (13:36 -0500)]
In pg_upgrade docs, mention using base backup as part of rsync for
logical replication upgrades.

Backpatch to 9.2.

11 years agoIn pg_upgrade, set synchronous_commit=off for the new cluster, to
Bruce Momjian [Tue, 6 Nov 2012 19:28:48 +0000 (14:28 -0500)]
In pg_upgrade, set synchronous_commit=off for the new cluster, to
improve performance when restoring the schema from the old cluster.

Backpatch to 9.2.

11 years agoFix handling of inherited check constraints in ALTER COLUMN TYPE.
Tom Lane [Mon, 5 Nov 2012 18:36:21 +0000 (13:36 -0500)]
Fix handling of inherited check constraints in ALTER COLUMN TYPE.

This case got broken in 8.4 by the addition of an error check that
complains if ALTER TABLE ONLY is used on a table that has children.
We do use ONLY for this situation, but it's okay because the necessary
recursion occurs at a higher level.  So we need to have a separate
flag to suppress recursion without making the error check.

Reported and patched by Pavan Deolasee, with some editorial adjustments by
me.  Back-patch to 8.4, since this is a regression of functionality that
worked in earlier branches.

11 years agoFix bogus handling of $(X) (i.e., ".exe") in isolationtester Makefile.
Tom Lane [Thu, 1 Nov 2012 23:48:58 +0000 (19:48 -0400)]
Fix bogus handling of $(X) (i.e., ".exe") in isolationtester Makefile.

I'm not sure why commit 1eb1dde049ccfffc42c80c2bcec14155c58bcc1f seems
to have made this start to fail on Cygwin when it never did before ---
but nonetheless, the coding was pretty bogus, and unlike the way we
handle $(X) anywhere else.  Per buildfarm.

11 years agoLimit the number of rel sets considered in consider_index_join_outer_rels.
Tom Lane [Thu, 1 Nov 2012 18:08:48 +0000 (14:08 -0400)]
Limit the number of rel sets considered in consider_index_join_outer_rels.

In bug #7626, Brian Dunavant exposes a performance problem created by
commit 3b8968f25232ad09001bf35ab4cc59f5a501193e: that commit attempted to
consider *all* possible combinations of indexable join clauses, but if said
clauses join to enough different relations, there's an exponential increase
in the number of outer-relation sets considered.

In Brian's example, all the clauses come from the same equivalence class,
which means it's redundant to use more than one of them in an indexscan
anyway.  So we can prevent the problem in this class of cases (which is
probably the majority of real examples) by rejecting combinations that
would only serve to add a known-redundant clause.

But that still leaves us exposed to exponential growth of planning time
when the query has a lot of non-equivalence join clauses that are usable
with the same index.  I chose to prevent such cases by setting an upper
limit on the number of relation sets considered, equal to ten times the
number of index clauses considered so far.  (This sliding limit still
allows new relsets to be added on as we move to additional index columns,
which is probably more important than considering even more combinations of
clauses for the previous column.)  This should keep the amount of work done
roughly linear rather than exponential in the apparent query complexity.
This part of the fix is pretty ad-hoc; but without a clearer idea of
real-world cases for which this would result in markedly inferior plans,
it's hard to see how to do better.

11 years agoDocument that TCP keepalive settings read as 0 on Unix-socket connections.
Tom Lane [Wed, 31 Oct 2012 18:26:20 +0000 (14:26 -0400)]
Document that TCP keepalive settings read as 0 on Unix-socket connections.

Per bug #7631 from Rob Johnson.  The code is operating as designed, but the
docs didn't explain it.

11 years agoFix ALTER EXTENSION / SET SCHEMA
Alvaro Herrera [Wed, 31 Oct 2012 13:48:41 +0000 (10:48 -0300)]
Fix ALTER EXTENSION / SET SCHEMA

In its original conception, it was leaving some objects into the old
schema, but without their proper pg_depend entries; this meant that the
old schema could be dropped, causing future pg_dump calls to fail on the
affected database.  This was originally reported by Jeff Frost as #6704;
there have been other complaints elsewhere that can probably be traced
to this bug.

To fix, be more consistent about altering a table's subsidiary objects
along the table itself; this requires some restructuring in how tables
are relocated when altering an extension -- hence the new
AlterTableNamespaceInternal routine which encapsulates it for both the
ALTER TABLE and the ALTER EXTENSION cases.

There was another bug lurking here, which was unmasked after fixing the
previous one: certain objects would be reached twice via the dependency
graph, and the second attempt to move them would cause the entire
operation to fail.  Per discussion, it seems the best fix for this is to
do more careful tracking of objects already moved: we now maintain a
list of moved objects, to avoid attempting to do it twice for the same
object.

Authors: Alvaro Herrera, Dimitri Fontaine
Reviewed by Tom Lane

11 years agoPrefer actual constants to pseudo-constants in equivalence class machinery.
Tom Lane [Fri, 26 Oct 2012 18:19:39 +0000 (14:19 -0400)]
Prefer actual constants to pseudo-constants in equivalence class machinery.

generate_base_implied_equalities_const() should prefer plain Consts over
other em_is_const eclass members when choosing the "pivot" value that
all the other members will be equated to.  This makes it more likely that
the generated equalities will be useful in constraint-exclusion proofs.
Per report from Rushabh Lathia.

11 years agoIn pg_dump, dump SEQUENCE SET items in the data not pre-data section.
Tom Lane [Fri, 26 Oct 2012 16:12:48 +0000 (12:12 -0400)]
In pg_dump, dump SEQUENCE SET items in the data not pre-data section.

Represent a sequence's current value as a separate TableDataInfo dumpable
object, so that it can be dumped within the data section of the archive
rather than in pre-data.  This fixes an undesirable inconsistency between
the meanings of "--data-only" and "--section=data", and also fixes dumping
of sequences that are marked as extension configuration tables, as per a
report from Marko Kreen back in July.  The main cost is that we do one more
SQL query per sequence, but that's probably not very meaningful in most
databases.

Back-patch to 9.1, since it has the extension configuration issue even
though not the --section switch.

11 years agoPrevent parser from believing that views have system columns.
Tom Lane [Wed, 24 Oct 2012 18:53:49 +0000 (14:53 -0400)]
Prevent parser from believing that views have system columns.

Views should not have any pg_attribute entries for system columns.
However, we forgot to remove such entries when converting a table to a
view.  This could lead to crashes later on, if someone attempted to
reference such a column, as reported by Kohei KaiGai.

This problem is corrected properly in HEAD (by removing the pg_attribute
entries during conversion), but in the back branches we need to defend
against existing mis-converted views.  This fix costs us an extra syscache
lookup per system column reference, which is annoying but probably not
really measurable in the big scheme of things.

12 years agoCorrect predicate locking for DROP INDEX CONCURRENTLY.
Kevin Grittner [Sun, 21 Oct 2012 22:26:32 +0000 (17:26 -0500)]
Correct predicate locking for DROP INDEX CONCURRENTLY.

For the non-concurrent case there is an AccessExclusiveLock lock
on both the index and the heap at a time during which no other
process is using either, before which the index is maintained and
used for scans, and after which the index is no longer used or
maintained.  Predicate locks can safely be moved from the index to
the related heap relation under the protection of these locks.
This was done prior to the introductin of DROP INDEX CONCURRENTLY
and continues to be done for non-concurrent index drops.

For concurrent index drops, the predicate locks must be moved when
there are no index scans in progress on that index and no more can
subsequently start, and before heap inserts stop maintaining the
index.  As long as these conditions are guaranteed when the
TransferPredicateLocksToHeapRelation() function is called,
stronger locks are not needed for correctness.

Kevin Grittner based on questions by Tom Lane in reviewing the
DROP INDEX CONCURRENTLY patch and in cooperation with Andres
Freund and Simon Riggs.

Back-patch of commit 4c9d0901f135d724a9f3cfa4140a5afd44b10f08

12 years agoFix pg_dump's handling of DROP DATABASE commands in --clean mode.
Tom Lane [Sat, 20 Oct 2012 20:58:32 +0000 (16:58 -0400)]
Fix pg_dump's handling of DROP DATABASE commands in --clean mode.

In commit 4317e0246c645f60c39e6572644cff1cb03b4c65, I accidentally broke
this behavior while rearranging code to ensure that --create wouldn't
affect whether a DATABASE entry gets put into archive-format output.
Thus, 9.2 would issue a DROP DATABASE command in --clean mode, which is
either useless or dangerous depending on the usage scenario.
It should not do that, and no longer does.

A bright spot is that this refactoring makes it easy to allow the
combination of --clean and --create to work sensibly, ie, emit DROP
DATABASE then CREATE DATABASE before reconnecting.  Ordinarily we'd
consider that a feature addition and not back-patch it, but it seems
silly to not include the extra couple of lines required in the 9.2
version of the code.

Per report from Guillaume Lelarge, though this is slightly more extensive
than his proposed patch.

12 years agoFix UtilityContainsQuery() to handle CREATE TABLE AS EXECUTE correctly.
Tom Lane [Fri, 19 Oct 2012 22:33:53 +0000 (18:33 -0400)]
Fix UtilityContainsQuery() to handle CREATE TABLE AS EXECUTE correctly.

The code seems to have been written to handle the pre-parse-analysis
representation, where an ExecuteStmt would appear directly under
CreateTableAsStmt.  But in reality the function is only run on
already-parse-analyzed statements, so there will be a Query node in
between.  We'd not noticed the bug because the function is generally
not used at all except in extended query protocol.

Per report from Robert Haas and Rushabh Lathia.

12 years agoFix hash_search to avoid corruption of the hash table on out-of-memory.
Tom Lane [Fri, 19 Oct 2012 19:24:10 +0000 (15:24 -0400)]
Fix hash_search to avoid corruption of the hash table on out-of-memory.

An out-of-memory error during expand_table() on a palloc-based hash table
would leave a partially-initialized entry in the table.  This would not be
harmful for transient hash tables, since they'd get thrown away anyway at
transaction abort.  But for long-lived hash tables, such as the relcache
hash, this would effectively corrupt the table, leading to crash or other
misbehavior later.

To fix, rearrange the order of operations so that table enlargement is
attempted before we insert a new entry, rather than after adding it
to the hash table.

Problem discovered by Hitoshi Harada, though this is a bit different
from his proposed patch.

12 years agoFix ruleutils to print "INSERT INTO foo DEFAULT VALUES" correctly.
Tom Lane [Fri, 19 Oct 2012 17:39:57 +0000 (13:39 -0400)]
Fix ruleutils to print "INSERT INTO foo DEFAULT VALUES" correctly.

Per bug #7615 from Marko Tiikkaja.  Apparently nobody ever tried this
case before ...

12 years agoFix orphan on cancel of drop index concurrently.
Simon Riggs [Fri, 19 Oct 2012 08:57:32 +0000 (09:57 +0100)]
Fix orphan on cancel of drop index concurrently.
Canceling DROP INDEX CONCURRENTLY during
wait could allow an orphaned index to be
left behind which could not be dropped.

Backpatch to 9.2

Andres Freund, tested by Abhijit Menon-Sen

12 years agoUse a more portable platform test.
Andrew Dunstan [Thu, 18 Oct 2012 20:15:49 +0000 (16:15 -0400)]
Use a more portable platform test.

12 years agoFurther tweaking of the readfile() function in pg_ctl.
Heikki Linnakangas [Thu, 18 Oct 2012 19:26:26 +0000 (22:26 +0300)]
Further tweaking of the readfile() function in pg_ctl.

Don't leak a file descriptor if the file is empty or we can't read its size.

Expect there to be a newline at the end of the last line, too. If there
isn't, ignore anything after the last newline. This makes it a tiny bit
more robust in case the file is appended to concurrently, so that we don't
return the last line if it hasn't been fully written yet. And this makes
the code a bit less obscure, anyway. Per Tom Lane's suggestion.

Backpatch to all supported branches.

12 years agoIsolation test for DROP INDEX CONCURRENTLY
Simon Riggs [Thu, 18 Oct 2012 18:44:13 +0000 (19:44 +0100)]
Isolation test for DROP INDEX CONCURRENTLY
for recent concurrent changes.

Abhijit Menon-Sen

12 years agoRe-think guts of DROP INDEX CONCURRENTLY.
Simon Riggs [Thu, 18 Oct 2012 18:05:14 +0000 (19:05 +0100)]
Re-think guts of DROP INDEX CONCURRENTLY.
Concurrent behaviour was flawed when using
a two-step process, so add an additional
phase of processing to ensure concurrency
for both SELECTs and INSERT/UPDATE/DELETEs.

Backpatch to 9.2

Andres Freund, tweaked by me

12 years agoFix planning of non-strict equivalence clauses above outer joins.
Tom Lane [Thu, 18 Oct 2012 16:28:54 +0000 (12:28 -0400)]
Fix planning of non-strict equivalence clauses above outer joins.

If a potential equivalence clause references a variable from the nullable
side of an outer join, the planner needs to take care that derived clauses
are not pushed to below the outer join; else they may use the wrong value
for the variable.  (The problem arises only with non-strict clauses, since
if an upper clause can be proven strict then the outer join will get
simplified to a plain join.)  The planner attempted to prevent this type
of error by checking that potential equivalence clauses aren't
outerjoin-delayed as a whole, but actually we have to check each side
separately, since the two sides of the clause will get moved around
separately if it's treated as an equivalence.  Bugs of this type can be
demonstrated as far back as 7.4, even though releases before 8.3 had only
a very ad-hoc notion of equivalence clauses.

In addition, we neglected to account for the possibility that such clauses
might have nonempty nullable_relids even when not outerjoin-delayed; so the
equivalence-class machinery lacked logic to compute correct nullable_relids
values for clauses it constructs.  This oversight was harmless before 9.2
because we were only using RestrictInfo.nullable_relids for OR clauses;
but as of 9.2 it could result in pushing constructed equivalence clauses
to incorrect places.  (This accounts for bug #7604 from Bill MacArthur.)

Fix the first problem by adding a new test check_equivalence_delay() in
distribute_qual_to_rels, and fix the second one by adding code in
equivclass.c and called functions to set correct nullable_relids for
generated clauses.  Although I believe the second part of this is not
currently necessary before 9.2, I chose to back-patch it anyway, partly to
keep the logic similar across branches and partly because it seems possible
we might find other reasons why we need valid values of nullable_relids in
the older branches.

Add regression tests illustrating these problems.  In 9.0 and up, also
add test cases checking that we can push constants through outer joins,
since we've broken that optimization before and I nearly broke it again
with an overly simplistic patch for this problem.

12 years agoRevert tests for drop index concurrently.
Simon Riggs [Thu, 18 Oct 2012 14:26:02 +0000 (15:26 +0100)]
Revert tests for drop index concurrently.

12 years agoAdd isolation tests for DROP INDEX CONCURRENTLY.
Simon Riggs [Thu, 18 Oct 2012 12:40:10 +0000 (13:40 +0100)]
Add isolation tests for DROP INDEX CONCURRENTLY.
Backpatch to 9.2 to ensure bugs are fixed.

Abhijit Menon-Sen

12 years agoClose un-owned SMgrRelations at transaction end.
Tom Lane [Wed, 17 Oct 2012 16:38:28 +0000 (12:38 -0400)]
Close un-owned SMgrRelations at transaction end.

If an SMgrRelation is not "owned" by a relcache entry, don't allow it to
live past transaction end.  This design allows the same SMgrRelation to be
used for blind writes of multiple blocks during a transaction, but ensures
that we don't hold onto such an SMgrRelation indefinitely.  Because an
SMgrRelation typically corresponds to open file descriptors at the fd.c
level, leaving it open when there's no corresponding relcache entry can
mean that we prevent the kernel from reclaiming deleted disk space.
(While CacheInvalidateSmgr messages usually fix that, there are cases
where they're not issued, such as DROP DATABASE.  We might want to add
some more sinval messaging for that, but I'd be inclined to keep this
type of logic anyway, since allowing VFDs to accumulate indefinitely
for blind-written relations doesn't seem like a good idea.)

This code replaces a previous attempt towards the same goal that proved
to be unreliable.  Back-patch to 9.1 where the previous patch was added.

12 years agoRevert "Use "transient" files for blind writes, take 2".
Tom Lane [Wed, 17 Oct 2012 16:37:15 +0000 (12:37 -0400)]
Revert "Use "transient" files for blind writes, take 2".

This reverts commit fba105b1099f4f5fa7283bb17cba6fed2baa8d0c.
That approach had problems with the smgr-level state not tracking what
we really want to happen, and with the VFD-level state not tracking the
smgr-level state very well either.  In consequence, it was still possible
to hold kernel file descriptors open for long-gone tables (as in recent
report from Tore Halset), and yet there were also cases of FDs being closed
undesirably soon.  A replacement implementation will follow.

12 years agoFix typo in previous commit
Simon Riggs [Wed, 17 Oct 2012 08:19:24 +0000 (09:19 +0100)]
Fix typo in previous commit

12 years agoClarify hash index caution and copy to CREATE INDEX docs
Simon Riggs [Wed, 17 Oct 2012 07:23:05 +0000 (08:23 +0100)]
Clarify hash index caution and copy to CREATE INDEX docs

12 years agoFix race condition in pg_ctl reading postmaster.pid.
Heikki Linnakangas [Sat, 13 Oct 2012 09:48:14 +0000 (12:48 +0300)]
Fix race condition in pg_ctl reading postmaster.pid.

If postmaster changed postmaster.pid while pg_ctl was reading it, pg_ctl
could overrun the buffer it allocated for the file. Fix by reading the
whole file to memory with one read() call.

initdb contains an identical copy of the readfile() function, but the files
that initdb reads are static, not modified concurrently. Nevertheless, add
a simple bounds-check there, if only to silence static analysis tools.

Per report from Dave Vitek. Backpatch to all supported branches.

12 years agoSplit up process latch initialization for more-fail-soft behavior.
Tom Lane [Mon, 15 Oct 2012 03:00:01 +0000 (23:00 -0400)]
Split up process latch initialization for more-fail-soft behavior.

In the previous coding, new backend processes would attempt to create their
self-pipe during the OwnLatch call in InitProcess.  However, pipe creation
could fail if the kernel is short of resources; and the system does not
recover gracefully from a FATAL error right there, since we have armed the
dead-man switch for this process and not yet set up the on_shmem_exit
callback that would disarm it.  The postmaster then forces an unnecessary
database-wide crash and restart, as reported by Sean Chittenden.

There are various ways we could rearrange the code to fix this, but the
simplest and sanest seems to be to split out creation of the self-pipe into
a new function InitializeLatchSupport, which must be called from a place
where failure is allowed.  For most processes that gets called in
InitProcess or InitAuxiliaryProcess, but processes that don't call either
but still use latches need their own calls.

Back-patch to 9.1, which has only a part of the latch logic that 9.2 and
HEAD have, but nonetheless includes this bug.

12 years agoMake equal() ignore CoercionForm fields for better planning with casts.
Tom Lane [Fri, 12 Oct 2012 16:10:55 +0000 (12:10 -0400)]
Make equal() ignore CoercionForm fields for better planning with casts.

This change ensures that the planner will see implicit and explicit casts
as equivalent for all purposes, except in the minority of cases where
there's actually a semantic difference (as reflected by having a 3-argument
cast function).  In particular, this fixes cases where the EquivalenceClass
machinery failed to consider two references to a varchar column as
equivalent if one was implicitly cast to text but the other was explicitly
cast to text, as seen in bug #7598 from Vaclav Juza.  We have had similar
bugs before in other parts of the planner, so I think it's time to fix this
problem at the core instead of continuing to band-aid around it.

Remove set_coercionform_dontcare(), which represents the band-aid
previously in use for allowing matching of index and constraint expressions
with inconsistent cast labeling.  (We can probably get rid of
COERCE_DONTCARE altogether, but I don't think removing that enum value in
back branches would be wise; it's possible there's third party code
referring to it.)

Back-patch to 9.2.  We could go back further, and might want to once this
has been tested more; but for the moment I won't risk destabilizing plan
choices in long-since-stable branches.

12 years agoFix cross-type case in partial row matching for hashed subplans.
Tom Lane [Thu, 11 Oct 2012 16:21:02 +0000 (12:21 -0400)]
Fix cross-type case in partial row matching for hashed subplans.

When hashing a subplan like "WHERE (a, b) NOT IN (SELECT x, y FROM ...)",
findPartialMatch() attempted to match rows using the hashtable's internal
equality operators, which of course are for x and y's datatypes.  What we
need to use are the potentially cross-type operators for a=x, b=y, etc.
Failure to do that leads to wrong answers or even crashes.  The scope for
problems is limited to cases where we have different types with compatible
hash functions (else we'd not be using a hashed subplan), but for example
int4 vs int8 can cause the problem.

Per bug #7597 from Bo Jensen.  This has been wrong since the hashed-subplan
code was written, so patch all the way back.

12 years agoUpdate obsolete text in fdwhandler.sgml.
Tom Lane [Wed, 10 Oct 2012 17:54:43 +0000 (13:54 -0400)]
Update obsolete text in fdwhandler.sgml.

Etsuro Fujita, with some wording adjustment by me.

12 years agoIn pg_upgrade, issue proper error message when we can't open PG_VERSION.
Bruce Momjian [Wed, 10 Oct 2012 17:53:26 +0000 (13:53 -0400)]
In pg_upgrade, issue proper error message when we can't open PG_VERSION.

Backpatch to 9.2.

12 years agoFix PGXS support for building loadable modules on AIX.
Tom Lane [Wed, 10 Oct 2012 01:04:11 +0000 (21:04 -0400)]
Fix PGXS support for building loadable modules on AIX.

Building a shlib on AIX requires use of the mkldexport.sh script, but we
failed to install that, preventing its use from non-source-tree contexts.
Also, Makefile.aix had the wrong idea about where to find the installed
copy of the postgres.imp symbol file used by AIX.

Per report from John Pierce.  Patch all the way back, since this has been
broken since the beginning of PGXS.

12 years agoFix lo_import and lo_export to return useful error messages more often.
Tom Lane [Tue, 9 Oct 2012 01:52:42 +0000 (21:52 -0400)]
Fix lo_import and lo_export to return useful error messages more often.

I found that these functions tend to return -1 while leaving an empty error
message string in the PGconn, if they suffer some kind of I/O error on the
file.  The reason is that lo_close, which thinks it's executed a perfectly
fine SQL command, clears the errorMessage.  The minimum-change workaround
is to reorder operations here so that we don't fill the errorMessage until
after lo_close.

12 years agoFix lo_export usage in example programs.
Tom Lane [Tue, 9 Oct 2012 01:18:51 +0000 (21:18 -0400)]
Fix lo_export usage in example programs.

lo_export returns -1, not zero, on failure.

12 years agoSay ANALYZE, not VACUUM, in error message on analyze in hot standby.
Heikki Linnakangas [Mon, 8 Oct 2012 11:17:27 +0000 (14:17 +0300)]
Say ANALYZE, not VACUUM, in error message on analyze in hot standby.

Tomonaru Katsumata

12 years agoRemoved sentence about not being able to retrieve more than one row at a time,
Michael Meskes [Fri, 5 Oct 2012 14:49:27 +0000 (16:49 +0200)]
Removed sentence about not being able to retrieve more than one row at a time,
because it is not correct.

12 years agoFixed test for array boundary.
Michael Meskes [Fri, 5 Oct 2012 14:37:45 +0000 (16:37 +0200)]
Fixed test for array boundary.

Instead of continuing if the next character is not an array boundary get_data()
used to continue only on finding a boundary so it was not able to read any
element after the first.

12 years agoFix permissions explanations in CREATE DATABASE and CREATE SCHEMA docs.
Tom Lane [Thu, 4 Oct 2012 17:41:05 +0000 (13:41 -0400)]
Fix permissions explanations in CREATE DATABASE and CREATE SCHEMA docs.

These reference pages still claimed that you have to be superuser to create
a database or schema owned by a different role.  That was true before 8.1,
but it was changed in commits aa1110624c08298393dfce996f7b21809d98d3fd and
f91370cd2faf1fd35a1ac74d84652a85ed841919 to allow assignment of ownership
to any role you are a member of.  However, at the time we were thinking of
that primarily as a change to the ALTER OWNER rules, so the need to touch
these two CREATE ref pages got missed.

12 years agoFix typo in comment, and reword it slightly while we're at it.
Heikki Linnakangas [Thu, 4 Oct 2012 07:34:40 +0000 (10:34 +0300)]
Fix typo in comment, and reword it slightly while we're at it.

12 years agoAvoid planner crash/Assert failure with joins to unflattened subqueries.
Tom Lane [Wed, 3 Oct 2012 17:37:53 +0000 (13:37 -0400)]
Avoid planner crash/Assert failure with joins to unflattened subqueries.

examine_simple_variable supposed that any RTE_SUBQUERY rel it gets pointed
at must have been planned already.  However, this isn't a safe assumption
because we must do selectivity estimation while generating indexscan paths,
and that code might look at join clauses involving a rel that the loop in
set_base_rel_sizes() hasn't reached yet.  The simplest fix is to play dumb
in such a situation, that is give up trying to extract any stats for the
Var.  This could possibly be improved by making a separate pass over the
RTE list to plan each unflattened subquery before we start the main
planning work --- but that would be pretty invasive and it doesn't seem
worth it, for now at least.  (We couldn't just break set_base_rel_sizes()
into two loops: the prescan would need to handle all subquery rels in the
query, not only those in the current join subproblem.)

This bug was introduced in commit 1cb108efb0e60d87e4adec38e7636b6e8efbeb57,
although I think that subsequent changes may have exposed it more than it
was originally.  Per bug #7580 from Maxim Boguk.

12 years agoREASSIGN OWNED: consider grants on tablespaces, too
Alvaro Herrera [Wed, 3 Oct 2012 15:22:41 +0000 (12:22 -0300)]
REASSIGN OWNED: consider grants on tablespaces, too

Apparently this was considered in the original code (see commit
cec3b0a9) but I failed to notice that such entries would always be
skipped by the database check at the start of the loop.

Per bugs #7578 by Nikolay, #6116 by tushar.qa@gmail.com.

12 years agoIn pg_upgrade, use full path name for analyze_new_cluster.sh script.
Bruce Momjian [Wed, 3 Oct 2012 01:18:43 +0000 (21:18 -0400)]
In pg_upgrade, use full path name for analyze_new_cluster.sh script.

Backpatch to 9.2.

12 years agoWork around unportable behavior of malloc(0) and realloc(NULL, 0).
Tom Lane [Tue, 2 Oct 2012 21:31:49 +0000 (17:31 -0400)]
Work around unportable behavior of malloc(0) and realloc(NULL, 0).

On some platforms these functions return NULL, rather than the more common
practice of returning a pointer to a zero-sized block of memory.  Hack our
various wrapper functions to hide the difference by substituting a size
request of 1.  This is probably not so important for the callers, who
should never touch the block anyway if they asked for size 0 --- but it's
important for the wrapper functions themselves, which mistakenly treated
the NULL result as an out-of-memory failure.  This broke at least pg_dump
for the case of no user-defined aggregates, as per report from
Matthew Carrington.

Back-patch to 9.2 to fix the pg_dump issue.  Given the lack of previous
complaints, it seems likely that there is no live bug in previous releases,
even though some of these functions were in place before that.

12 years agoFix typo in previous warning-silencing patch.
Heikki Linnakangas [Tue, 2 Oct 2012 16:59:00 +0000 (19:59 +0300)]
Fix typo in previous warning-silencing patch.

Fujii Masao

12 years agoIn pg_upgrade, improve error reporting when the number of relation
Bruce Momjian [Tue, 2 Oct 2012 15:53:45 +0000 (11:53 -0400)]
In pg_upgrade, improve error reporting when the number of relation
objects does not match between the old and new clusters.

Backpatch to 9.2.

12 years agoAdjust pg_upgrade query so toast tables related to system catalog schema
Bruce Momjian [Tue, 2 Oct 2012 15:46:08 +0000 (11:46 -0400)]
Adjust pg_upgrade query so toast tables related to system catalog schema
entries are not dumped.   This fixes an error caused by
droping/recreating the information_schema, but other failures were also
possible.

Backpatch to 9.2.

12 years agoIn pg_upgrade, try to convert the locale names to canonical form before
Bruce Momjian [Tue, 2 Oct 2012 15:42:34 +0000 (11:42 -0400)]
In pg_upgrade, try to convert the locale names to canonical form before
comparison;  also report the old/new values if they don't match.

Backpatch to 9.2.

12 years agoSilence compiler warning about pointer type mismatch on some platforms.
Heikki Linnakangas [Tue, 2 Oct 2012 14:37:41 +0000 (17:37 +0300)]
Silence compiler warning about pointer type mismatch on some platforms.

timeval.t_sec is of type time_t, which is not always compatible with long.
I'm not sure if this was just harmless warning or a real bug, but this
fixes it, anyway.

12 years agoAllow a few seconds for Windows to catch up with a directory rename when checking...
Andrew Dunstan [Tue, 2 Oct 2012 14:42:42 +0000 (10:42 -0400)]
Allow a few seconds for Windows to catch up with a directory rename when checking pg_upgrade.

12 years agoFix access past end of string in date parsing.
Heikki Linnakangas [Tue, 2 Oct 2012 07:43:48 +0000 (10:43 +0300)]
Fix access past end of string in date parsing.

This affects date_in(), and a couple of other funcions that use DecodeDate().

Hitoshi Harada

12 years agoFix bugs in "restore.sql" script emitted in pg_dump tar output.
Tom Lane [Sat, 29 Sep 2012 21:56:45 +0000 (17:56 -0400)]
Fix bugs in "restore.sql" script emitted in pg_dump tar output.

The tar output module did some very ugly and ultimately incorrect hacking
on COPY commands to try to get them to work in the context of restoring a
deconstructed tar archive.  In particular, it would fail altogether for
table names containing any upper-case characters, since it smashed the
command string to lower-case before modifying it (and, just to add insult
to injury, did that in a way that would fail in multibyte encodings).
I don't see any particular value in being flexible about the case of the
command keywords, since the string will just have been created by
dumpTableData, so let's get rid of the whole case-folding thing.

Also, it doesn't seem to meet the POLA for the script to restore data only
in COPY mode, so add \i commands to make it have comparable behavior in
--inserts mode.

Noted while looking at the tar-output code in connection with Brian
Weaver's patch.

12 years agoFix tar files emitted by pg_basebackup to be POSIX conformant.
Tom Lane [Fri, 28 Sep 2012 19:35:46 +0000 (15:35 -0400)]
Fix tar files emitted by pg_basebackup to be POSIX conformant.

Back-patch portions of commit 05b555d12bc2ad0d581f48a12b45174db41dc10d.
There doesn't seem to be any reason not to fix pg_basebackup fully, but
we can't change pg_dump's "magic" string without breaking older versions
of pg_restore.  Instead, just patch pg_restore to accept either version
of the magic string, in hopes of avoiding compatibility problems when
9.3 comes out.  I also fixed pg_dump to write the correct 2-block EOF
marker, since that won't create a compatibility problem with pg_restore
and it could help with some versions of tar.

Brian Weaver and Tom Lane

12 years agoFix btmarkpos/btrestrpos to handle array keys.
Tom Lane [Thu, 27 Sep 2012 21:00:05 +0000 (17:00 -0400)]
Fix btmarkpos/btrestrpos to handle array keys.

This fixes another error in commit 9e8da0f75731aaa7605cf4656c21ea09e84d2eb1.
I neglected to make the mark/restore functionality save and restore the
current set of array key values, which led to strange behavior if an
IndexScan with ScalarArrayOpExpr quals was used as the inner side of a
mergejoin.  Per bug #7570 from Melese Tesfaye.

12 years agoHave pg_terminate/cancel_backend not ERROR on non-existent processes
Alvaro Herrera [Thu, 27 Sep 2012 15:15:03 +0000 (12:15 -0300)]
Have pg_terminate/cancel_backend not ERROR on non-existent processes

This worked fine for superusers, but not for ordinary users trying to
cancel their own processes.  Tweak the order the checks are done in so
that we correctly return SIGNAL_BACKEND_ERROR (which current callers
know to ignore without erroring out) so that an ordinary user can loop
through a resultset without fearing that a process might exit in the
middle of said looping -- causing the remaining processes to go
unsignalled.

Incidentally, the last in-core caller of IsBackendPid() is now gone.
However, the function is exported and must remain in place, because
there are plenty of callers in external modules.

Author: Josh Kupershmidt

Reviewed by Noah Misch

12 years agoFix examples of how to use "su" while starting the server.
Tom Lane [Tue, 25 Sep 2012 17:52:57 +0000 (13:52 -0400)]
Fix examples of how to use "su" while starting the server.

The syntax "su -c 'command' username" is not accepted by all versions of
su, for example not OpenBSD's.  More portable is "su username -c
'command'".  So change runtime.sgml to recommend that syntax.  Also,
add a -D switch to the OpenBSD example script, for consistency with other
examples.  Per Denis Lapshin and Gábor Hidvégi.

12 years agoPrevent emitting "ALTER VIEW foo SET ()".
Tom Lane [Mon, 24 Sep 2012 04:18:17 +0000 (00:18 -0400)]
Prevent emitting "ALTER VIEW foo SET ()".

Small oversight in commit 0f524ea0cf388a149f362e48a33c01662eeddc04 ...
per report from Grazvydas Valeika.

12 years agoStamp 9.2.1. REL9_2_1
Tom Lane [Wed, 19 Sep 2012 21:47:58 +0000 (17:47 -0400)]
Stamp 9.2.1.

12 years agoUpdate release notes for 9.2.1, 9.1.6, 9.0.10, 8.4.14, 8.3.21.
Tom Lane [Wed, 19 Sep 2012 21:38:47 +0000 (17:38 -0400)]
Update release notes for 9.2.1, 9.1.6, 9.0.10, 8.4.14, 8.3.21.

12 years agoPut back AcceptInvalidationMessages calls in heap_openrv(_extended).
Tom Lane [Wed, 19 Sep 2012 21:10:44 +0000 (17:10 -0400)]
Put back AcceptInvalidationMessages calls in heap_openrv(_extended).

These calls were removed in commit 4240e429d0c2d889d0cda23c618f94e12c13ade7
as part of a general refactoring and improvement of DDL locking.  However,
there's a problem not solved by the rewrite, which is that GRANT/REVOKE
update pg_class.relacl without taking any particular lock on the target
table as such.  If another backend fails to do AcceptInvalidationMessages,
it won't notice a recently-committed change in ACLs.  Bug #7557 from Piotr
Czachur demonstrates that there's at least one code path in 9.2.0 in which
a command fails to do any AcceptInvalidationMessages calls at all, if the
current transaction already holds all the locks it will need.

Since we're hard up against the release deadline for 9.2.1, fix this by
putting back the AcceptInvalidationMessages calls in heap_openrv and
heap_openrv_extended, thereby restoring the historical behavior in this
area.  We ought to look for a more elegant and perhaps more bulletproof
solution, but there's no time for that right now.

12 years agoUpdate time zone data files to tzdata release 2012f.
Tom Lane [Wed, 19 Sep 2012 14:44:45 +0000 (10:44 -0400)]
Update time zone data files to tzdata release 2012f.

DST law changes in Fiji.

12 years agoTranslation updates
Peter Eisentraut [Wed, 19 Sep 2012 04:03:00 +0000 (00:03 -0400)]
Translation updates

12 years agopg_upgrade: Remove check for pg_config
Peter Eisentraut [Wed, 19 Sep 2012 01:53:34 +0000 (21:53 -0400)]
pg_upgrade: Remove check for pg_config

It is no longer used, but was still being checked for.

bug #7548 from Reinhard Max

12 years agoFix planning of btree index scans using ScalarArrayOpExpr quals.
Tom Lane [Tue, 18 Sep 2012 16:20:43 +0000 (12:20 -0400)]
Fix planning of btree index scans using ScalarArrayOpExpr quals.

In commit 9e8da0f75731aaa7605cf4656c21ea09e84d2eb1, I improved btree
to handle ScalarArrayOpExpr quals natively, so that constructs like
"indexedcol IN (list)" could be supported by index-only scans.  Using
such a qual results in multiple scans of the index, under-the-hood.
I went to some lengths to ensure that this still produces rows in index
order ... but I failed to recognize that if a higher-order index column
is lacking an equality constraint, rescans can produce out-of-order
data from that column.  Tweak the planner to not expect sorted output
in that case.  Per trouble report from Robert McGehee.

12 years agoFix array_typanalyze to work for domains over arrays.
Tom Lane [Tue, 18 Sep 2012 04:31:45 +0000 (00:31 -0400)]
Fix array_typanalyze to work for domains over arrays.

Not sure how we missed this case, but we did.  Per bug #7551 from
Diego de Lima.

12 years agoProvide adequate documentation of the "table_name *" notation.
Tom Lane [Mon, 17 Sep 2012 18:59:35 +0000 (14:59 -0400)]
Provide adequate documentation of the "table_name *" notation.

Somewhere along the line, somebody decided to remove all trace of this
notation from the documentation text.  It was still in the command syntax
synopses, or at least some of them, but with no indication what it meant.
This will not do, as evidenced by the confusion apparent in bug #7543;
even if the notation is now unnecessary, people will find it in legacy
SQL code and need to know what it does.

12 years agoRethink heuristics for choosing index quals for parameterized paths.
Tom Lane [Sun, 16 Sep 2012 21:57:26 +0000 (17:57 -0400)]
Rethink heuristics for choosing index quals for parameterized paths.

Some experimentation with examples similar to bug #7539 has convinced me
that indxpath.c's original implementation of parameterized-path generation
was several bricks shy of a load.  In general, if we are relying on a
particular outer rel or set of outer rels for a parameterized path, the
path should use every indexable join clause that's available from that rel
or rels.  Any join clauses that get left out of the indexqual will end up
getting applied as plain filter quals (qpquals), and that's generally a
significant loser compared to having the index AM enforce them.  (This is
particularly true with btree, which can skip the index scan entirely if
it can see that the given indexquals are mutually contradictory.)  The
original heuristics failed to ensure this, though, and were overly
complicated anyway.  Rewrite to make the code explicitly identify each
useful set of outer rels and then select all applicable join clauses for
each one.  The one plan that changes in the regression tests is in fact
for the better according to the planner's cost estimates.

(Note: this is not a correctness issue but just a matter of plan quality.
I don't yet know what is going on in bug #7539, but I don't expect this
change to fix that.)

12 years agoFix bufmgr so CHECKPOINT_END_OF_RECOVERY behaves as a shutdown checkpoint.
Simon Riggs [Sun, 16 Sep 2012 18:54:34 +0000 (19:54 +0100)]
Fix bufmgr so CHECKPOINT_END_OF_RECOVERY behaves as a shutdown checkpoint.
Recovery code documents clearly that a shutdown checkpoint is executed at
end of recovery - a shutdown checkpoint WAL record is written but the buffer
manager had been altered to treat end of recovery as a normal checkpoint.
This bug exacerbates the bufmgr relpersistence bug.

Bug spotted by Andres Freund, patch by me.

12 years agoFix documentation reference to maximum allowed for autovacuum_freeze_max_age.
Kevin Grittner [Sun, 16 Sep 2012 17:19:37 +0000 (12:19 -0500)]
Fix documentation reference to maximum allowed for autovacuum_freeze_max_age.

The documentation mentioned setting autovacuum_freeze_max_age to
"its maximum allowed value of a little less than two billion".
This led to a post asking about the exact maximum allowed value,
which is precisely two billion, not "a little less".

Based on question by Radovan Jablonovsky.  Backpatch to 8.3.

12 years agoBack-patch fix and test case for bug #7516.
Tom Lane [Fri, 14 Sep 2012 15:50:02 +0000 (11:50 -0400)]
Back-patch fix and test case for bug #7516.

Back-patch commits 9afc6481117d2dd936e752da0424a2b6b05f6459 and
b8fbbcf37f22c5e8361da939ad0fc4be18a34ca9.  The first of these is really
a minor code cleanup to save a few cycles, but it turns out to provide
a workaround for the misoptimization problem described in bug #7516.
The second commit adds a regression test case.

Back-patch the fix to all active branches.  The test case only works
as far back as 9.0, because it relies on plpgsql which isn't installed
by default before that.  (I didn't have success modifying it into an
all-plperl form that still provoked a crash, though this may just reflect
my lack of Perl-fu.)

12 years agoProperly set relpersistence for fake relcache entries.
Robert Haas [Fri, 14 Sep 2012 13:35:07 +0000 (09:35 -0400)]
Properly set relpersistence for fake relcache entries.

This can result in buffers failing to be properly flushed at
checkpoint time, leading to data loss.

Report, diagnosis, and patch by Jeff Davis.

12 years agoFix case of window function + aggregate + GROUP BY expression.
Tom Lane [Thu, 13 Sep 2012 15:31:47 +0000 (11:31 -0400)]
Fix case of window function + aggregate + GROUP BY expression.

In commit 1bc16a946008a7cbb33a9a06a7c6765a807d7f59 I added a minor
optimization to drop the component variables of a GROUP BY expression from
the target list computed at the aggregation level of a query, if those Vars
weren't referenced elsewhere in the tlist.  However, I overlooked that the
window-function planning code would deconstruct such expressions and thus
need to have access to their component variables.  Fix it to not do that.

While at it, I removed the distinction between volatile and nonvolatile
window partition/order expressions: the code now computes all of them
at the aggregation level.  This saves a relatively expensive check for
volatility, and it's unclear that the resulting plan isn't better anyway.

Per bug #7535 from Louis-David Mitterrand.  Back-patch to 9.2.

12 years agoFix typo in comment for pclose_check() function.
Kevin Grittner [Thu, 13 Sep 2012 03:33:30 +0000 (22:33 -0500)]
Fix typo in comment for pclose_check() function.

Backpatch to 9.2.

Etsuro Fujit

12 years agoFix a couple other leftover uses of 'conisonly' terminology.
Tom Lane [Wed, 12 Sep 2012 19:12:24 +0000 (15:12 -0400)]
Fix a couple other leftover uses of 'conisonly' terminology.

12 years agoFix catalog docs to reflect connoinherit change in 09ff76f.
Andrew Dunstan [Wed, 12 Sep 2012 18:28:10 +0000 (14:28 -0400)]
Fix catalog docs to reflect connoinherit change in 09ff76f.

Backpatch to 9.2.

12 years agoFix typo: lexemes misspelled in full text search docs.
Kevin Grittner [Wed, 12 Sep 2012 12:39:07 +0000 (07:39 -0500)]
Fix typo: lexemes misspelled in full text search docs.

Dan Scott

Backpatch original commit 4bc0d2e2cfa8ac523524dccf6f849989c6739083
to 9.1

12 years agoFix logical errors in tsquery selectivity estimation for prefix queries.
Tom Lane [Wed, 12 Sep 2012 01:23:20 +0000 (21:23 -0400)]
Fix logical errors in tsquery selectivity estimation for prefix queries.

I made multiple errors in commit 97532f7c29468010b87e40a04f8daa3eb097f654,
stemming mostly from failure to think about the available frequency data
as being element frequencies not value frequencies (so that occurrences of
different elements are not mutually exclusive).  This led to sillinesses
such as estimating that "word" would match more rows than "word:*".

The choice to clamp to a minimum estimate of DEFAULT_TS_MATCH_SEL also
seems pretty ill-considered in hindsight, as it would frequently result in
an estimate much larger than the available data suggests.  We do need some
sort of clamp, since a pattern not matching any of the MCELEMs probably
still needs a selectivity estimate of more than zero.  I chose instead to
clamp to at least what a non-MCELEM word would be estimated as, preserving
the property that "word:*" doesn't get an estimate less than plain "word",
whether or not the word appears in MCELEM.

Per investigation of a gripe from Bill Martin, though I suspect that his
example case actually isn't even reaching the erroneous code.

Back-patch to 9.1 where this code was introduced.

12 years agoAdd vcregress.pl target for checking pg_upgrade.
Andrew Dunstan [Mon, 10 Sep 2012 16:51:24 +0000 (12:51 -0400)]
Add vcregress.pl target for checking pg_upgrade.

This follows recent addition of Windows/Mingw testing.
Backpatch to Release 9.2 so we can get some buildfarm testing
going.

12 years agoMake plperl safe against functions that are redefined while running.
Tom Lane [Mon, 10 Sep 2012 00:32:59 +0000 (20:32 -0400)]
Make plperl safe against functions that are redefined while running.

validate_plperl_function() supposed that it could free an old
plperl_proc_desc struct immediately upon detecting that it was stale.
However, if a plperl function is called recursively, this could result
in deleting the struct out from under an outer invocation, leading to
misbehavior or crashes.  Add a simple reference-count mechanism to
ensure that such structs are freed only when the last reference goes
away.

Per investigation of bug #7516 from Marko Tiikkaja.  I am not certain
that this error explains his report, because he says he didn't have
any recursive calls --- but it's hard to see how else it could have
crashed right there.  In any case, this definitely fixes some problems
in the area.

Back-patch to all active branches.

12 years agoUse .NOTPARALLEL in ecpg/Makefile to avoid a gmake parallelism bug.
Tom Lane [Sun, 9 Sep 2012 19:08:32 +0000 (15:08 -0400)]
Use .NOTPARALLEL in ecpg/Makefile to avoid a gmake parallelism bug.

Investigation shows that some intermittent build failures in ecpg are the
result of a gmake bug that was reported quite some time ago:
http://savannah.gnu.org/bugs/?30653

Preventing parallel builds of the ecpg subdirectories seems to dodge the
bug.  Per yesterday's pgsql-hackers discussion, there are some other things
in the subdirectory makefiles that seem rather unsafe for parallel builds
too, but there's little point in fixing them as long as we have to work
around a make bug.

Back-patch to 9.1; parallel builds weren't very well supported before
that anyway.

12 years agoAdjust PL/Python regression tests some more for Python 3.3.
Tom Lane [Sat, 8 Sep 2012 21:39:02 +0000 (17:39 -0400)]
Adjust PL/Python regression tests some more for Python 3.3.

Commit 2cfb1c6f77734db81b6e74bcae630f93b94f69be fixed some issues caused
by Python 3.3 choosing to iterate through dict entries in a different order
than before.  But here's another one: the test cases adjusted here made two
bad entries in a dict and expected the one complained of would always be
the same.

Possibly this should be back-patched further than 9.2, but there seems
little point unless the earlier fix is too.

12 years agoFix PARAM_EXEC assignment mechanism to be safe in the presence of WITH.
Tom Lane [Sat, 8 Sep 2012 00:38:28 +0000 (20:38 -0400)]
Fix PARAM_EXEC assignment mechanism to be safe in the presence of WITH.

The planner previously assumed that parameter Vars having the same absolute
query level, varno, and varattno could safely be assigned the same runtime
PARAM_EXEC slot, even though they might be different Vars appearing in
different subqueries.  This was (probably) safe before the introduction of
CTEs, but the lazy-evalution mechanism used for CTEs means that a CTE can
be executed during execution of some other subquery, causing the lifespan
of Params at the same syntactic nesting level as the CTE to overlap with
use of the same slots inside the CTE.  In 9.1 we created additional hazards
by using the same parameter-assignment technology for nestloop inner scan
parameters, but it was broken before that, as illustrated by the added
regression test.

To fix, restructure the planner's management of PlannerParamItems so that
items having different semantic lifespans are kept rigorously separated.
This will probably result in complex queries using more runtime PARAM_EXEC
slots than before, but the slots are cheap enough that this hardly matters.
Also, stop generating PlannerParamItems containing Params for subquery
outputs: all we really need to do is reserve the PARAM_EXEC slot number,
and that now only takes incrementing a counter.  The planning code is
simpler and probably faster than before, as well as being more correct.

Per report from Vik Reykja.

Back-patch of commit 46c508fbcf98ac334f1e831d21021d731c882fbb into all
branches that support WITH.

12 years agoStamp 9.2.0. REL9_2_0
Tom Lane [Thu, 6 Sep 2012 21:26:17 +0000 (17:26 -0400)]
Stamp 9.2.0.

12 years agoFix "too many arguments" messages not to index off the end of argv[].
Robert Haas [Thu, 6 Sep 2012 19:43:46 +0000 (15:43 -0400)]
Fix "too many arguments" messages not to index off the end of argv[].

This affects initdb, clusterdb, reindexdb, and vacuumdb in master
and 9.2; in earlier branches, only initdb is affected.

12 years agoTranslation updates
Peter Eisentraut [Thu, 6 Sep 2012 03:33:52 +0000 (23:33 -0400)]
Translation updates

12 years agoFix typo in information_schema documentation.
Tom Lane [Thu, 6 Sep 2012 03:37:45 +0000 (23:37 -0400)]
Fix typo in information_schema documentation.

Shigeru Hanada

12 years agoIn pg_upgrade, try a few times to open a log file.
Andrew Dunstan [Thu, 6 Sep 2012 03:13:14 +0000 (23:13 -0400)]
In pg_upgrade, try a few times to open a log file.

If we call pg_ctl stop, the server might continue and thus
hold a log file for a short time after it has deleted its pid file,
(which is when pg_ctl will exit), and so a subsequent attempt to
open the log file might fail.

We therefore try to open it a few times, sleeping one second between
tries, to give the server time to exit.

This corrects an error that was observed on the buildfarm.

Backpatched to 9.2,

12 years agoFix WAL file replacement during cascading replication on Windows.
Heikki Linnakangas [Thu, 6 Sep 2012 01:10:15 +0000 (18:10 -0700)]
Fix WAL file replacement during cascading replication on Windows.

When the startup process restores a WAL file from the archive, it deletes
any old file with the same name and renames the new file in its place. On
Windows, however, when a file is deleted, it still lingers as long as a
process holds a file handle open on it. With cascading replication, a
walsender process can hold the old file open, so the rename() in the startup
process would fail. To fix that, rename the old file to a temporary name, to
make the original file name available for reuse, before deleting the old
file.

12 years agoFix inappropriate error messages for Hot Standby misconfiguration errors.
Tom Lane [Thu, 6 Sep 2012 01:49:11 +0000 (21:49 -0400)]
Fix inappropriate error messages for Hot Standby misconfiguration errors.

Give the correct name of the GUC parameter being complained of.
Also, emit a more suitable SQLSTATE (INVALID_PARAMETER_VALUE,
not the default INTERNAL_ERROR).

Gurjeet Singh, errcode adjustment by me

12 years agoMake one last copy-editing pass over the 9.2 release notes.
Tom Lane [Thu, 6 Sep 2012 01:28:27 +0000 (21:28 -0400)]
Make one last copy-editing pass over the 9.2 release notes.

Also, set the release date to 2012-09-10, since we're pretty well
committed to that now.

12 years agoFix pg_upgrade test script's line end handling on Windows.
Andrew Dunstan [Wed, 5 Sep 2012 21:55:47 +0000 (17:55 -0400)]
Fix pg_upgrade test script's line end handling on Windows.

Call pg_dumpall using -f switch instead of redirection, to avoid
writing the output in text mode and generating spurious carriage
returns. Remove to carriage return ignoring hack introduced by
commit e442b0f0c6fd26738bafdeb5222511b586dfe4b9.

Backpatch to 9.2.

12 years agoFix line end mishandling in pg_upgrade on Windows.
Andrew Dunstan [Wed, 5 Sep 2012 21:48:06 +0000 (17:48 -0400)]
Fix line end mishandling in pg_upgrade on Windows.

pg_upgrade opened the output from pg_dumpall in text mode and
wrote the split files in text mode. This caused unwanted eating
of intended carriage returns on input and production of spurious
carriage returns on output. To avoid this, open all these files
in binary mode. On non-Windows platforms, this change has no
effect.

Backpatch to 9.0. On 9.0 and 9.1, we also switch from redirecting
pg_dumpall's output to using pg_dumpall's -f switch, for the same
reason.