]> granicus.if.org Git - postgresql/log
postgresql
12 years agoWhen converting a table to a view, remove its system columns.
Tom Lane [Wed, 24 Oct 2012 17:39:37 +0000 (13:39 -0400)]
When converting a table to a view, remove its system columns.

Views should not have any pg_attribute entries for system columns.
However, we forgot to remove such entries when converting a table to a
view.  This could lead to crashes later on, if someone attempted to
reference such a column, as reported by Kohei KaiGai.

Patch in HEAD only.  This bug has been there forever, but in the back
branches we will have to defend against existing mis-converted views,
so it doesn't seem worthwhile to change the conversion code too.

12 years agoAdd context info to OAT_POST_CREATE security hook
Alvaro Herrera [Tue, 23 Oct 2012 21:07:26 +0000 (18:07 -0300)]
Add context info to OAT_POST_CREATE security hook

... and have sepgsql use it to determine whether to check permissions
during certain operations.  Indexes that are being created as a result
of REINDEX, for instance, do not need to have their permissions checked;
they were already checked when the index was created.

Author: KaiGai Kohei, slightly revised by me

12 years agoCorrect predicate locking for DROP INDEX CONCURRENTLY.
Kevin Grittner [Sun, 21 Oct 2012 21:35:42 +0000 (16:35 -0500)]
Correct predicate locking for DROP INDEX CONCURRENTLY.

For the non-concurrent case there is an AccessExclusiveLock lock
on both the index and the heap at a time during which no other
process is using either, before which the index is maintained and
used for scans, and after which the index is no longer used or
maintained.  Predicate locks can safely be moved from the index to
the related heap relation under the protection of these locks.
This was done prior to the introductin of DROP INDEX CONCURRENTLY
and continues to be done for non-concurrent index drops.

For concurrent index drops, the predicate locks must be moved when
there are no index scans in progress on that index and no more can
subsequently start, and before heap inserts stop maintaining the
index.  As long as these conditions are guaranteed when the
TransferPredicateLocksToHeapRelation() function is called,
stronger locks are not needed for correctness.

Kevin Grittner based on questions by Tom Lane in reviewing the
DROP INDEX CONCURRENTLY patch and in cooperation with Andres
Freund and Simon Riggs.

12 years agoFix pg_dump's handling of DROP DATABASE commands in --clean mode.
Tom Lane [Sat, 20 Oct 2012 20:58:32 +0000 (16:58 -0400)]
Fix pg_dump's handling of DROP DATABASE commands in --clean mode.

In commit 4317e0246c645f60c39e6572644cff1cb03b4c65, I accidentally broke
this behavior while rearranging code to ensure that --create wouldn't
affect whether a DATABASE entry gets put into archive-format output.
Thus, 9.2 would issue a DROP DATABASE command in --clean mode, which is
either useless or dangerous depending on the usage scenario.
It should not do that, and no longer does.

A bright spot is that this refactoring makes it easy to allow the
combination of --clean and --create to work sensibly, ie, emit DROP
DATABASE then CREATE DATABASE before reconnecting.  Ordinarily we'd
consider that a feature addition and not back-patch it, but it seems
silly to not include the extra couple of lines required in the 9.2
version of the code.

Per report from Guillaume Lelarge, though this is slightly more extensive
than his proposed patch.

12 years agoPrevent overflow in pgbench's percent-done display.
Tom Lane [Sat, 20 Oct 2012 16:44:18 +0000 (12:44 -0400)]
Prevent overflow in pgbench's percent-done display.

Per Thom Brown.

12 years agoFix UtilityContainsQuery() to handle CREATE TABLE AS EXECUTE correctly.
Tom Lane [Fri, 19 Oct 2012 22:33:45 +0000 (18:33 -0400)]
Fix UtilityContainsQuery() to handle CREATE TABLE AS EXECUTE correctly.

The code seems to have been written to handle the pre-parse-analysis
representation, where an ExecuteStmt would appear directly under
CreateTableAsStmt.  But in reality the function is only run on
already-parse-analyzed statements, so there will be a Query node in
between.  We'd not noticed the bug because the function is generally
not used at all except in extended query protocol.

Per report from Robert Haas and Rushabh Lathia.

12 years agoFix hash_search to avoid corruption of the hash table on out-of-memory.
Tom Lane [Fri, 19 Oct 2012 19:24:03 +0000 (15:24 -0400)]
Fix hash_search to avoid corruption of the hash table on out-of-memory.

An out-of-memory error during expand_table() on a palloc-based hash table
would leave a partially-initialized entry in the table.  This would not be
harmful for transient hash tables, since they'd get thrown away anyway at
transaction abort.  But for long-lived hash tables, such as the relcache
hash, this would effectively corrupt the table, leading to crash or other
misbehavior later.

To fix, rearrange the order of operations so that table enlargement is
attempted before we insert a new entry, rather than after adding it
to the hash table.

Problem discovered by Hitoshi Harada, though this is a bit different
from his proposed patch.

12 years agoFix ruleutils to print "INSERT INTO foo DEFAULT VALUES" correctly.
Tom Lane [Fri, 19 Oct 2012 17:39:51 +0000 (13:39 -0400)]
Fix ruleutils to print "INSERT INTO foo DEFAULT VALUES" correctly.

Per bug #7615 from Marko Tiikkaja.  Apparently nobody ever tried this
case before ...

12 years agoFix orphan on cancel of drop index concurrently.
Simon Riggs [Fri, 19 Oct 2012 08:56:29 +0000 (09:56 +0100)]
Fix orphan on cancel of drop index concurrently.
Canceling DROP INDEX CONCURRENTLY during
wait could allow an orphaned index to be
left behind which could not be dropped.

Backpatch to 9.2

Andres Freund, tested by Abhijit Menon-Sen

12 years agoFurther cleanup of catcache.c ilist changes.
Tom Lane [Thu, 18 Oct 2012 23:30:43 +0000 (19:30 -0400)]
Further cleanup of catcache.c ilist changes.

Remove useless duplicate initialization of bucket headers, don't use a
dlist_mutable_iter in a performance-critical path that doesn't need it,
make some other cosmetic changes for consistency's sake.

12 years agoRemove unnecessary "head" arguments from some dlist/slist functions.
Tom Lane [Thu, 18 Oct 2012 23:04:20 +0000 (19:04 -0400)]
Remove unnecessary "head" arguments from some dlist/slist functions.

dlist_delete, dlist_insert_after, dlist_insert_before, slist_insert_after
do not need access to the list header, and indeed insisting on that negates
one of the main advantages of a doubly-linked list.

In consequence, revert addition of "cache_bucket" field to CatCTup.

12 years agoCode review for inline-list patch.
Tom Lane [Thu, 18 Oct 2012 20:47:07 +0000 (16:47 -0400)]
Code review for inline-list patch.

Make foreach macros less syntactically dangerous, and fix some typos in
evidently-never-tested ones.  Add missing slist_next_node and
slist_head_node functions.  Fix broken dlist_check code.  Assorted comment
improvements.

12 years agoUse a more portable platform test.
Andrew Dunstan [Thu, 18 Oct 2012 20:14:11 +0000 (16:14 -0400)]
Use a more portable platform test.

12 years agoFurther tweaking of the readfile() function in pg_ctl.
Heikki Linnakangas [Thu, 18 Oct 2012 19:26:26 +0000 (22:26 +0300)]
Further tweaking of the readfile() function in pg_ctl.

Don't leak a file descriptor if the file is empty or we can't read its size.

Expect there to be a newline at the end of the last line, too. If there
isn't, ignore anything after the last newline. This makes it a tiny bit
more robust in case the file is appended to concurrently, so that we don't
return the last line if it hasn't been fully written yet. And this makes
the code a bit less obscure, anyway. Per Tom Lane's suggestion.

Backpatch to all supported branches.

12 years agoIsolation test for DROP INDEX CONCURRENTLY
Simon Riggs [Thu, 18 Oct 2012 18:41:40 +0000 (19:41 +0100)]
Isolation test for DROP INDEX CONCURRENTLY
for recent concurrent changes.

Abhijit Menon-Sen

12 years agoRe-think guts of DROP INDEX CONCURRENTLY.
Simon Riggs [Thu, 18 Oct 2012 17:58:30 +0000 (18:58 +0100)]
Re-think guts of DROP INDEX CONCURRENTLY.
Concurrent behaviour was flawed when using
a two-step process, so add an additional
phase of processing to ensure concurrency
for both SELECTs and INSERT/UPDATE/DELETEs.

Backpatch to 9.2

Andres Freund, tweaked by me

12 years agoFix planning of non-strict equivalence clauses above outer joins.
Tom Lane [Thu, 18 Oct 2012 16:28:45 +0000 (12:28 -0400)]
Fix planning of non-strict equivalence clauses above outer joins.

If a potential equivalence clause references a variable from the nullable
side of an outer join, the planner needs to take care that derived clauses
are not pushed to below the outer join; else they may use the wrong value
for the variable.  (The problem arises only with non-strict clauses, since
if an upper clause can be proven strict then the outer join will get
simplified to a plain join.)  The planner attempted to prevent this type
of error by checking that potential equivalence clauses aren't
outerjoin-delayed as a whole, but actually we have to check each side
separately, since the two sides of the clause will get moved around
separately if it's treated as an equivalence.  Bugs of this type can be
demonstrated as far back as 7.4, even though releases before 8.3 had only
a very ad-hoc notion of equivalence clauses.

In addition, we neglected to account for the possibility that such clauses
might have nonempty nullable_relids even when not outerjoin-delayed; so the
equivalence-class machinery lacked logic to compute correct nullable_relids
values for clauses it constructs.  This oversight was harmless before 9.2
because we were only using RestrictInfo.nullable_relids for OR clauses;
but as of 9.2 it could result in pushing constructed equivalence clauses
to incorrect places.  (This accounts for bug #7604 from Bill MacArthur.)

Fix the first problem by adding a new test check_equivalence_delay() in
distribute_qual_to_rels, and fix the second one by adding code in
equivclass.c and called functions to set correct nullable_relids for
generated clauses.  Although I believe the second part of this is not
currently necessary before 9.2, I chose to back-patch it anyway, partly to
keep the logic similar across branches and partly because it seems possible
we might find other reasons why we need valid values of nullable_relids in
the older branches.

Add regression tests illustrating these problems.  In 9.0 and up, also
add test cases checking that we can push constants through outer joins,
since we've broken that optimization before and I nearly broke it again
with an overly simplistic patch for this problem.

12 years agopg_dump: Output functions deterministically sorted
Alvaro Herrera [Wed, 17 Oct 2012 21:31:42 +0000 (18:31 -0300)]
pg_dump: Output functions deterministically sorted

Implementation idea from Tom Lane

Author: Joel Jacobson
Reviewed by Joachim Wieland

12 years agoRevert tests for drop index concurrently.
Simon Riggs [Thu, 18 Oct 2012 14:27:12 +0000 (15:27 +0100)]
Revert tests for drop index concurrently.

12 years agoAdd isolation tests for DROP INDEX CONCURRENTLY.
Simon Riggs [Thu, 18 Oct 2012 12:37:09 +0000 (13:37 +0100)]
Add isolation tests for DROP INDEX CONCURRENTLY.
Backpatch to 9.2 to ensure bugs are fixed.

Abhijit Menon-Sen

12 years agoClose un-owned SMgrRelations at transaction end.
Tom Lane [Wed, 17 Oct 2012 16:38:21 +0000 (12:38 -0400)]
Close un-owned SMgrRelations at transaction end.

If an SMgrRelation is not "owned" by a relcache entry, don't allow it to
live past transaction end.  This design allows the same SMgrRelation to be
used for blind writes of multiple blocks during a transaction, but ensures
that we don't hold onto such an SMgrRelation indefinitely.  Because an
SMgrRelation typically corresponds to open file descriptors at the fd.c
level, leaving it open when there's no corresponding relcache entry can
mean that we prevent the kernel from reclaiming deleted disk space.
(While CacheInvalidateSmgr messages usually fix that, there are cases
where they're not issued, such as DROP DATABASE.  We might want to add
some more sinval messaging for that, but I'd be inclined to keep this
type of logic anyway, since allowing VFDs to accumulate indefinitely
for blind-written relations doesn't seem like a good idea.)

This code replaces a previous attempt towards the same goal that proved
to be unreliable.  Back-patch to 9.1 where the previous patch was added.

12 years agoRevert "Use "transient" files for blind writes, take 2".
Tom Lane [Wed, 17 Oct 2012 16:37:08 +0000 (12:37 -0400)]
Revert "Use "transient" files for blind writes, take 2".

This reverts commit fba105b1099f4f5fa7283bb17cba6fed2baa8d0c.
That approach had problems with the smgr-level state not tracking what
we really want to happen, and with the VFD-level state not tracking the
smgr-level state very well either.  In consequence, it was still possible
to hold kernel file descriptors open for long-gone tables (as in recent
report from Tore Halset), and yet there were also cases of FDs being closed
undesirably soon.  A replacement implementation will follow.

12 years agoEmbedded list interface
Alvaro Herrera [Tue, 16 Oct 2012 20:36:30 +0000 (17:36 -0300)]
Embedded list interface

Provide a common implementation of embedded singly-linked and
doubly-linked lists.  "Embedded" in the sense that the nodes'
next/previous pointers exist within some larger struct; this design
choice reduces memory allocation overhead.

Most of the implementation uses inlineable functions (where supported),
for performance.

Some existing uses of both types of lists have been converted to the new
code, for demonstration purposes.  Other uses can (and probably will) be
converted in the future.  Since dllist.c is unused after this conversion,
it has been removed.

Author: Andres Freund
Some tweaks by me
Reviewed by Tom Lane, Peter Geoghegan

12 years agoFix typo in previous commit
Simon Riggs [Wed, 17 Oct 2012 09:29:30 +0000 (10:29 +0100)]
Fix typo in previous commit

12 years agoClarify hash index caution and copy to CREATE INDEX docs
Simon Riggs [Wed, 17 Oct 2012 07:14:29 +0000 (08:14 +0100)]
Clarify hash index caution and copy to CREATE INDEX docs

12 years agoWhen outputting the session id in log_line_prefix (%c) or in CSV log
Bruce Momjian [Tue, 16 Oct 2012 16:37:59 +0000 (12:37 -0400)]
When outputting the session id in log_line_prefix (%c) or in CSV log
output mode, cause the hex digits after the period to always be at least
four hex digits, with zero-padding.

12 years agoalter_generic regression test cannot run concurrently with privileges test.
Tom Lane [Mon, 15 Oct 2012 16:18:52 +0000 (12:18 -0400)]
alter_generic regression test cannot run concurrently with privileges test.

... because the latter plays games with the privileges for language SQL.
It looks like running alter_generic in parallel with "misc" is OK though.

Also, adjust serial_schedule to maintain the same test ordering (up to
parallelism) as parallel_schedule.

12 years agoFix typo in comment.
Heikki Linnakangas [Mon, 15 Oct 2012 10:01:31 +0000 (13:01 +0300)]
Fix typo in comment.

Fujii Masao

12 years agoRemove comment that is no longer true.
Heikki Linnakangas [Mon, 15 Oct 2012 08:02:02 +0000 (11:02 +0300)]
Remove comment that is no longer true.

AddToDataDirLockFile() supports out-of-order updates of the lockfile
nowadays.

12 years agoFix race condition in pg_ctl reading postmaster.pid.
Heikki Linnakangas [Sat, 13 Oct 2012 09:48:14 +0000 (12:48 +0300)]
Fix race condition in pg_ctl reading postmaster.pid.

If postmaster changed postmaster.pid while pg_ctl was reading it, pg_ctl
could overrun the buffer it allocated for the file. Fix by reading the
whole file to memory with one read() call.

initdb contains an identical copy of the readfile() function, but the files
that initdb reads are static, not modified concurrently. Nevertheless, add
a simple bounds-check there, if only to silence static analysis tools.

Per report from Dave Vitek. Backpatch to all supported branches.

12 years agoSplit up process latch initialization for more-fail-soft behavior.
Tom Lane [Mon, 15 Oct 2012 02:59:56 +0000 (22:59 -0400)]
Split up process latch initialization for more-fail-soft behavior.

In the previous coding, new backend processes would attempt to create their
self-pipe during the OwnLatch call in InitProcess.  However, pipe creation
could fail if the kernel is short of resources; and the system does not
recover gracefully from a FATAL error right there, since we have armed the
dead-man switch for this process and not yet set up the on_shmem_exit
callback that would disarm it.  The postmaster then forces an unnecessary
database-wide crash and restart, as reported by Sean Chittenden.

There are various ways we could rearrange the code to fix this, but the
simplest and sanest seems to be to split out creation of the self-pipe into
a new function InitializeLatchSupport, which must be called from a place
where failure is allowed.  For most processes that gets called in
InitProcess or InitAuxiliaryProcess, but processes that don't call either
but still use latches need their own calls.

Back-patch to 9.1, which has only a part of the latch logic that 9.2 and
HEAD have, but nonetheless includes this bug.

12 years agoFix oversight in new code for printing rangetable aliases.
Tom Lane [Fri, 12 Oct 2012 20:14:11 +0000 (16:14 -0400)]
Fix oversight in new code for printing rangetable aliases.

In commit 11e131854f8231a21613f834c40fe9d046926387, I missed the case of
a CTE RTE that doesn't have a user-defined alias, but does have an
alias assigned by set_rtable_names().  Per report from Peter Eisentraut.

While at it, refactor slightly to reduce code duplication.

12 years agoIn our source code, make a copy of getopt's 'optarg' string arguments,
Bruce Momjian [Fri, 12 Oct 2012 17:35:40 +0000 (13:35 -0400)]
In our source code, make a copy of getopt's 'optarg' string arguments,
rather than just storing a pointer.

12 years agoGet rid of COERCE_DONTCARE.
Tom Lane [Fri, 12 Oct 2012 17:35:00 +0000 (13:35 -0400)]
Get rid of COERCE_DONTCARE.

We don't need this hack any more.

12 years agoFix unportable format string.
Tom Lane [Fri, 12 Oct 2012 17:22:11 +0000 (13:22 -0400)]
Fix unportable format string.

Per compiler warning.

12 years agoMake equal() ignore CoercionForm fields for better planning with casts.
Tom Lane [Fri, 12 Oct 2012 16:10:49 +0000 (12:10 -0400)]
Make equal() ignore CoercionForm fields for better planning with casts.

This change ensures that the planner will see implicit and explicit casts
as equivalent for all purposes, except in the minority of cases where
there's actually a semantic difference (as reflected by having a 3-argument
cast function).  In particular, this fixes cases where the EquivalenceClass
machinery failed to consider two references to a varchar column as
equivalent if one was implicitly cast to text but the other was explicitly
cast to text, as seen in bug #7598 from Vaclav Juza.  We have had similar
bugs before in other parts of the planner, so I think it's time to fix this
problem at the core instead of continuing to band-aid around it.

Remove set_coercionform_dontcare(), which represents the band-aid
previously in use for allowing matching of index and constraint expressions
with inconsistent cast labeling.  (We can probably get rid of
COERCE_DONTCARE altogether, but I don't think removing that enum value in
back branches would be wise; it's possible there's third party code
referring to it.)

Back-patch to 9.2.  We could go back further, and might want to once this
has been tested more; but for the moment I won't risk destabilizing plan
choices in long-since-stable branches.

12 years agoUnbreak MSVC builds after recent Makefile refactoring.
Andrew Dunstan [Thu, 11 Oct 2012 16:36:42 +0000 (12:36 -0400)]
Unbreak MSVC builds after recent Makefile refactoring.

Based on a suggestion by Peter Eisentraut.

12 years agoFix cross-type case in partial row matching for hashed subplans.
Tom Lane [Thu, 11 Oct 2012 16:20:56 +0000 (12:20 -0400)]
Fix cross-type case in partial row matching for hashed subplans.

When hashing a subplan like "WHERE (a, b) NOT IN (SELECT x, y FROM ...)",
findPartialMatch() attempted to match rows using the hashtable's internal
equality operators, which of course are for x and y's datatypes.  What we
need to use are the potentially cross-type operators for a=x, b=y, etc.
Failure to do that leads to wrong answers or even crashes.  The scope for
problems is limited to cases where we have different types with compatible
hash functions (else we'd not be using a hashed subplan), but for example
int4 vs int8 can cause the problem.

Per bug #7597 from Bo Jensen.  This has been wrong since the hashed-subplan
code was written, so patch all the way back.

12 years agoImprove replication connection timeouts.
Heikki Linnakangas [Thu, 11 Oct 2012 14:39:52 +0000 (17:39 +0300)]
Improve replication connection timeouts.

Rename replication_timeout to wal_sender_timeout, and add a new setting
called wal_receiver_timeout that does the same at the walreceiver side.
There was previously no timeout in walreceiver, so if the network went down,
for example, the walreceiver could take a long time to notice that the
connection was lost. Now with the two settings, both sides of a replication
connection will detect a broken connection similarly.

It is no longer necessary to manually set wal_receiver_status_interval to
a value smaller than the timeout. Both wal sender and receiver now
automatically send a "ping" message if more than 1/2 of the configured
timeout has elapsed, and it hasn't received any messages from the other end.

Amit Kapila, heavily edited by me.

12 years agoRefactor flex and bison make rules
Peter Eisentraut [Thu, 11 Oct 2012 10:57:04 +0000 (06:57 -0400)]
Refactor flex and bison make rules

Numerous flex and bison make rules have appeared in the source tree
over time, and they are all virtually identical, so we can replace
them by pattern rules with some variables for customization.

Users of pgxs will also be able to benefit from this.

12 years agoRemove _FORTIFY_SOURCE
Peter Eisentraut [Thu, 11 Oct 2012 01:42:38 +0000 (21:42 -0400)]
Remove _FORTIFY_SOURCE

Apparently, on some glibc versions this causes warnings when
optimization is not enabled.

Altogether, there appear to be too many incompatibilities surrounding
this.

12 years agoRemove configure-option-dependent test cases from dblink tests.
Tom Lane [Thu, 11 Oct 2012 00:14:26 +0000 (20:14 -0400)]
Remove configure-option-dependent test cases from dblink tests.

The HINTs generated for these error cases vary across builds.  We
could try to work around that, but the test cases aren't really useful
enough to justify taking any trouble.

Per buildfarm.

12 years agoUpdate obsolete comment.
Tom Lane [Wed, 10 Oct 2012 21:04:37 +0000 (17:04 -0400)]
Update obsolete comment.

We no longer use GetNewOidWithIndex on pg_largeobject; rather,
pg_largeobject_metadata's regular OID column is considered the repository
of OIDs for large objects.  The special functionality is still needed for
TOAST tables however.

12 years agoCreate an improved FDW option validator function for contrib/dblink.
Tom Lane [Wed, 10 Oct 2012 20:53:08 +0000 (16:53 -0400)]
Create an improved FDW option validator function for contrib/dblink.

dblink now has its own validator function dblink_fdw_validator(), which is
better than the core function postgresql_fdw_validator() because it gets
the list of legal options from libpq instead of having a hard-wired list.

Make the dblink extension module provide a standard foreign data wrapper
dblink_fdw that encapsulates use of this validator, and recommend use of
that wrapper instead of making up wrappers on the fly.

Unfortunately, because ad-hoc wrappers *were* recommended practice
previously, it's not clear when we can get rid of postgresql_fdw_validator
without causing upgrade problems.  But this is a step in the right
direction.

Shigeru Hanada, reviewed by KaiGai Kohei

12 years agoUpdate obsolete text in fdwhandler.sgml.
Tom Lane [Wed, 10 Oct 2012 17:54:38 +0000 (13:54 -0400)]
Update obsolete text in fdwhandler.sgml.

Etsuro Fujita, with some wording adjustment by me.

12 years agoIn pg_upgrade, issue proper error message when we can't open PG_VERSION.
Bruce Momjian [Wed, 10 Oct 2012 17:53:00 +0000 (13:53 -0400)]
In pg_upgrade, issue proper error message when we can't open PG_VERSION.

Backpatch to 9.2.

12 years agoSet procost to 10 for each of the pg_foo_is_visible() functions.
Tom Lane [Wed, 10 Oct 2012 16:19:25 +0000 (12:19 -0400)]
Set procost to 10 for each of the pg_foo_is_visible() functions.

The idea here is to make sure the planner will evaluate these functions
last not first among the filter conditions in psql pattern search and
tab-completion queries.  We've discussed this several times, and there
was consensus to do it back in August, but we didn't want to do it just
before a release.  Now seems like a safer time.

No catversion bump, since this catalog change doesn't create a backend
incompatibility nor any regression test result changes.

12 years agoFix PGXS support for building loadable modules on AIX.
Tom Lane [Wed, 10 Oct 2012 01:04:06 +0000 (21:04 -0400)]
Fix PGXS support for building loadable modules on AIX.

Building a shlib on AIX requires use of the mkldexport.sh script, but we
failed to install that, preventing its use from non-source-tree contexts.
Also, Makefile.aix had the wrong idea about where to find the installed
copy of the postgres.imp symbol file used by AIX.

Per report from John Pierce.  Patch all the way back, since this has been
broken since the beginning of PGXS.

12 years agoRemove unnecessary overhead in backend's large-object operations.
Tom Lane [Tue, 9 Oct 2012 20:38:00 +0000 (16:38 -0400)]
Remove unnecessary overhead in backend's large-object operations.

Do read/write permissions checks at most once per large object descriptor,
not once per lo_read or lo_write call as before.  The repeated tests were
quite useless in the read case since the snapshot-based tests were
guaranteed to produce the same answer every time.  In the write case,
the extra tests could in principle detect revocation of write privileges
after a series of writes has started --- but there's a race condition there
anyway, since we'd check privileges before performing and certainly before
committing the write.  So there's no real advantage to checking every
single time, and we might as well redefine it as "only check the first
time".

On the same reasoning, remove the LargeObjectExists checks in inv_write
and inv_truncate.  We already checked existence when the descriptor was
opened, and checking again doesn't provide any real increment of safety
that would justify the cost.

12 years agoFix silly bug in previous refactoring.
Heikki Linnakangas [Tue, 9 Oct 2012 16:33:12 +0000 (19:33 +0300)]
Fix silly bug in previous refactoring.

I extracted the refactoring patch from a larger patch that contained other
changes too, but missed one unintentional change and didn't test enough...

12 years agoPut the logic to wait for WAL in standby mode to a separate function.
Heikki Linnakangas [Tue, 9 Oct 2012 16:20:17 +0000 (19:20 +0300)]
Put the logic to wait for WAL in standby mode to a separate function.

This is just refactoring with no user-visible effect, to make the code more
readable.

12 years agorestore permission bits
Alvaro Herrera [Tue, 9 Oct 2012 15:08:13 +0000 (12:08 -0300)]
restore permission bits

12 years agoRename USE_INLINE to PG_USE_INLINE
Alvaro Herrera [Tue, 9 Oct 2012 14:10:10 +0000 (11:10 -0300)]
Rename USE_INLINE to PG_USE_INLINE

The former name was too likely to conflict with symbols from external
headers; and, as seen in recent buildfarm failures in member spoonbill,
it has now happened at least in plpython.

12 years agoRemove stray newline in comment.
Heikki Linnakangas [Tue, 9 Oct 2012 10:05:59 +0000 (13:05 +0300)]
Remove stray newline in comment.

12 years agoUse tablespace_option consistently on doc page
Simon Riggs [Tue, 9 Oct 2012 07:29:37 +0000 (08:29 +0100)]
Use tablespace_option consistently on doc page

Fujii Masao

12 years agoAdd microsecs/op display to pg_test_fsync utility
Simon Riggs [Tue, 9 Oct 2012 07:15:23 +0000 (08:15 +0100)]
Add microsecs/op display to pg_test_fsync utility

e.g. fsync  2103.613 ops/sec (   475 microsecs/op)

Peter Geoghegan

12 years agoFix lo_import and lo_export to return useful error messages more often.
Tom Lane [Tue, 9 Oct 2012 01:52:34 +0000 (21:52 -0400)]
Fix lo_import and lo_export to return useful error messages more often.

I found that these functions tend to return -1 while leaving an empty error
message string in the PGconn, if they suffer some kind of I/O error on the
file.  The reason is that lo_close, which thinks it's executed a perfectly
fine SQL command, clears the errorMessage.  The minimum-change workaround
is to reorder operations here so that we don't fill the errorMessage until
after lo_close.

12 years agoFix lo_export usage in example programs.
Tom Lane [Tue, 9 Oct 2012 01:18:46 +0000 (21:18 -0400)]
Fix lo_export usage in example programs.

lo_export returns -1, not zero, on failure.

12 years agoFix lo_read, lo_write, lo_truncate to cope with "size_t" length parameters.
Tom Lane [Tue, 9 Oct 2012 01:12:27 +0000 (21:12 -0400)]
Fix lo_read, lo_write, lo_truncate to cope with "size_t" length parameters.

libpq defines these functions as accepting "size_t" lengths ... but the
underlying backend functions expect signed int32 length parameters, and so
will misinterpret any value exceeding INT_MAX.  Fix the libpq side to throw
error rather than possibly doing something unexpected.

This is a bug of long standing, but I doubt it's worth back-patching.  The
problem is really pretty academic anyway with lo_read/lo_write, since any
caller expecting sane behavior would have to have provided a multi-gigabyte
buffer.  It's slightly more pressing with lo_truncate, but still we haven't
supported large objects over 2GB until now.

12 years agoRemove generation of repl_gram.h
Peter Eisentraut [Tue, 9 Oct 2012 00:36:46 +0000 (20:36 -0400)]
Remove generation of repl_gram.h

It was apparently never necessary.

12 years agoCode review for 64-bit-large-object patch.
Tom Lane [Mon, 8 Oct 2012 22:24:06 +0000 (18:24 -0400)]
Code review for 64-bit-large-object patch.

Fix broken-on-bigendian-machines byte-swapping functions, add missed update
of alternate regression expected file, improve error reporting, remove some
unnecessary code, sync testlo64.c with current testlo.c (it seems to have
been cloned from a very old copy of that), assorted cosmetic improvements.

12 years agoFix thinko in previous commit
Alvaro Herrera [Mon, 8 Oct 2012 20:34:33 +0000 (17:34 -0300)]
Fix thinko in previous commit

Since postgres.h includes palloc.h, definitions that affect the latter
must be present before the former is included.

Per buildfarm results

12 years agoAdd support for easily declaring static inline functions
Alvaro Herrera [Mon, 8 Oct 2012 19:12:27 +0000 (16:12 -0300)]
Add support for easily declaring static inline functions

We already had those, but they forced modules to spell out the function
bodies twice.  Eliminate some duplicates we had already grown.

Extracted from a somewhat larger patch from Andres Freund.

12 years agoAdd #define for UUIDOID.
Robert Haas [Mon, 8 Oct 2012 14:15:15 +0000 (10:15 -0400)]
Add #define for UUIDOID.

Phil Sorber and Thom Brown. Reviewed by Albe Laurenz.

12 years agoSay ANALYZE, not VACUUM, in error message on analyze in hot standby.
Heikki Linnakangas [Mon, 8 Oct 2012 11:17:27 +0000 (14:17 +0300)]
Say ANALYZE, not VACUUM, in error message on analyze in hot standby.

Tomonaru Katsumata

12 years agoFix walsender handling of postmaster shutdown, to not go into endless loop.
Heikki Linnakangas [Mon, 8 Oct 2012 10:22:04 +0000 (13:22 +0300)]
Fix walsender handling of postmaster shutdown, to not go into endless loop.

This bug was introduced by my patch to use the regular die/quickdie signal
handlers in walsender processes. I tried to make walsender exit at next
CHECK_FOR_INTERRUPTS() by setting ProcDiePending, but that's not enough, you
need to set InterruptPending too. On second thoght, it was not a very good
way to make walsender exit anyway, so use proc_exit(0) instead.

Also, send a CommandComplete message before exiting; that's what we did
before, and you get a nicer error message in the standby that way.

Reported by Thom Brown.

12 years agoAutoconfiscate selection of 64-bit int type for 64-bit large object API.
Tom Lane [Mon, 8 Oct 2012 01:52:07 +0000 (21:52 -0400)]
Autoconfiscate selection of 64-bit int type for 64-bit large object API.

Get rid of the fundamentally indefensible assumption that "long long int"
exists and is exactly 64 bits wide on every platform Postgres runs on.
Instead let the configure script select the type to use for "pg_int64".

This is a bit of a pain in the rear since we do not want to pollute client
namespace with all the random symbols that pg_config.h defines; instead
we have to create a separate generated header file, "pg_config_ext.h".
But now that the infrastructure is there, we might have the ability to
add some other stuff that's long been wanting in this area.

12 years agoFix typo in previous MSC commit.
Andrew Dunstan [Sun, 7 Oct 2012 23:56:26 +0000 (19:56 -0400)]
Fix typo in previous MSC commit.

12 years agoImprove documentation about large-object functions.
Tom Lane [Sun, 7 Oct 2012 23:16:28 +0000 (19:16 -0400)]
Improve documentation about large-object functions.

Copy-editing for previous patch, plus fixing some longstanding markup
issues and oversights (like not mentioning that failures will set the
PQerrorMessage string).

12 years agoQuiet a few MSC compiler warnings.
Andrew Dunstan [Sun, 7 Oct 2012 21:31:10 +0000 (17:31 -0400)]
Quiet a few MSC compiler warnings.

12 years agoFix compiling errors on Windows platform. Fix wrong usage of
Tatsuo Ishii [Sun, 7 Oct 2012 14:30:31 +0000 (23:30 +0900)]
Fix compiling errors on Windows platform. Fix wrong usage of
INT64CONST macro. Fix lo_hton64 and lo_ntoh64 not to use int32_t and
uint32_t.

12 years agoBump up catalog vesion due to 64-bit large object API functions
Tatsuo Ishii [Sun, 7 Oct 2012 00:36:20 +0000 (09:36 +0900)]
Bump up catalog vesion due to 64-bit large object API functions
addition.

12 years agoAdd API for 64-bit large object access. Now users can access up to
Tatsuo Ishii [Sat, 6 Oct 2012 23:36:48 +0000 (08:36 +0900)]
Add API for 64-bit large object access.  Now users can access up to
4TB large objects (standard 8KB BLCKSZ case).  For this purpose new
libpq API lo_lseek64, lo_tell64 and lo_truncate64 are added.  Also
corresponding new backend functions lo_lseek64, lo_tell64 and
lo_truncate64 are added. inv_api.c is changed to handle 64-bit
offsets.

Patch contributed by Nozomi Anzai (backend side) and Yugo Nagata
(frontend side, docs, regression tests and example program). Reviewed
by Kohei Kaigai. Committed by Tatsuo Ishii with minor editings.

12 years agoImprove LDAP authentication documentation
Peter Eisentraut [Sat, 6 Oct 2012 01:20:06 +0000 (21:20 -0400)]
Improve LDAP authentication documentation

Use the terms "simple bind" and "search+bind" consistently do
distinguish the two modes (better than first mode and second mode in
any case).  They were already used in some places, now it's just more
prominent.

Split up the list of options into one for common options and one for
each mode, for clarity.

Add configuration examples for either mode.

12 years agoRemoved sentence about not being able to retrieve more than one row at a time,
Michael Meskes [Fri, 5 Oct 2012 14:49:27 +0000 (16:49 +0200)]
Removed sentence about not being able to retrieve more than one row at a time,
because it is not correct.

12 years agoFixed test for array boundary.
Michael Meskes [Fri, 5 Oct 2012 14:37:45 +0000 (16:37 +0200)]
Fixed test for array boundary.

Instead of continuing if the next character is not an array boundary get_data()
used to continue only on finding a boundary so it was not able to read any
element after the first.

12 years agoUse the regular main processing loop also in walsenders.
Heikki Linnakangas [Fri, 5 Oct 2012 14:13:07 +0000 (17:13 +0300)]
Use the regular main processing loop also in walsenders.

The regular backend's main loop handles signal handling and error recovery
better than the current WAL sender command loop does. For example, if the
client hangs and a SIGTERM is received before starting streaming, the
walsender will now terminate immediately, rather than hang until the
connection times out.

12 years agogetnameinfo_unix has to be taught not to insist on NI_NUMERIC flags, too.
Tom Lane [Fri, 5 Oct 2012 02:53:53 +0000 (22:53 -0400)]
getnameinfo_unix has to be taught not to insist on NI_NUMERIC flags, too.

Per testing of previous patch.

12 years agoPL/pgSQL: rename gram.y to pl_gram.y
Peter Eisentraut [Fri, 5 Oct 2012 02:40:33 +0000 (22:40 -0400)]
PL/pgSQL: rename gram.y to pl_gram.y

This makes the naming inside plpgsql consistent and distinguishes the
file from the backend's gram.y file.  It will also allow easier
refactoring of the bison make rules later on.

12 years agoRemove redundant code for getnameinfo() replacement
Peter Eisentraut [Fri, 5 Oct 2012 01:45:14 +0000 (21:45 -0400)]
Remove redundant code for getnameinfo() replacement

Our getnameinfo() replacement implementation in getaddrinfo.c failed
unless NI_NUMERICHOST and NI_NUMERICSERV were given as flags, because
it doesn't resolve host names, only numeric IPs.  But per standard,
when those flags are not given, an implementation can still degrade to
not returning host names, so this restriction is unnecessary.  When we
remove it, we can eliminate some code in postmaster.c that apparently
tried to work around that.

12 years agoMake CREATE AGGREGATE complain if the initcond is invalid for the datatype.
Tom Lane [Thu, 4 Oct 2012 21:54:53 +0000 (17:54 -0400)]
Make CREATE AGGREGATE complain if the initcond is invalid for the datatype.

The initial transition value is stored as a text string and not fed to the
transition type's input function until runtime (so that values such as
"now" don't get frozen at creation time).  Previously, CREATE AGGREGATE
didn't do anything with it but that, which meant that even erroneous values
would be accepted and not complained of until the aggregate is used.  This
seems unhelpful, and it's confused at least one user, as in Rhys Stewart's
recent report.  It seems worth taking a few more cycles to invoke the input
function and verify that the value is acceptable.  We can't do this if the
transition type is polymorphic, but in normal aggregates we know the actual
transition type so we can call the right input function.

12 years agoFix parse location tracking for lists that can be empty.
Tom Lane [Thu, 4 Oct 2012 21:14:59 +0000 (17:14 -0400)]
Fix parse location tracking for lists that can be empty.

The previous coding of the YYLLOC_DEFAULT macro behaved strangely for empty
productions, assigning the previous nonterminal's location as the parse
location of the result.  The usefulness of that was (at best) debatable
already, but the real problem is that in list-generating nonterminals like
OptFooList: /* EMPTY */ { ... } | OptFooList Foo { ... } ;
the initially-identified location would get copied up, so that even a
nonempty list would be given a bogus parse location.  Document how to work
around that, and do so for OptSchemaEltList, so that the error condition
just added for CREATE SCHEMA IF NOT EXISTS produces a sane error cursor.
So far as I can tell, there are currently no other cases where the
situation arises, so we don't need other instances of this coding yet.

12 years agoFix permissions explanations in CREATE DATABASE and CREATE SCHEMA docs.
Tom Lane [Thu, 4 Oct 2012 17:41:01 +0000 (13:41 -0400)]
Fix permissions explanations in CREATE DATABASE and CREATE SCHEMA docs.

These reference pages still claimed that you have to be superuser to create
a database or schema owned by a different role.  That was true before 8.1,
but it was changed in commits aa1110624c08298393dfce996f7b21809d98d3fd and
f91370cd2faf1fd35a1ac74d84652a85ed841919 to allow assignment of ownership
to any role you are a member of.  However, at the time we were thinking of
that primarily as a change to the ALTER OWNER rules, so the need to touch
these two CREATE ref pages got missed.

12 years agoFix typo in comment, and reword it slightly while we're at it.
Heikki Linnakangas [Thu, 4 Oct 2012 07:34:40 +0000 (10:34 +0300)]
Fix typo in comment, and reword it slightly while we're at it.

12 years agoSupport CREATE SCHEMA IF NOT EXISTS.
Tom Lane [Wed, 3 Oct 2012 23:47:11 +0000 (19:47 -0400)]
Support CREATE SCHEMA IF NOT EXISTS.

Per discussion, schema-element subcommands are not allowed together with
this option, since it's not very obvious what should happen to the element
objects.

Fabrízio de Royes Mello

12 years agorefactor ALTER some-obj SET OWNER implementation
Alvaro Herrera [Wed, 3 Oct 2012 21:02:38 +0000 (18:02 -0300)]
refactor ALTER some-obj SET OWNER implementation

Remove duplicate implementation of catalog munging and miscellaneous
privilege and consistency checks.  Instead rely on already existing data
in objectaddress.c to do the work.

Author: KaiGai Kohei
Tweaked by me
Reviewed by Robert Haas

12 years agoAvoid planner crash/Assert failure with joins to unflattened subqueries.
Tom Lane [Wed, 3 Oct 2012 17:37:53 +0000 (13:37 -0400)]
Avoid planner crash/Assert failure with joins to unflattened subqueries.

examine_simple_variable supposed that any RTE_SUBQUERY rel it gets pointed
at must have been planned already.  However, this isn't a safe assumption
because we must do selectivity estimation while generating indexscan paths,
and that code might look at join clauses involving a rel that the loop in
set_base_rel_sizes() hasn't reached yet.  The simplest fix is to play dumb
in such a situation, that is give up trying to extract any stats for the
Var.  This could possibly be improved by making a separate pass over the
RTE list to plan each unflattened subquery before we start the main
planning work --- but that would be pretty invasive and it doesn't seem
worth it, for now at least.  (We couldn't just break set_base_rel_sizes()
into two loops: the prescan would need to handle all subquery rels in the
query, not only those in the current join subproblem.)

This bug was introduced in commit 1cb108efb0e60d87e4adec38e7636b6e8efbeb57,
although I think that subsequent changes may have exposed it more than it
was originally.  Per bug #7580 from Maxim Boguk.

12 years agoREASSIGN OWNED: consider grants on tablespaces, too
Alvaro Herrera [Wed, 3 Oct 2012 15:22:41 +0000 (12:22 -0300)]
REASSIGN OWNED: consider grants on tablespaces, too

Apparently this was considered in the original code (see commit
cec3b0a9) but I failed to notice that such entries would always be
skipped by the database check at the start of the loop.

Per bugs #7578 by Nikolay, #6116 by tushar.qa@gmail.com.

12 years agoAdd --sampling-rate option to pgbench.
Heikki Linnakangas [Wed, 3 Oct 2012 12:37:42 +0000 (15:37 +0300)]
Add --sampling-rate option to pgbench.

This allows logging only some fraction of transactions, greatly reducing
the amount of log generated.

Tomas Vondra, reviewed by Robert Haas and Jeff Janes.

12 years agoReturn the number of rows processed when COPY is executed through SPI.
Heikki Linnakangas [Wed, 3 Oct 2012 11:32:01 +0000 (14:32 +0300)]
Return the number of rows processed when COPY is executed through SPI.

You can now get the number of rows processed by a COPY statement in a
PL/pgSQL function with "GET DIAGNOSTICS x = ROW_COUNT".

Pavel Stehule, reviewed by Amit Kapila, with some editing by me.

12 years agoFix two bugs introduced in the xlog.c split.
Heikki Linnakangas [Wed, 3 Oct 2012 06:08:13 +0000 (09:08 +0300)]
Fix two bugs introduced in the xlog.c split.

The comment explaining the naming of timeline history files was wrong, and
the history file was not being arhived.

Pointed out by Fujii Masao.

12 years agoImprove some LDAP authentication error messages
Peter Eisentraut [Wed, 3 Oct 2012 03:25:05 +0000 (23:25 -0400)]
Improve some LDAP authentication error messages

12 years agoIn pg_upgrade, use full path name for analyze_new_cluster.sh script.
Bruce Momjian [Wed, 3 Oct 2012 01:18:43 +0000 (21:18 -0400)]
In pg_upgrade, use full path name for analyze_new_cluster.sh script.

Backpatch to 9.2.

12 years agoWork around unportable behavior of malloc(0) and realloc(NULL, 0).
Tom Lane [Tue, 2 Oct 2012 21:31:40 +0000 (17:31 -0400)]
Work around unportable behavior of malloc(0) and realloc(NULL, 0).

On some platforms these functions return NULL, rather than the more common
practice of returning a pointer to a zero-sized block of memory.  Hack our
various wrapper functions to hide the difference by substituting a size
request of 1.  This is probably not so important for the callers, who
should never touch the block anyway if they asked for size 0 --- but it's
important for the wrapper functions themselves, which mistakenly treated
the NULL result as an out-of-memory failure.  This broke at least pg_dump
for the case of no user-defined aggregates, as per report from
Matthew Carrington.

Back-patch to 9.2 to fix the pg_dump issue.  Given the lack of previous
complaints, it seems likely that there is no live bug in previous releases,
even though some of these functions were in place before that.

12 years agoRefactor "ALTER some-obj SET SCHEMA" implementation
Alvaro Herrera [Thu, 27 Sep 2012 21:13:09 +0000 (18:13 -0300)]
Refactor "ALTER some-obj SET SCHEMA" implementation

Instead of having each object type implement the catalog munging
independently, centralize knowledge about how to do it and expand the
existing table in objectaddress.c with enough data about each object
type to support this operation.

Author: KaiGai Kohei
Tweaks by me
Reviewed by Robert Haas

12 years agoStandardize naming of malloc/realloc/strdup wrapper functions.
Tom Lane [Tue, 2 Oct 2012 19:35:10 +0000 (15:35 -0400)]
Standardize naming of malloc/realloc/strdup wrapper functions.

We had a number of variants on the theme of "malloc or die", with the
majority named like "pg_malloc", but by no means all.  Standardize on the
names pg_malloc, pg_malloc0, pg_realloc, pg_strdup.  Get rid of pg_calloc
entirely in favor of using pg_malloc0.

This is an essentially cosmetic change, so no back-patch.  (I did find
a couple of places where psql and pg_dump were using plain malloc or
strdup instead of the pg_ versions, but they don't look significant
enough to bother back-patching.)

12 years agoFix typo in previous warning-silencing patch.
Heikki Linnakangas [Tue, 2 Oct 2012 16:59:00 +0000 (19:59 +0300)]
Fix typo in previous warning-silencing patch.

Fujii Masao

12 years agoIn pg_upgrade, improve error reporting when the number of relation
Bruce Momjian [Tue, 2 Oct 2012 15:53:45 +0000 (11:53 -0400)]
In pg_upgrade, improve error reporting when the number of relation
objects does not match between the old and new clusters.

Backpatch to 9.2.

12 years agoAdjust pg_upgrade query so toast tables related to system catalog schema
Bruce Momjian [Tue, 2 Oct 2012 15:46:08 +0000 (11:46 -0400)]
Adjust pg_upgrade query so toast tables related to system catalog schema
entries are not dumped.   This fixes an error caused by
droping/recreating the information_schema, but other failures were also
possible.

Backpatch to 9.2.

12 years agoIn pg_upgrade, try to convert the locale names to canonical form before
Bruce Momjian [Tue, 2 Oct 2012 15:42:34 +0000 (11:42 -0400)]
In pg_upgrade, try to convert the locale names to canonical form before
comparison;  also report the old/new values if they don't match.

Backpatch to 9.2.