]> granicus.if.org Git - postgresql/log
postgresql
15 years agoMulti-threaded version of pgbench contributed by ITAGAKI Takahiro,
Tatsuo Ishii [Mon, 3 Aug 2009 15:18:14 +0000 (15:18 +0000)]
Multi-threaded version of pgbench contributed by ITAGAKI Takahiro,
reviewed by Greg Smith and Josh Williams.

Following is the proposal from ITAGAKI Takahiro:

Pgbench is a famous tool to measure postgres performance, but nowadays
it does not work well because it cannot use multiple CPUs. On the other
hand, postgres server can use CPUs very well, so the bottle-neck of
workload is *in pgbench*.

Multi-threading would be a solution. The attached patch adds -j
(number of jobs) option to pgbench. If the value N is greater than 1,
pgbench runs with N threads. Connections are equally-divided into
them (ex. -c64 -j4 => 4 threads with 16 connections each). It can
run on POSIX platforms with pthread and on Windows with win32 threads.

Here are results of multi-threaded pgbench runs on Fedora 11 with intel
core i7 (8 logical cores = 4 physical cores * HT). -j8 (8 threads) was
the best and the tps is 4.5 times of -j1, that is a traditional result.

$ pgbench -i -s10
$ pgbench -n -S -c64 -j1   =>  tps = 11600.158593
$ pgbench -n -S -c64 -j2   =>  tps = 17947.100954
$ pgbench -n -S -c64 -j4   =>  tps = 26571.124001
$ pgbench -n -S -c64 -j8   =>  tps = 52725.470403
$ pgbench -n -S -c64 -j16  =>  tps = 38976.675319
$ pgbench -n -S -c64 -j32  =>  tps = 28998.499601
$ pgbench -n -S -c64 -j64  =>  tps = 26701.877815

Is it acceptable to use pthread in contrib module?
If ok, I will add the patch to the next commitfest.

15 years agoAdd ALTER TABLE ... ALTER COLUMN ... SET STATISTICS DISTINCT
Tom Lane [Sun, 2 Aug 2009 22:14:53 +0000 (22:14 +0000)]
Add ALTER TABLE ... ALTER COLUMN ... SET STATISTICS DISTINCT

Robert Haas

15 years agoDepartment of second thoughts: let's show the exact key during unique index
Tom Lane [Sat, 1 Aug 2009 20:59:17 +0000 (20:59 +0000)]
Department of second thoughts: let's show the exact key during unique index
build failures, too.  Refactor a bit more since that error message isn't
spelled the same.

15 years agoImprove unique-constraint-violation error messages to include the exact
Tom Lane [Sat, 1 Aug 2009 19:59:41 +0000 (19:59 +0000)]
Improve unique-constraint-violation error messages to include the exact
values being complained of.

In passing, also remove the arbitrary length limitation in the similar
error detail message for foreign key violations.

Itagaki Takahiro

15 years agoCreate a multiplexing structure for signals to Postgres child processes.
Tom Lane [Fri, 31 Jul 2009 20:26:23 +0000 (20:26 +0000)]
Create a multiplexing structure for signals to Postgres child processes.

This patch gets us out from under the Unix limitation of two user-defined
signal types.  We already had done something similar for signals directed to
the postmaster process; this adds multiplexing for signals directed to
backends and auxiliary processes (so long as they're connected to shared
memory).

As proof of concept, replace the former usage of SIGUSR1 and SIGUSR2
for backends with use of the multiplexing mechanism.  There are still some
hard-wired definitions of SIGUSR1 and SIGUSR2 for other process types,
but getting rid of those doesn't seem interesting at the moment.

Fujii Masao

15 years agoMake sure FD_SETSIZE is set before we include any Windows
Magnus Hagander [Thu, 30 Jul 2009 09:28:00 +0000 (09:28 +0000)]
Make sure FD_SETSIZE is set before we include any Windows
header files.

Josh Williams

15 years agoMerge the Constraint and FkConstraint node types into a single type.
Tom Lane [Thu, 30 Jul 2009 02:45:38 +0000 (02:45 +0000)]
Merge the Constraint and FkConstraint node types into a single type.

This was foreseen to be a good idea long ago, but nobody had got round
to doing it.  The recent patch for deferred unique constraints made
transformConstraintAttrs() ugly enough that I decided it was time.
This change will also greatly simplify parsing of deferred CHECK constraints,
if anyone ever gets around to implementing that.

While at it, add a location field to Constraint, and use that to provide
an error cursor for some of the constraint-related error messages.

15 years agoFix time_part and timetz_part (ie, EXTRACT() for those datatypes) to
Tom Lane [Wed, 29 Jul 2009 22:19:18 +0000 (22:19 +0000)]
Fix time_part and timetz_part (ie, EXTRACT() for those datatypes) to
include a fractional part in the output for MILLISECOND and SECOND cases,
rather than truncating the source value.  This is what the float-timestamp
code has always done, and it was clearly the code author's intent to do
the same for integer timestamps, but he forgot about integer division in C.
The other datatypes supported by EXTRACT() already do this correctly.

Backpatch to 8.4, so that the default (integer) behavior of that branch will
match the default (float) behavior of older branches.  Arguably we should
patch further back, but it's possible that applications are expecting the
broken behavior in older branches.  8.4 is new enough that expectations
shouldn't be too settled.

Per report from Greg Stark.

15 years agoSupport deferrable uniqueness constraints.
Tom Lane [Wed, 29 Jul 2009 20:56:21 +0000 (20:56 +0000)]
Support deferrable uniqueness constraints.

The current implementation fires an AFTER ROW trigger for each tuple that
looks like it might be non-unique according to the index contents at the
time of insertion.  This works well as long as there aren't many conflicts,
but won't scale to massive unique-key reassignments.  Improving that case
is a TODO item.

Dean Rasheed

15 years agoFix a thinko introduced into CountActiveBackends by a recent patch:
Tom Lane [Wed, 29 Jul 2009 15:57:11 +0000 (15:57 +0000)]
Fix a thinko introduced into CountActiveBackends by a recent patch:
we should ignore NULL array entries, not non-NULL ones.  This had the
effect of disabling commit_delay, and could have caused a crash in the
rare race condition the patch was intended to fix.

Bug report and diagnosis by Jeff Janes, in bug #4952.

15 years agoCorrect calculations of overlap and contains operations over polygons.
Teodor Sigaev [Tue, 28 Jul 2009 09:48:00 +0000 (09:48 +0000)]
Correct calculations of overlap and contains operations over polygons.

15 years agoFix incorrect cleanup of tsquery in ts_rewrite(). Per bug #4933 by
Teodor Sigaev [Tue, 28 Jul 2009 09:31:55 +0000 (09:31 +0000)]
Fix incorrect cleanup of tsquery in ts_rewrite(). Per bug #4933 by
 Aaron Marcuse-Kubitza <aaronmk@blackducksoftware.com>

15 years agoAdd system catalog columns pg_constraint.conindid and pg_trigger.tgconstrindid.
Tom Lane [Tue, 28 Jul 2009 02:56:31 +0000 (02:56 +0000)]
Add system catalog columns pg_constraint.conindid and pg_trigger.tgconstrindid.

conindid is the index supporting a constraint.  We can use this not only for
unique/primary-key constraints, but also foreign-key constraints, which
depend on the unique index that constrains the referenced columns.
tgconstrindid is just copied from the constraint's conindid field, or is
zero for triggers not associated with constraints.

This is mainly intended as infrastructure for upcoming patches, but it has
some virtue in itself, since it exposes a relationship that you formerly
had to grovel in pg_depend to determine.  I simplified one information_schema
view accordingly.  (There is a pg_dump query that could also use conindid,
but I left it alone because it wasn't clear it'd get any faster.)

15 years agoFix minor memory leak in Win32 SID handling functions. Not a big issue
Magnus Hagander [Mon, 27 Jul 2009 08:46:10 +0000 (08:46 +0000)]
Fix minor memory leak in Win32 SID handling functions. Not a big issue
since it's only called during process startup, thus no backpatch.

Found by TAKATSUKA Haruka, patch by Magnus Hagander and
Andrew Chernow

15 years agoEnable the use of multiple CPUs/cores when building on MSVC. This only
Magnus Hagander [Mon, 27 Jul 2009 07:11:15 +0000 (07:11 +0000)]
Enable the use of multiple CPUs/cores when building on MSVC. This only
affects the C compiler step - we still only build one target at a
time.

15 years agoAdd s_lock support for SuperH architecture.
Tom Lane [Mon, 27 Jul 2009 05:31:05 +0000 (05:31 +0000)]
Add s_lock support for SuperH architecture.

After a patch originally submitted by Nobuhiro Iwamatsu, but corrected
(I think) to match our guidelines for safe use of asm fragments.
This should be considered untested ...

15 years agoImprove comment, per gripe from Alvaro.
Tom Lane [Mon, 27 Jul 2009 04:09:55 +0000 (04:09 +0000)]
Improve comment, per gripe from Alvaro.

15 years agoFix pg_stat_statements for EXEC_BACKEND case.
Tom Lane [Mon, 27 Jul 2009 03:34:40 +0000 (03:34 +0000)]
Fix pg_stat_statements for EXEC_BACKEND case.

We should not try to load old statistics when re-attaching to existing
shared memory.  Per bug #4941.

Itagaki Takahiro

15 years agoExperiment with using EXPLAIN COSTS OFF in regression tests.
Tom Lane [Mon, 27 Jul 2009 00:26:03 +0000 (00:26 +0000)]
Experiment with using EXPLAIN COSTS OFF in regression tests.

This is a simple test to see whether COSTS OFF will help much with getting
EXPLAIN output that's sufficiently platform-independent for use in the
regression tests.  The planner does have some freedom of choice in these
examples (plain via bitmap indexscan), so I'm not sure what will happen.

15 years agoExtend EXPLAIN to allow generic options to be specified.
Tom Lane [Sun, 26 Jul 2009 23:34:18 +0000 (23:34 +0000)]
Extend EXPLAIN to allow generic options to be specified.

The original syntax made it difficult to add options without making them
into reserved words.  This change parenthesizes the options to avoid that
problem, and makes provision for an explicit (and perhaps non-Boolean)
value for each option.  The original syntax is still supported, but only
for the two original options ANALYZE and VERBOSE.

As a test case, add a COSTS option that can suppress the planner cost
estimates.  This may be useful for including EXPLAIN output in the regression
tests, which are otherwise unable to cope with cross-platform variations in
cost estimates.

Robert Haas

15 years agoCode review for FORCE QUOTE * patch: fix error checking to consider FORCE
Tom Lane [Sat, 25 Jul 2009 17:04:19 +0000 (17:04 +0000)]
Code review for FORCE QUOTE * patch: fix error checking to consider FORCE
QUOTE * as a variety of FORCE QUOTE, and update psql documentation to include
the option.  (The actual psql code doesn't seem to need any changes.)

15 years agoSmall stylistic improvement in recent FORCE QUOTE * code - use a bool instead of...
Andrew Dunstan [Sat, 25 Jul 2009 13:35:32 +0000 (13:35 +0000)]
Small stylistic improvement in recent FORCE QUOTE * code - use a bool instead of a magic value.

15 years agoAllow * as parameter for FORCE QUOTE for COPY CSV. Itagaki Takahiro.
Andrew Dunstan [Sat, 25 Jul 2009 00:07:14 +0000 (00:07 +0000)]
Allow * as parameter for FORCE QUOTE for COPY CSV. Itagaki Takahiro.

15 years agoAssorted minor refactoring in EXPLAIN.
Tom Lane [Fri, 24 Jul 2009 21:08:42 +0000 (21:08 +0000)]
Assorted minor refactoring in EXPLAIN.

This is believed to not change the output at all, with one known exception:
"Subquery Scan foo" becomes "Subquery Scan on foo".  (We can fix that if
anyone complains, but it would be a wart, because the old code was clearly
inconsistent.)  The main intention is to remove duplicate coding and
provide a cleaner base for subsequent EXPLAIN patching.

Robert Haas

15 years agoReserve the shared memory region during backend startup on Windows, so
Magnus Hagander [Fri, 24 Jul 2009 20:12:42 +0000 (20:12 +0000)]
Reserve the shared memory region during backend startup on Windows, so
that memory allocated by starting third party DLLs doesn't end up
conflicting with it.

Hopefully this solves the long-time issue with "could not reattach
to shared memory" errors on Win32.

Patch from Tsutomu Yamada and me, based on idea from Trevor Talbot.

15 years agoDocument \dg+ and \du+
Peter Eisentraut [Fri, 24 Jul 2009 19:35:44 +0000 (19:35 +0000)]
Document \dg+ and \du+

The fact that \dg and \du take the + option was missing in the documentation.

backpatched to 8.4

Author: Andreas Wenk <a.wenk@netzmeister-st-pauli.de>

15 years agoAvoid extra system calls to block SIGPIPE if the platform provides either
Tom Lane [Fri, 24 Jul 2009 17:58:31 +0000 (17:58 +0000)]
Avoid extra system calls to block SIGPIPE if the platform provides either
sockopt(SO_NOSIGPIPE) or the MSG_NOSIGNAL flag to send().

We assume these features are available if (1) the symbol is defined at
compile time and (2) the kernel doesn't reject the call at runtime.
It might turn out that there are some platforms where (1) and (2) are
true and yet the signal isn't really blocked, in which case applications
would die on server crash.  If that sort of thing gets reported, then
we'll have to add additional defenses of some kind.

Jeremy Kerr

15 years agoAdd commentary about Cygwin's broken erand48, per report from Andrew Dunstan.
Tom Lane [Fri, 24 Jul 2009 15:03:07 +0000 (15:03 +0000)]
Add commentary about Cygwin's broken erand48, per report from Andrew Dunstan.

15 years agoForce use of our erand48 on Cygwin
Andrew Dunstan [Thu, 23 Jul 2009 23:50:29 +0000 (23:50 +0000)]
Force use of our erand48 on Cygwin

15 years agoTeach pg_dump to dump comments attached to the columns of a composite type.
Tom Lane [Thu, 23 Jul 2009 22:59:40 +0000 (22:59 +0000)]
Teach pg_dump to dump comments attached to the columns of a composite type.

Taro Minowa (Higepon)

15 years agoSave a few cycles in EXPLAIN and related commands by not bothering to form
Tom Lane [Thu, 23 Jul 2009 21:27:10 +0000 (21:27 +0000)]
Save a few cycles in EXPLAIN and related commands by not bothering to form
a physical tuple in do_tup_output().  A virtual tuple is easier to set up
and also easier for most tuple receivers to process.  Per my comment on
Robert Haas' recent patch in this code.

15 years agoIn a non-hashed Agg node, reset the "aggcontext" at group boundaries, instead
Tom Lane [Thu, 23 Jul 2009 20:45:27 +0000 (20:45 +0000)]
In a non-hashed Agg node, reset the "aggcontext" at group boundaries, instead
of individually pfree'ing pass-by-reference transition values.  This should
be at least as fast as the prior coding, and it has the major advantage of
clearing out any working data an aggregate function may have stored in or
underneath the aggcontext.  This avoids memory leakage when an aggregate
such as array_agg() is used in GROUP BY mode.  Per report from Chris Spotts.

Back-patch to 8.4.  In principle the problem could arise in prior versions,
but since they didn't have array_agg the issue seems not critical.

15 years agoFix another thinko in join_is_legal's handling of semijoins: we have to test
Tom Lane [Thu, 23 Jul 2009 17:42:06 +0000 (17:42 +0000)]
Fix another thinko in join_is_legal's handling of semijoins: we have to test
for the case that the semijoin was implemented within either input by
unique-ifying its RHS before we test to see if it appears to match the current
join situation.  The previous coding would select semijoin logic in situations
where we'd already unique-ified the RHS and joined it to some unrelated
relation(s), and then came to join it to the semijoin's LHS.  That still gave
the right answer as far as the semijoin itself was concerned, but would lead
to incorrectly examining only an arbitrary one of the matchable rows from the
unrelated relation(s).  The cause of this thinko was incorrect unification of
the pre-8.4 logic for IN joins and OUTER joins --- the comparable case for
outer joins can be handled after making the match test, but that's because
there is nothing like the unique-ification escape hatch for outer joins.
Per bug #4934 from Benjamin Reed.

15 years agoUpdate location to download flex for building on Windows.
Andrew Dunstan [Thu, 23 Jul 2009 17:06:48 +0000 (17:06 +0000)]
Update location to download flex for building on Windows.

15 years agoClarify NULLIF example
Peter Eisentraut [Wed, 22 Jul 2009 18:07:26 +0000 (18:07 +0000)]
Clarify NULLIF example

found by "Vesa-Matti J Kari" <vmkari@cc.helsinki.fi>

15 years agoChange do_tup_output() to take Datum/isnull arrays instead of a char * array,
Tom Lane [Wed, 22 Jul 2009 17:00:23 +0000 (17:00 +0000)]
Change do_tup_output() to take Datum/isnull arrays instead of a char * array,
so it doesn't go through BuildTupleFromCStrings.  This is more or less a
wash for current uses, but will avoid inefficiency for planned changes to
EXPLAIN.

Robert Haas

15 years agoFix mismatch in const:ness of parameters.
Magnus Hagander [Wed, 22 Jul 2009 11:07:02 +0000 (11:07 +0000)]
Fix mismatch in const:ness of parameters.

15 years agoReplace PLpgSQL_dstring by StringInfo.
Joe Conway [Wed, 22 Jul 2009 02:31:38 +0000 (02:31 +0000)]
Replace PLpgSQL_dstring by StringInfo.

Replace redundant PLpgSQL_dstring functionality with StringInfo.
Patch by Pavel Stehule. Review by Joe Conway.

15 years agoTweak TOAST code so that columns marked with MAIN storage strategy are
Tom Lane [Wed, 22 Jul 2009 01:21:22 +0000 (01:21 +0000)]
Tweak TOAST code so that columns marked with MAIN storage strategy are
not forced out-of-line unless that is necessary to make the row fit on a
page.  Previously, they were forced out-of-line if needed to get the row
down to the default target size (1/4th page).

Kevin Grittner

15 years agoMake pg_dump/pg_restore --clean options drop large objects too.
Tom Lane [Tue, 21 Jul 2009 21:46:10 +0000 (21:46 +0000)]
Make pg_dump/pg_restore --clean options drop large objects too.
In passing, make invocations of lo_xxx functions a bit more schema-safe.

Itagaki Takahiro

15 years agoChange pg_listener attribute number constants to match the usual pattern
Peter Eisentraut [Tue, 21 Jul 2009 20:24:51 +0000 (20:24 +0000)]
Change pg_listener attribute number constants to match the usual pattern

It appears that, for no particularly good reason, pg_listener.h deviates from
the usual convention for declaring attribute number constants.  Normally, it's

#define Anum_{catalog-name}_{column-name}  {attribute-number}

pg_listener.h, however substitutes a different string that is similar, but not
the same as, the column name.  This change fixes that.

Author: Robert Haas <robertmhaas@gmail.com>

15 years agoSpeed up AllocSetFreeIndex, which is a significant cost in palloc and pfree,
Tom Lane [Tue, 21 Jul 2009 19:53:12 +0000 (19:53 +0000)]
Speed up AllocSetFreeIndex, which is a significant cost in palloc and pfree,
by using a lookup table instead of a naive shift-and-count loop.  Based on
code originally posted by Sean Eron Anderson at
http://graphics.stanford.edu/%7eseander/bithacks.html.
Greg Stark did the research and benchmarking to show that this is what
we should use.  Jeremy Kerr first noticed that this is a hotspot that
could be optimized, though we ended up not using his suggestion of
platform-specific bit-searching code.

15 years agoRemove translated FAQs
Peter Eisentraut [Tue, 21 Jul 2009 19:20:33 +0000 (19:20 +0000)]
Remove translated FAQs

The English FAQ has been moved to the wiki, so the translated versions should
have been removed at that point as well.

The FAQ_MINGW.html should have been removed when the platform FAQs were
integrated into the documentation (or earlier).

applied to both 8.4 and 8.5

15 years agoAdd a further customization to the SGML Emacs mode to prevent the use of
Peter Eisentraut [Tue, 21 Jul 2009 19:07:24 +0000 (19:07 +0000)]
Add a further customization to the SGML Emacs mode to prevent the use of
tabs in the documentation source.

15 years agoFix another semijoin-ordering bug. We already knew that we couldn't
Tom Lane [Tue, 21 Jul 2009 02:02:44 +0000 (02:02 +0000)]
Fix another semijoin-ordering bug.  We already knew that we couldn't
reorder a semijoin into or out of the righthand side of another semijoin,
but actually it doesn't work to reorder it into or out of the righthand
side of a left or antijoin, either.  Per bug #4906 from Mathieu Fenniak.

This was sloppy thinking on my part.  This identity does work:

( A left join B on (Pab) ) semijoin C on (Pac)
==
( A semijoin C on (Pac) ) left join B on (Pab)

but I failed to see that that doesn't mean this does:

( A left join B on (Pab) ) semijoin C on (Pbc)
!=
A left join ( B semijoin C on (Pbc) ) on (Pab)

15 years agoProperly restore pg_largeobject.relfozenxid in binary upgrade mode.
Bruce Momjian [Mon, 20 Jul 2009 20:53:40 +0000 (20:53 +0000)]
Properly restore pg_largeobject.relfozenxid in binary upgrade mode.

Backpatch to 8.4.X.

15 years agoInstall src/include/utils/fmgroids.h on VPATH builds too.
Alvaro Herrera [Mon, 20 Jul 2009 20:38:55 +0000 (20:38 +0000)]
Install src/include/utils/fmgroids.h on VPATH builds too.

The original coding was not dealing specially with this file being a symlink,
with the end result that it was not installed in VPATH builds.  Oddly enough,
the clean target does know about it ...

15 years agoSmall additional clean from the rearrangement of the HTML index build rules
Peter Eisentraut [Mon, 20 Jul 2009 18:34:58 +0000 (18:34 +0000)]
Small additional clean from the rearrangement of the HTML index build rules

15 years agoUse errcontext mechanism in PL/Python
Peter Eisentraut [Mon, 20 Jul 2009 08:01:07 +0000 (08:01 +0000)]
Use errcontext mechanism in PL/Python

Error messages from PL/Python now always mention the function name in the
CONTEXT: field.  This also obsoletes the few places that tried to do the
same manually.

Regression test files are updated to work with Python 2.4-2.6.  I don't have
access to older versions right now.

15 years agoRemove unnecessary and version-sensitive dependence on the exact set of
Tom Lane [Mon, 20 Jul 2009 03:46:45 +0000 (03:46 +0000)]
Remove unnecessary and version-sensitive dependence on the exact set of
column names to be found in a sequence.  Per gripe from Bruce.

15 years agoDROP IF EXISTS for columns and constraints. Andres Freund.
Andrew Dunstan [Mon, 20 Jul 2009 02:42:28 +0000 (02:42 +0000)]
DROP IF EXISTS for columns and constraints. Andres Freund.

15 years agoTeach simplify_boolean_equality to simplify the forms foo <> true and
Tom Lane [Mon, 20 Jul 2009 00:24:30 +0000 (00:24 +0000)]
Teach simplify_boolean_equality to simplify the forms foo <> true and
foo <> false, along with its previous duties of simplifying foo = true
and foo = false.  (All of these are equivalent to just foo or NOT foo
as the case may be.)  It's not clear how often this is really useful;
but it costs almost nothing to do, and it seems some people think we
should be smart about such cases.  Per recent bug report.

15 years agoRewrite GEQO's gimme_tree function so that it always finds a legal join
Tom Lane [Sun, 19 Jul 2009 21:00:43 +0000 (21:00 +0000)]
Rewrite GEQO's gimme_tree function so that it always finds a legal join
sequence, even when the input "tour" doesn't lead directly to such a sequence.
The stack logic that was added in 2004 only supported cases where relations
that had to be joined to each other (due to join order restrictions) were
adjacent in the tour.  However, relying on a random search to figure that out
is tremendously inefficient in large join problems, and could even fail
completely (leading to "failed to make a valid plan" errors) if
random_init_pool ran out of patience.  It seems better to make the
tour-to-plan transformation a little bit fuzzier so that every tour can form
a legal plan, even though this means that apparently different tours will
sometimes yield the same plan.

In the same vein, get rid of the logic that knew that tours (a,b,c,d,...)
are the same as tours (b,a,c,d,...), and therefore insisted the latter
are invalid.  The chance of generating two tours that differ only in
this way isn't that high, and throwing out 50% of possible tours to
avoid such duplication seems more likely to waste valuable genetic-
refinement generations than to do anything useful.

This leaves us with no cases in which geqo_eval will deem a tour invalid,
so get rid of assorted kluges that tried to deal with such cases, in
particular the undocumented assumption that DBL_MAX is an impossible
plan cost.

This is all per testing of Robert Haas' lets-remove-the-collapse-limits
patch.  That idea has crashed and burned, at least for now, but we still
got something useful out of it.

It's possible we should back-patch this change, since the "failed to make a
valid plan" error can happen in existing releases; but I'd rather not until
it has gotten more testing.

15 years agoFix a thinko in join_is_legal: when we decide we can implement a semijoin
Tom Lane [Sun, 19 Jul 2009 20:32:48 +0000 (20:32 +0000)]
Fix a thinko in join_is_legal: when we decide we can implement a semijoin
by unique-ifying the RHS and then inner-joining to some other relation,
that is not grounds for violating the RHS of some other outer join.
Noticed while regression-testing new GEQO code, which will blindly follow
any path that join_is_legal says is legal, and then complain later if that
leads to a dead end.

I'm not certain that this can result in any visible failure in 8.4: the
mistake may always be masked by the fact that subsequent attempts to join
the rest of the RHS of the other join will fail.  But I'm not certain it
can't, either, and it's definitely not operating as intended.  So back-patch.

The added regression test depends on the new no-failures-allowed logic
that I'm about to commit in GEQO, so no point back-patching that.

15 years agoFix error cleanup failure caused by 8.4 changes in plpgsql to try to avoid
Tom Lane [Sat, 18 Jul 2009 19:15:42 +0000 (19:15 +0000)]
Fix error cleanup failure caused by 8.4 changes in plpgsql to try to avoid
memory leakage in error recovery.  We were calling FreeExprContext, and
therefore invoking ExprContextCallback callbacks, in both normal and error
exits from subtransactions.  However this isn't very safe, as shown in
recent trouble report from Frank van Vugt, in which releasing a tupledesc
refcount failed.  It's also unnecessary, since the resources that callbacks
might wish to release should be cleaned up by other error recovery mechanisms
(ie the resource owners).  We only really want FreeExprContext to release
memory attached to the exprcontext in the error-exit case.  So, add a bool
parameter to FreeExprContext to tell it not to call the callbacks.

A more general solution would be to pass the isCommit bool parameter on to
the callbacks, so they could do only safe things during error exit.  But
that would make the patch significantly more invasive and possibly break
third-party code that registers ExprContextCallback callbacks.  We might want
to do that later in HEAD, but for now I'll just do what seems reasonable to
back-patch.

15 years agoRepair bug #4926 "too few pathkeys for mergeclauses". This example shows
Tom Lane [Fri, 17 Jul 2009 23:19:34 +0000 (23:19 +0000)]
Repair bug #4926 "too few pathkeys for mergeclauses".  This example shows
that the sanity checking I added to create_mergejoin_plan() in 8.3 was a
few bricks shy of a load: the mergeclauses could reference pathkeys in a
noncanonical order such as x,y,x, not only cases like x,x,y which is all
that the code had allowed for.  The odd cases only turn up when using
redundant clauses in an outer join condition, which is why no one had
noticed before.

15 years agoMake GEQO's planning deterministic by having it start from a predictable
Tom Lane [Thu, 16 Jul 2009 20:55:44 +0000 (20:55 +0000)]
Make GEQO's planning deterministic by having it start from a predictable
random number seed each time.  This is how it used to work years ago, but
we got rid of the seed reset because it was resetting the main random()
sequence and thus having undesirable effects on the rest of the system.
To fix, establish a private random number state for each execution of
geqo(), and initialize the state using the new GUC variable geqo_seed.
People who want to experiment with different random searches can do so
by changing geqo_seed, but you'll always get the same plan for the same
value of geqo_seed (if holding all other planner inputs constant, of course).

The new state is kept in PlannerInfo by adding a "void *" field reserved
for use by join_search hooks.  Most of the rather bulky code changes in
this commit are just arranging to pass PlannerInfo around to all the GEQO
functions (many of which formerly didn't receive it).

Andres Freund, with some editorialization by Tom

15 years agoAdd erand48() to the set of functions supported by our src/port/ library,
Tom Lane [Thu, 16 Jul 2009 17:43:52 +0000 (17:43 +0000)]
Add erand48() to the set of functions supported by our src/port/ library,
and extend configure to test for it properly instead of hard-wiring
an assumption that everybody but Windows has the rand48 functions.
(We do cheat to the extent of assuming that probing for erand48 will do
for the entire rand48 family.)

erand48() is unused as of this commit, but a followon patch will cause
GEQO to depend on it.

Andres Freund, additional hacking by Tom

15 years agopg_standby doesn't need to be linked with libpq. Fujii Masao.
Heikki Linnakangas [Thu, 16 Jul 2009 09:59:46 +0000 (09:59 +0000)]
pg_standby doesn't need to be linked with libpq. Fujii Masao.

15 years agoMake backend header files C++ safe
Peter Eisentraut [Thu, 16 Jul 2009 06:33:46 +0000 (06:33 +0000)]
Make backend header files C++ safe

This alters various incidental uses of C++ key words to use other similar
identifiers, so that a C++ compiler won't choke outright.  You still
(probably) need extern "C" { }; around the inclusion of backend headers.

based on a patch by Kurt Harriman <harriman@acm.org>

Also add a script cpluspluscheck to check for C++ compatibility in the
future.  As of right now, this passes without error for me.

15 years agoRearrangement of the HTML docs build rules
Peter Eisentraut [Tue, 14 Jul 2009 22:16:38 +0000 (22:16 +0000)]
Rearrangement of the HTML docs build rules

Set up proper makefile dependencies in the documentation build rules,
especially around the HTML/index build.  The problem we've had with all
previous solutions is that we have used the same file name, such as HTML.index
or bookindex.sgml, to mean different things at different stages of the build,
and make can't distinguish that.  The solution here is that the first jade run
produces HTML.index, but does not require bookindex.sgml at all, and produces
no other html output (the latter an idea from Alvaro).  The second jade run
includes bookindex.sgml, but does not recreate HTML.index.  That way, when you
change an sgml file, jade is run twice and at the end all dependencies are
satisfied.  Omitting the html output in the first stage also makes the full
build a lot faster.

When you run one of the print format targets, only the first jade run is run,
then the print target-specific commands.  If an HTML build has completed
previously, the first jade run is skipped because the dependencies have
already been satisfied.

The draft and check targets for quick builds and syntax verification are still
there.

15 years agoRemove duplicate definition of TYPECAST token.
Tom Lane [Tue, 14 Jul 2009 20:34:48 +0000 (20:34 +0000)]
Remove duplicate definition of TYPECAST token.
(Apparently, some but not all versions of Bison will warn about this.)

15 years agoTweak the core scanner so that it can be used by plpgsql too.
Tom Lane [Tue, 14 Jul 2009 20:24:10 +0000 (20:24 +0000)]
Tweak the core scanner so that it can be used by plpgsql too.

Changes:

Pass in the keyword lookup array instead of having it be hardwired.
(This incidentally allows elimination of some duplicate coding in ecpg.)

Re-order the token declarations in gram.y so that non-keyword tokens have
numbers that won't change when keywords are added or removed.

Add ".." and ":=" to the set of tokens recognized by scan.l.  (Since these
combinations are nowhere legal in core SQL, this does not change anything
except the precise wording of the error you get when you write this.)

15 years agoDo a conditional SPI_push/SPI_pop when replanning a query in
Tom Lane [Tue, 14 Jul 2009 15:37:50 +0000 (15:37 +0000)]
Do a conditional SPI_push/SPI_pop when replanning a query in
RevalidateCachedPlan.  This is to avoid a "SPI_ERROR_CONNECT" failure when
the planner calls a SPI-using function and we are already inside one.
The alternative fix is to expect callers of RevalidateCachedPlan to do this,
which seems likely to result in additional hard-to-detect bugs of omission.
Per reports from Frank van Vugt and Marek Lewczuk.

Back-patch to 8.3. It's much harder to trigger the bug in 8.3, due to a
smaller set of cases in which plans can be invalidated, but it could happen.
(I think perhaps only a SI reset event could make 8.3 fail here, but that's
certainly within the realm of possibility.)

15 years agovacuumlo query cleanups
Bruce Momjian [Mon, 13 Jul 2009 22:56:30 +0000 (22:56 +0000)]
vacuumlo query cleanups

No need for VACUUM ANAYZE of newly created/populated temp table, just
use analyze.

No need to apologize for using subquery in DELETE anymore.

15 years agoUpdate information schema to SQL:2008
Peter Eisentraut [Mon, 13 Jul 2009 20:25:57 +0000 (20:25 +0000)]
Update information schema to SQL:2008

 - yes_or_no domain for "boolean" data
 - new columns for VIEWS view
 - slight section renumbering

15 years agoMake the configure messages rejecting old bison and flex versions include
Tom Lane [Mon, 13 Jul 2009 05:36:53 +0000 (05:36 +0000)]
Make the configure messages rejecting old bison and flex versions include
the full path and version of the program being rejected.

15 years agoAlthough the flex documentation avers that yyalloc and yyrealloc take
Tom Lane [Mon, 13 Jul 2009 03:11:12 +0000 (03:11 +0000)]
Although the flex documentation avers that yyalloc and yyrealloc take
size_t arguments, the emitted scanner actually prototypes them with
type yy_size_t, which is sometimes not the same thing depending on
flex version and platform.  Easiest fix seems to be to use yy_size_t.
Per buildfarm results.

15 years agoConvert the core lexer and parser into fully reentrant code, by making use
Tom Lane [Mon, 13 Jul 2009 02:02:20 +0000 (02:02 +0000)]
Convert the core lexer and parser into fully reentrant code, by making use
of features added to flex and bison since this code was originally written.
This change doesn't in itself offer any new capability, but it's needed
infrastructure for planned improvements in plpgsql.

Another feature now available in flex is the ability to make it use palloc
instead of malloc, so do that to avoid possible memory leaks.  (We should
at some point change the other lexers likewise, but this commit doesn't
touch them.)

15 years agoAdvance the minimum required version of "flex" from 2.5.4 to 2.5.31, and
Tom Lane [Mon, 13 Jul 2009 01:51:56 +0000 (01:51 +0000)]
Advance the minimum required version of "flex" from 2.5.4 to 2.5.31, and
update documentation accordingly.  This is required in order to have support
for a reentrant scanner.  I'm committing this bit separately in order to have
an easy reference if we later decide to make the minimum something different
(like 2.5.33).

15 years agoStamp minor library version numbers for 8.5; sorry for the delay.
Bruce Momjian [Mon, 13 Jul 2009 01:37:05 +0000 (01:37 +0000)]
Stamp minor library version numbers for 8.5; sorry for the delay.

15 years agoFix up PGDLLIMPORT marking for standard_conforming_strings. Moving it
Tom Lane [Mon, 13 Jul 2009 00:42:18 +0000 (00:42 +0000)]
Fix up PGDLLIMPORT marking for standard_conforming_strings.  Moving it
into a header file that plpgsql's scan.l can see broke the previous
kluge.  Per buildfarm results.

15 years agoMove some declarations in the raw-parser header files to create a clearer
Tom Lane [Sun, 12 Jul 2009 17:12:34 +0000 (17:12 +0000)]
Move some declarations in the raw-parser header files to create a clearer
distinction between the external API (parser.h) and declarations that only
need to be visible within the raw parser code (gramparse.h, which now is only
included by parser.c, gram.y, scan.l, and keywords.c).  This is in preparation
for the upcoming change to a reentrant lexer, which will require referencing
YYSTYPE in the declarations of base_yylex and filtered_base_yylex, hence
gram.h will have to be included by gramparse.h.  We don't want any more files
than absolutely necessary to depend on gram.h, so some cleanup is called for.

15 years agoAlter some gratuitous uses of "ANSI" when "SQL standard" might have been
Peter Eisentraut [Sat, 11 Jul 2009 21:15:32 +0000 (21:15 +0000)]
Alter some gratuitous uses of "ANSI" when "SQL standard" might have been
meant or the reference to a standard was unnecessary.

15 years agoCorrect what ISO stands for
Peter Eisentraut [Sat, 11 Jul 2009 21:13:21 +0000 (21:13 +0000)]
Correct what ISO stands for

15 years agoFix set_rel_width() to do something reasonable with non-Var items in a
Tom Lane [Sat, 11 Jul 2009 04:09:33 +0000 (04:09 +0000)]
Fix set_rel_width() to do something reasonable with non-Var items in a
RelOptInfo targetlist.  It used to be that the only possibility other than
a Var was a RowExpr representing a whole-row child Var, but as of 8.4's
expanded ability to flatten appendrel members, we can get arbitrary expressions
in there.  Use the expression's type info and get_typavgwidth() to produce
an at-least-marginally-sane result.  Note that get_typavgwidth()'s fallback
estimate (32 bytes) is the same as what was here before, so there will be
no behavioral change for RowExprs.  Noted while looking at recent gripe
about constant quals pushed down to FunctionScan appendrel members ...
not only were we failing to recognize the constant qual, we were getting
the width estimate wrong :-(

15 years agoFix xslt_process() to ensure that it inserts a NULL terminator after the
Tom Lane [Fri, 10 Jul 2009 00:32:00 +0000 (00:32 +0000)]
Fix xslt_process() to ensure that it inserts a NULL terminator after the
last pair of parameter name/value strings, even when there are MAXPARAMS
of them.  Aboriginal bug in contrib/xml2, noted while studying bug #4912
(though I'm not sure whether there's something else involved in that
report).

This might be thought a security issue, since it's a potential backend
crash; but considering that untrustworthy users shouldn't be allowed
to get their hands on xslt_process() anyway, it's probably not worth
getting excited about.

15 years agoRemove no-longer-necessary transmission of postmaster's LC_COLLATE and
Tom Lane [Wed, 8 Jul 2009 18:55:35 +0000 (18:55 +0000)]
Remove no-longer-necessary transmission of postmaster's LC_COLLATE and
LC_CTYPE settings to children via BackendParameters.  Per discussion,
the postmaster is now just using system defaults anyway, so we might as
well save a few cycles during backend startup.

15 years agoNeed to use pg_perm_setlocale when setting LC_CTYPE and LC_COLLATE at startup.
Heikki Linnakangas [Wed, 8 Jul 2009 17:53:29 +0000 (17:53 +0000)]
Need to use pg_perm_setlocale when setting LC_CTYPE and LC_COLLATE at startup.
Otherwise, the LC_CTYPE/COLLATE setting gets reverted when using plperl, which
leads to incorrect query results and index corruption.

This was accidentally broken in the per-database locale patch in 8.4. Pointed
out by Andrew Gierth.

15 years agoAdd missing HOUR TO SECOND option to list of possible INTERVAL field sets,
Tom Lane [Wed, 8 Jul 2009 17:21:55 +0000 (17:21 +0000)]
Add missing HOUR TO SECOND option to list of possible INTERVAL field sets,
as noted by Sebastien Flaesch.  Also update the claim that we simply throw
away fields outside this set --- that got changed later to only discard
less-significant fields.

15 years agoWhen calling unsupported "make check" with a pgxs module, return a nonzero
Peter Eisentraut [Wed, 8 Jul 2009 13:47:29 +0000 (13:47 +0000)]
When calling unsupported "make check" with a pgxs module, return a nonzero
exit code.

15 years agoJust a little more schema-qualification ...
Tom Lane [Tue, 7 Jul 2009 21:45:05 +0000 (21:45 +0000)]
Just a little more schema-qualification ...

15 years agopsql backward compatibility fix
Peter Eisentraut [Tue, 7 Jul 2009 20:32:20 +0000 (20:32 +0000)]
psql backward compatibility fix

For servers older than 8.3, sort display of child tables by relname instead
of oid::regclass::text, because the cast from regclass to text did not work
back then.  The older display may be slightly worse when different schemas
are involved, but that should be rare enough.

15 years agoDon't use 'return' where you should use 'PG_RETURN_xxx'.
Tom Lane [Tue, 7 Jul 2009 19:28:56 +0000 (19:28 +0000)]
Don't use 'return' where you should use 'PG_RETURN_xxx'.

15 years agoQuery in SQL function still not schema-safe; add a couple
Tom Lane [Tue, 7 Jul 2009 19:28:00 +0000 (19:28 +0000)]
Query in SQL function still not schema-safe; add a couple
more pg_catalog. qualifications.

15 years agoSort child tables by name instead of OID in \d+ display
Peter Eisentraut [Tue, 7 Jul 2009 19:05:57 +0000 (19:05 +0000)]
Sort child tables by name instead of OID in \d+ display

This was an oversight in the recent patch.  Found by Tom Lane.

15 years agoFix typo in comment.
Tom Lane [Tue, 7 Jul 2009 18:49:16 +0000 (18:49 +0000)]
Fix typo in comment.

15 years agoMore sensible character_octet_length
Peter Eisentraut [Tue, 7 Jul 2009 18:23:15 +0000 (18:23 +0000)]
More sensible character_octet_length

For character types with typmod, character_octet_length columns in the
information schema now show the maximum character length times the
maximum length of a character in the server encoding, instead of some
huge value as before.

15 years agoCode review for patch to show definition of index columns in \d on index.
Tom Lane [Tue, 7 Jul 2009 16:28:38 +0000 (16:28 +0000)]
Code review for patch to show definition of index columns in \d on index.
Safely schema-qualify the pg_get_indexdef call, make the query a bit
prettier in -E mode, remove useless join to pg_index, make it more obvious
that the header[] array is not overrun.

15 years agoUse floor() not rint() when reducing precision of fractional seconds in
Tom Lane [Mon, 6 Jul 2009 20:29:23 +0000 (20:29 +0000)]
Use floor() not rint() when reducing precision of fractional seconds in
timestamp_trunc, timestamptz_trunc, and interval_trunc().  This change
only affects the float-datetime case; the integer-datetime case already
behaved like truncation instead of rounding.  Per gripe from Mario Splivalo.

This is a pre-existing issue but I'm choosing not to backpatch, because
it's such a corner case and there have not been prior complaints.  The
issue is largely moot anyway given the trend towards integer datetimes.

15 years agoFix ancient bug in handling of to_char modifier 'TH', when used with HH.
Heikki Linnakangas [Mon, 6 Jul 2009 19:11:39 +0000 (19:11 +0000)]
Fix ancient bug in handling of to_char modifier 'TH', when used with HH.
In what seems like an oversight, we used to treat 'TH' the same as lowercase
'th', but only with HH/HH12.

15 years agoFix set_append_rel_pathlist() to deal intelligently with cases where
Tom Lane [Mon, 6 Jul 2009 18:26:30 +0000 (18:26 +0000)]
Fix set_append_rel_pathlist() to deal intelligently with cases where
substituting a child rel's output expressions into the appendrel's restriction
clauses yields a pseudoconstant restriction.  We might be able to skip scanning
that child rel entirely (if we get constant FALSE), or generate a one-time
filter.  8.3 more or less accidentally generated plans that weren't completely
stupid in these cases, but that was only because an extra recursive level of
subquery_planner() always occurred and allowed const-simplification to happen.
8.4's ability to pull up appendrel members with non-Var outputs exposes the
fact that we need to work harder here.  Per gripe from Sergey Burladyan.

15 years agoShow definition of index columns in \d on index
Peter Eisentraut [Mon, 6 Jul 2009 17:01:42 +0000 (17:01 +0000)]
Show definition of index columns in \d on index

This adds a column called "Definition" to the output of psql \d on an
index, which shows the full expression behind the index column.  For indexes
on plain columns, this is redundant,  but for expression indexes, this
reveals the real expression.

Author: Khee Chin <kheechin@gmail.com>

15 years agoPer SQL spec (in particular, the grammar in SQL:2008 7.13) we should allow
Tom Lane [Mon, 6 Jul 2009 02:58:40 +0000 (02:58 +0000)]
Per SQL spec (in particular, the grammar in SQL:2008 7.13) we should allow
parentheses around the <query expression body> that follows a WITH clause, eg
with cte(foo) as ( values(0) ) ((select foo from cte));
This seems to be just an oversight/thinko in gram.y.  Noted while
experimenting with bug #4902.

15 years agoFix handling of changed-Param signaling for CteScan plan nodes. We were using
Tom Lane [Mon, 6 Jul 2009 02:16:03 +0000 (02:16 +0000)]
Fix handling of changed-Param signaling for CteScan plan nodes.  We were using
the "cteParam" as a proxy for the possibility that the underlying CTE plan
depends on outer-level variables or Params, but that doesn't work very well
because it sometimes causes calling subqueries to be treated as SubPlans when
they could be InitPlans.  This is inefficient and also causes the outright
failure exhibited in bug #4902.  Instead, leave the cteParam out of it and
copy the underlying CTE plan's extParams directly.  Per bug #4902 from
Marko Tiikkaja.

15 years agoAdd log_line_prefix placeholder %e to contain the current SQL state
Peter Eisentraut [Fri, 3 Jul 2009 19:14:25 +0000 (19:14 +0000)]
Add log_line_prefix placeholder %e to contain the current SQL state

Author: Guillaume Smet <guillaume.smet@gmail.com>

15 years agoHave \d show child tables that inherit from the specified parent
Peter Eisentraut [Fri, 3 Jul 2009 18:56:50 +0000 (18:56 +0000)]
Have \d show child tables that inherit from the specified parent

As per discussion, \d shows only the number of child tables, because that
could be hundreds, when used for partitioning.  \d+ shows the actual list.

Author: Damien Clochard <damien@dalibo.info>

15 years agoFix up pg_dump's --binary-upgrade option so that it behaves properly with
Tom Lane [Thu, 2 Jul 2009 21:34:32 +0000 (21:34 +0000)]
Fix up pg_dump's --binary-upgrade option so that it behaves properly with
inherited columns and check constraints.  Per my recent trouble report.

15 years agoUpgrade to Autoconf 2.63
Peter Eisentraut [Thu, 2 Jul 2009 18:55:40 +0000 (18:55 +0000)]
Upgrade to Autoconf 2.63

This upgrades the configure infrastructure to the latest Autoconf version.
Some notable news are:
 - The workaround for the broken fseeko() test is gone.
 - Checking for unknown options is now provided by Autoconf itself.
 - Fixes for Mac OS X

15 years agoRegression test for XML mapping functionality
Peter Eisentraut [Thu, 2 Jul 2009 07:03:18 +0000 (07:03 +0000)]
Regression test for XML mapping functionality

I wrote this one while chasing down some bugs in the closing days of 8.4.  It
could be useful in the long run.  This area of the code had no test coverage
at all before.