]> granicus.if.org Git - postgresql/log
postgresql
14 years agoMove symbols for ExecMergeJoin's state machine into nodeMergejoin.c.
Tom Lane [Fri, 31 Dec 2010 03:12:40 +0000 (22:12 -0500)]
Move symbols for ExecMergeJoin's state machine into nodeMergejoin.c.

There's no reason for these values to be known anywhere else.  After
doing this, executor/execdefs.h is vestigial and can be removed.

14 years agoSupport RIGHT and FULL OUTER JOIN in hash joins.
Tom Lane [Fri, 31 Dec 2010 01:24:55 +0000 (20:24 -0500)]
Support RIGHT and FULL OUTER JOIN in hash joins.

This is advantageous first because it allows us to hash the smaller table
regardless of the outer-join type, and second because hash join can be more
flexible than merge join in dealing with arbitrary join quals in a FULL
join.  For merge join all the join quals have to be mergejoinable, but hash
join will work so long as there's at least one hashjoinable qual --- the
others can be any condition.  (This is true essentially because we don't
keep per-inner-tuple match flags in merge join, while hash join can do so.)

To do this, we need a has-it-been-matched flag for each tuple in the
hashtable, not just one for the current outer tuple.  The key idea that
makes this practical is that we can store the match flag in the tuple's
infomask, since there are lots of bits there that are of no interest for a
MinimalTuple.  So we aren't increasing the size of the hashtable at all for
the feature.

To write this without turning the hash code into even more of a pile of
spaghetti than it already was, I rewrote ExecHashJoin in a state-machine
style, similar to ExecMergeJoin.  Other than that decision, it was pretty
straightforward.

14 years agoRemove tabs in SGML
Peter Eisentraut [Thu, 30 Dec 2010 20:15:55 +0000 (22:15 +0200)]
Remove tabs in SGML

14 years agoAvoid unnecessary public struct declaration in slru.h
Alvaro Herrera [Thu, 30 Dec 2010 15:09:17 +0000 (12:09 -0300)]
Avoid unnecessary public struct declaration in slru.h

Instead, declare a public wrapper of the sole function using it for
external callers, so that they don't have to always pass a NULL
argument.

Author: Kevin Grittner

14 years agoDoc wording improvement: taken -> accepted
Bruce Momjian [Wed, 29 Dec 2010 18:49:26 +0000 (13:49 -0500)]
Doc wording improvement:  taken -> accepted

     with time zone</type>.)  <type>timestamptz</type> is accepted as an

14 years agoImprove pg_upgrade's checks for required executables.
Tom Lane [Wed, 29 Dec 2010 18:43:53 +0000 (13:43 -0500)]
Improve pg_upgrade's checks for required executables.

Don't insist on pg_dumpall and psql being present in the old cluster,
since they are not needed.  Do insist on pg_resetxlog being present
(in both old and new), since we need it.  Also check for pg_config,
but only in the new cluster.  Remove the useless attempt to call
pg_config in the old cluster; we don't need to know the old value of
--pkglibdir.  (In the case of a stripped-down migration installation
there might be nothing there to look at anyway, so any future change
that might reintroduce that need would have to be considered carefully.)

Per my attempts to build a minimal previous-version installation to support
pg_upgrade.

14 years agoBump XLOG_PAGE_MAGIC.
Robert Haas [Wed, 29 Dec 2010 12:19:21 +0000 (07:19 -0500)]
Bump XLOG_PAGE_MAGIC.

The unlogged tables patch (commit 53dbc27c62d8e1b6c5253feba04a5094cb8fe046,
2010-12-29) should have done this, since it changes the format of an
XLOG_SMGR_CREATE record.

14 years agoSupport unlogged tables.
Robert Haas [Wed, 29 Dec 2010 11:48:53 +0000 (06:48 -0500)]
Support unlogged tables.

The contents of an unlogged table are WAL-logged; thus, they are not
available on standby servers and are truncated whenever the database
system enters recovery.  Indexes on unlogged tables are also unlogged.
Unlogged GiST indexes are not currently supported.

14 years agoAdd REPLICATION privilege for ROLEs
Magnus Hagander [Wed, 29 Dec 2010 10:05:03 +0000 (11:05 +0100)]
Add REPLICATION privilege for ROLEs

This privilege is required to do Streaming Replication, instead of
superuser, making it possible to set up a SR slave that doesn't
have write permissions on the master.

Superuser privileges do NOT override this check, so in order to
use the default superuser account for replication it must be
explicitly granted the REPLICATION permissions. This is backwards
incompatible change, in the interest of higher default security.

14 years agoAvoid unexpected conversion overflow in planner for distant date values.
Tom Lane [Wed, 29 Dec 2010 03:49:57 +0000 (22:49 -0500)]
Avoid unexpected conversion overflow in planner for distant date values.

The "date" type supports a wider range of dates than int64 timestamps do.
However, there is pre-int64-timestamp code in the planner that assumes that
all date values can be converted to timestamp with impunity.  Fortunately,
what we really need out of the conversion is always a double (float8)
value; so even when the date is out of timestamp's range it's possible to
produce a sane answer.  All we need is a code path that doesn't try to
force the result into int64.  Per trouble report from David Rericha.

Back-patch to all supported versions.  Although this is surely a corner
case, there's not much point in advertising a date range wider than
timestamp's if we will choke on such values in unexpected places.

14 years agoReclassify DEFAULT as a column_constraint item in the CREATE TABLE syntax.
Tom Lane [Wed, 29 Dec 2010 02:38:05 +0000 (21:38 -0500)]
Reclassify DEFAULT as a column_constraint item in the CREATE TABLE syntax.

This is how it was documented originally, but several years ago somebody
decided that DEFAULT isn't a type of constraint.  Well, the grammar thinks
it is.  The documentation was wrong in two ways: it alleged that DEFAULT
had to appear before any other kind of constraint, and it alleged that you
can't prefix a DEFAULT clause with a "CONSTRAINT name" clause, when in fact
you can.  (The latter behavior probably isn't SQL-standard, but our grammar
has always allowed it.)

This patch responds to Fujii Masao's observation that the ALTER TABLE
documentation mistakenly implied that you couldn't include DEFAULT in
ALTER TABLE ADD COLUMN; though this isn't the way he proposed fixing it.

14 years agoNo release notes update, just advance the date REL9_1_ALPHA3
Peter Eisentraut [Tue, 28 Dec 2010 19:19:17 +0000 (21:19 +0200)]
No release notes update, just advance the date

14 years agoFix ill-advised placement of PGRES_COPY_BOTH enum value.
Tom Lane [Tue, 28 Dec 2010 16:02:10 +0000 (11:02 -0500)]
Fix ill-advised placement of PGRES_COPY_BOTH enum value.

It must be added at the end of the ExecStatusType enum to avoid ABI
breakage compared to previous libpq versions.  Noted by Magnus.

14 years agoAnother fix for larger postmaster.pid files.
Bruce Momjian [Tue, 28 Dec 2010 14:34:11 +0000 (09:34 -0500)]
Another fix for larger postmaster.pid files.

14 years agoFix list of functions that are restricted to superusers
Magnus Hagander [Tue, 28 Dec 2010 09:46:03 +0000 (10:46 +0100)]
Fix list of functions that are restricted to superusers

Move the list of what's restricted to superusers into the table
itself, so it doesn't get missed again.

14 years agoFix code to properly pull out shared memory key now that the
Bruce Momjian [Tue, 28 Dec 2010 04:11:33 +0000 (23:11 -0500)]
Fix code to properly pull out shared memory key now that the
postmaster.pid file is larger than in previous major versions.
This is a bug introduced when I added lines to the file recently.

14 years agoMark unaccent functions as STABLE, rather than defaulting to VOLATILE.
Bruce Momjian [Mon, 27 Dec 2010 20:34:42 +0000 (15:34 -0500)]
Mark unaccent functions as STABLE, rather than defaulting to VOLATILE.

14 years agoUpdate SGML docs describing the contents of the postmaster.pid file,
Bruce Momjian [Mon, 27 Dec 2010 20:19:53 +0000 (15:19 -0500)]
Update SGML docs describing the contents of the postmaster.pid file,
per change to the file for pg_ctl.

14 years agoRemove -fno-operator-names switch from cpluspluscheck.
Tom Lane [Mon, 27 Dec 2010 20:03:24 +0000 (15:03 -0500)]
Remove -fno-operator-names switch from cpluspluscheck.

No longer needed now that bitand() and bitor() have been renamed.

14 years agoRename the C functions bitand(), bitor() to bit_and(), bit_or().
Tom Lane [Mon, 27 Dec 2010 19:57:41 +0000 (14:57 -0500)]
Rename the C functions bitand(), bitor() to bit_and(), bit_or().

This is to avoid use of the C++ keywords "bitand" and "bitor" in
the header file utils/varbit.h.  Note the functions' SQL-level
names are not changed, only their C-level names.

In passing, make some comments in varbit.c conform to project-standard
layout.

14 years agoRearrange cpluspluscheck to check just one .h file at a time.
Tom Lane [Mon, 27 Dec 2010 17:51:44 +0000 (12:51 -0500)]
Rearrange cpluspluscheck to check just one .h file at a time.

This is slower than the original coding but avoids the problem of
including files in an unpredictable order.  Aside from being more
trustworthy, we can get rid of some exclusions that were formerly
made for what turn out to be ordering or re-inclusion problems.

I also modified it to include libpq's exported files in the check.
ecpg should be included as well, but I'm unclear on which ecpg .h
files are meant to be included by clients.

14 years agoFix failure of executor/hashjoin.h to compile standalone.
Tom Lane [Mon, 27 Dec 2010 17:20:09 +0000 (12:20 -0500)]
Fix failure of executor/hashjoin.h to compile standalone.

Noted while experimenting with cpluspluscheck.

14 years agoTweak cpluspluscheck to avoid directly #include'ing gram.h.
Tom Lane [Mon, 27 Dec 2010 16:36:52 +0000 (11:36 -0500)]
Tweak cpluspluscheck to avoid directly #include'ing gram.h.

gram.h has ordering dependencies, which are satisfied when it's included
from gramparse.h, but might not be if it's pulled in directly.

14 years agoFix ill-chosen use of "private" as an argument and struct field name.
Tom Lane [Mon, 27 Dec 2010 16:26:19 +0000 (11:26 -0500)]
Fix ill-chosen use of "private" as an argument and struct field name.

"private" is a keyword in C++, so this breaks the poorly-enforced policy
that header files should be include-able in C++ code.  Per report from
Craig Ringer and some investigation with cpluspluscheck.

14 years agoBreak up long line, per Leslie S Satenstein.
Alvaro Herrera [Mon, 27 Dec 2010 15:36:22 +0000 (12:36 -0300)]
Break up long line, per Leslie S Satenstein.

14 years agoCorrections to patch adding SQL/MED error codes.
Robert Haas [Mon, 27 Dec 2010 02:32:07 +0000 (21:32 -0500)]
Corrections to patch adding SQL/MED error codes.

My previous commit, 85cff3ce7f360d139d87aee836d75a6202fee066 on
2010-12-25, failed to update errcodes.sgml or plerrcodes.h.  This patch
corrects that oversight, per a gripe from Tom Lane, and also corrects
a typographical error.

14 years agoOnly build in crashdump support on Windows if there's a working dbghelp.h.
Andrew Dunstan [Sun, 26 Dec 2010 15:34:47 +0000 (10:34 -0500)]
Only build in crashdump support on Windows if there's a working dbghelp.h.

14 years agoAdd foreign data wrapper error code values for SQL/MED.
Robert Haas [Sat, 25 Dec 2010 18:55:58 +0000 (13:55 -0500)]
Add foreign data wrapper error code values for SQL/MED.

Extracted from a much larger patch by Shigeru Hanada.

14 years agoCorrect spelling: longjump() -> longjmp().
Robert Haas [Sat, 25 Dec 2010 03:21:50 +0000 (22:21 -0500)]
Correct spelling: longjump() -> longjmp().

14 years agoFix grammar
Peter Eisentraut [Fri, 24 Dec 2010 20:08:07 +0000 (22:08 +0200)]
Fix grammar

14 years agoAllow vpath builds and regression tests to succeed on Mingw. Backpatch to release...
Andrew Dunstan [Fri, 24 Dec 2010 18:31:28 +0000 (13:31 -0500)]
Allow vpath builds and regression tests to succeed on Mingw. Backpatch to release 8.4 - earlier releases would require more changes and it's not worth the trouble.

14 years agoRemove quotes from boolean recovery.conf.sample parameters, now that the
Bruce Momjian [Fri, 24 Dec 2010 16:51:51 +0000 (11:51 -0500)]
Remove quotes from boolean recovery.conf.sample parameters, now that the
quotes are not required.  This now matches postgresql.conf's
specification of booleans.

14 years agoImprove "pg_ctl -w start" server detection by writing the postmaster
Bruce Momjian [Fri, 24 Dec 2010 14:45:15 +0000 (09:45 -0500)]
Improve "pg_ctl -w start" server detection by writing the postmaster
port and socket directory into postmaster.pid, and have pg_ctl read from
that file, for use by PQping().

14 years agoMove the documentation of --no-security-label to a more sensible place
Peter Eisentraut [Fri, 24 Dec 2010 12:11:11 +0000 (14:11 +0200)]
Move the documentation of --no-security-label to a more sensible place

The order on the pg_dump/pg_dumpall man pages is not very strict, but
surely putting it under connection options was wrong.

14 years agoRelease notes for 9.1alpha3
Peter Eisentraut [Fri, 24 Dec 2010 11:49:47 +0000 (13:49 +0200)]
Release notes for 9.1alpha3

14 years agoDocument pg_dump(all) --no-security-label instead of --security-label.
Robert Haas [Fri, 24 Dec 2010 04:22:40 +0000 (23:22 -0500)]
Document pg_dump(all) --no-security-label instead of --security-label.

The former is the option actually supported by these commands.

14 years agoAdded rule to ecpg lexer to accept "Unicode surrogate pair in extended quoted
Michael Meskes [Thu, 23 Dec 2010 11:41:12 +0000 (12:41 +0100)]
Added rule to ecpg lexer to accept "Unicode surrogate pair in extended quoted
string". This is not really needed because the string gets copied to the output
untranslated anyway, but by adding this rule the lexer stays in sync with the
backend lexer.

14 years agoRewrite the GiST insertion logic so that we don't need the post-recovery
Heikki Linnakangas [Thu, 23 Dec 2010 14:03:08 +0000 (16:03 +0200)]
Rewrite the GiST insertion logic so that we don't need the post-recovery
cleanup stage to finish incomplete inserts or splits anymore. There was two
reasons for the cleanup step:

1. When a new tuple was inserted to a leaf page, the downlink in the parent
needed to be updated to contain (ie. to be consistent with) the new key.
Updating the parent in turn might require recursively updating the parent of
the parent. We now handle that by updating the parent while traversing down
the tree, so that when we insert the leaf tuple, all the parents are already
consistent with the new key, and the tree is consistent at every step.

2. When a page is split, we need to insert the downlink for the new right
page(s), and update the downlink for the original page to not include keys
that moved to the right page(s). We now handle that by setting a new flag,
F_FOLLOW_RIGHT, on the non-rightmost pages in the split. When that flag is
set, scans always follow the rightlink, regardless of the NSN mechanism used
to detect concurrent page splits. That way the tree is consistent right after
split, even though the downlink is still missing. This is very similar to the
way B-tree splits are handled. When the downlink is inserted in the parent,
the flag is cleared. To keep the insertion algorithm simple, when an
insertion sees an incomplete split, indicated by the F_FOLLOW_RIGHT flag, it
finishes the split before doing anything else.

These changes allow removing the whole "invalid tuple" mechanism, but I
retained the scan code to still follow invalid tuples correctly. While we
don't create any such tuples anymore, we want to handle them gracefully in
case you pg_upgrade a GiST index that has them. If we encounter any on an
insert, though, we just throw an error saying that you need to REINDEX.

The issue that got me into doing this is that if you did a checkpoint while
an insert or split was in progress, and the checkpoint finishes quickly so
that there is no WAL record related to the insert between RedoRecPtr and the
checkpoint record, recovery from that checkpoint would not know to finish
the incomplete insert. IOW, we have the same issue we solved with the
rm_safe_restartpoint mechanism during normal operation too. It's highly
unlikely to happen in practice, and this fix is far too large to backpatch,
so we're just going to live with in previous versions, but this refactoring
fixes it going forward.

With this patch, you don't get the annoying
'index "FOO" needs VACUUM or REINDEX to finish crash recovery' notices
anymore if you crash at an unfortunate moment.

14 years agoDocument that BBU's do not allow partial page writes to be safely turned
Bruce Momjian [Thu, 23 Dec 2010 02:12:00 +0000 (21:12 -0500)]
Document that BBU's do not allow partial page writes to be safely turned
off unless they guarantee that all writes to the BBU arrive in 8kB chunks.

Per discussion with Greg Smith

14 years agoTypo fix.
Robert Haas [Wed, 22 Dec 2010 14:33:34 +0000 (09:33 -0500)]
Typo fix.

Noted by Thom Brown.

14 years agoWording improvements for pg_ctl manual page.
Bruce Momjian [Wed, 22 Dec 2010 14:11:33 +0000 (09:11 -0500)]
Wording improvements for pg_ctl manual page.

14 years agoAdd PQlibVersion() function to libpq
Magnus Hagander [Wed, 22 Dec 2010 13:23:56 +0000 (14:23 +0100)]
Add PQlibVersion() function to libpq

This function is like the PQserverVersion() function except
it returns the version of libpq, making it possible for a client
program or driver to determine which version of libpq is in
use at runtime, and not just at link time.

Suggested by Harald Armin Massa and several others.

14 years agoUse memcmp() rather than strncmp() when shorter string length is known.
Robert Haas [Wed, 22 Dec 2010 03:11:40 +0000 (22:11 -0500)]
Use memcmp() rather than strncmp() when shorter string length is known.

It appears that this will be faster for all but the shortest strings;
at least one some platforms, memcmp() can use word-at-a-time comparisons.

Noah Misch, somewhat pared down.

14 years agoFix typos.
Robert Haas [Tue, 21 Dec 2010 22:57:35 +0000 (17:57 -0500)]
Fix typos.

Andreas Karlsson

14 years agoWork around unfortunate getppid() behavior on BSD-ish systems.
Robert Haas [Tue, 21 Dec 2010 11:30:32 +0000 (06:30 -0500)]
Work around unfortunate getppid() behavior on BSD-ish systems.

On MacOS X, and apparently also on other BSD-derived systems, attaching
a debugger causes getppid() to return the pid of the debugging process
rather than the actual parent PID.  As a result, debugging the
autovacuum launcher, startup process, or WAL sender on such systems
causes it to exit, because the previous coding of PostmasterIsAlive()
detects postmaster death by testing whether getppid() == PostmasterPid.

Work around that behavior by checking the return value of getppid()
more carefully.  If it's PostmasterPid, the postmaster must be alive;
if it's 1, assume the postmaster is dead.  If it's any other value,
assume we've been debugged and fall through to the less-reliable
kill() test.

Review by Tom Lane.

14 years agoAllow transactions that don't write WAL to commit asynchronously.
Robert Haas [Mon, 20 Dec 2010 17:59:33 +0000 (12:59 -0500)]
Allow transactions that don't write WAL to commit asynchronously.

This case can arise if a transaction has written data, but only to
temporary tables.  Loss of the commit record in case of a crash won't
matter, because the temporary tables will be lost anyway.

Reviewed by Heikki Linnakangas and Simon Riggs.

14 years agoFix typo
Alvaro Herrera [Mon, 20 Dec 2010 15:05:12 +0000 (12:05 -0300)]
Fix typo

Jaime Casanova

14 years agoRemove thread dumping constant that requires newer Platform SDK
Magnus Hagander [Sun, 19 Dec 2010 20:31:23 +0000 (21:31 +0100)]
Remove thread dumping constant that requires newer Platform SDK

Since we're not multithreaded it only provides marginally useful
information, and it does require a newer version of the Platform SDK
than we target. We may want to reconsider this in the future along
with a fix for MinGW.

14 years agoFix up handling of simple-form CASE with constant test expression.
Tom Lane [Sun, 19 Dec 2010 20:30:44 +0000 (15:30 -0500)]
Fix up handling of simple-form CASE with constant test expression.

eval_const_expressions() can replace CaseTestExprs with constants when
the surrounding CASE's test expression is a constant.  This confuses
ruleutils.c's heuristic for deparsing simple-form CASEs, leading to
Assert failures or "unexpected CASE WHEN clause" errors.  I had put in
a hack solution for that years ago (see commit
514ce7a331c5bea8e55b106d624e55732a002295 of 2006-10-01), but bug #5794
from Peter Speck shows that that solution failed to cover all cases.

Fortunately, there's a much better way, which came to me upon reflecting
that Peter's "CASE TRUE WHEN" seemed pretty redundant: we can "simplify"
the simple-form CASE to the general form of CASE, by simply omitting the
constant test expression from the rebuilt CASE construct.  This is
intuitively valid because there is no need for the executor to evaluate
the test expression at runtime; it will never be referenced, because any
CaseTestExprs that would have referenced it are now replaced by constants.
This won't save a whole lot of cycles, since evaluating a Const is pretty
cheap, but a cycle saved is a cycle earned.  In any case it beats kluging
ruleutils.c still further.  So this patch improves const-simplification
and reverts the previous change in ruleutils.c.

Back-patch to all supported branches.  The bug exists in 8.1 too, but it's
out of warranty.

14 years agoFix erroneous parsing of tsquery input "... & !(subexpression) | ..."
Tom Lane [Sun, 19 Dec 2010 17:48:34 +0000 (12:48 -0500)]
Fix erroneous parsing of tsquery input "... & !(subexpression) | ..."

After parsing a parenthesized subexpression, we must pop all pending
ANDs and NOTs off the stack, just like the case for a simple operand.
Per bug #5793.

Also fix clones of this routine in contrib/intarray and contrib/ltree,
where input of types query_int and ltxtquery had the same problem.

Back-patch to all supported versions.

14 years agoSupport for collecting crash dumps on Windows
Magnus Hagander [Sun, 19 Dec 2010 15:45:28 +0000 (16:45 +0100)]
Support for collecting crash dumps on Windows

Add support for collecting "minidump" style crash dumps on
Windows, by setting up an exception handling filter. Crash
dumps will be generated in PGDATA/crashdumps if the directory
is created (the existance of the directory is used as on/off
switch for the generation of the dumps).

Craig Ringer and Magnus Hagander

14 years agoProperly print the IP number and "localhost" for failed localhost
Bruce Momjian [Sat, 18 Dec 2010 16:25:41 +0000 (11:25 -0500)]
Properly print the IP number and "localhost" for failed localhost
connections when the server is down, on Win32.

14 years agoMake GUC variables for syslog and SSL always visible
Magnus Hagander [Sat, 18 Dec 2010 15:53:59 +0000 (16:53 +0100)]
Make GUC variables for syslog and SSL always visible

Make the variables visible (but not used) even when
support is not compiled in.

14 years agoset_ps_display when calling functions via fastpath
Alvaro Herrera [Fri, 17 Dec 2010 21:51:22 +0000 (18:51 -0300)]
set_ps_display when calling functions via fastpath

This improves tag output by log_line_prefix

14 years agoRemove unnecessary definition for autovacuum in SignalSomeChildren.
Alvaro Herrera [Fri, 17 Dec 2010 18:56:54 +0000 (15:56 -0300)]
Remove unnecessary definition for autovacuum in SignalSomeChildren.

14 years agoTry to save a kernel call in ResolveRecoveryConflictWithVirtualXIDs.
Robert Haas [Fri, 17 Dec 2010 16:32:02 +0000 (11:32 -0500)]
Try to save a kernel call in ResolveRecoveryConflictWithVirtualXIDs.

If there's no work to be done, just exit quickly, before initialization.

14 years agoReset 'ps' display just once when resolving VXID conflicts.
Robert Haas [Fri, 17 Dec 2010 13:30:57 +0000 (08:30 -0500)]
Reset 'ps' display just once when resolving VXID conflicts.

This prevents the word "waiting" from briefly disappearing from the ps
status line when ResolveRecoveryConflictWithVirtualXIDs begins a new
iteration of the outer loop.

Along the way, remove some useless pgstat_report_waiting() calls;
the startup process doesn't appear in pg_stat_activity.

Fujii Masao

14 years agoWaiting for complete startup is now a well-defined operation.
Robert Haas [Fri, 17 Dec 2010 01:57:33 +0000 (20:57 -0500)]
Waiting for complete startup is now a well-defined operation.

Per report from Fujii Masao, and subsequent discussion.

14 years agoImprove comments around startup_hacks() code.
Tom Lane [Thu, 16 Dec 2010 22:57:57 +0000 (17:57 -0500)]
Improve comments around startup_hacks() code.

These comments were not updated when we added the EXEC_BACKEND
mechanism for Windows, even though it rendered them inaccurate.

Also unify two unnecessarily-separate #ifdef __alpha code blocks.

14 years agoRemove optreset from src/port/ implementations of getopt and getopt_long.
Tom Lane [Thu, 16 Dec 2010 21:22:05 +0000 (16:22 -0500)]
Remove optreset from src/port/ implementations of getopt and getopt_long.

We don't actually need optreset, because we can easily fix the code to
ensure that it's cleanly restartable after having completed a scan over the
argv array; which is the only case we need to restart in.  Getting rid of
it avoids a class of interactions with the system libraries and allows
reversion of my change of yesterday in postmaster.c and postgres.c.

Back-patch to 8.4.  Before that the getopt code was a bit different anyway.

14 years agoAvoid clobbering errno, per comment from Tom.
Alvaro Herrera [Thu, 16 Dec 2010 20:15:37 +0000 (17:15 -0300)]
Avoid clobbering errno, per comment from Tom.

14 years agoFix inconsequential FILE pointer leakage
Alvaro Herrera [Thu, 16 Dec 2010 19:45:11 +0000 (16:45 -0300)]
Fix inconsequential FILE pointer leakage

14 years agoAdd some minor missing error checks
Alvaro Herrera [Thu, 16 Dec 2010 15:22:08 +0000 (12:22 -0300)]
Add some minor missing error checks

14 years agoSimplify SignalSomeChildren(BACKEND_TYPE_ALL) to SignalChildren()
Alvaro Herrera [Thu, 16 Dec 2010 15:20:38 +0000 (12:20 -0300)]
Simplify SignalSomeChildren(BACKEND_TYPE_ALL) to SignalChildren()

14 years agoFix crash caused by NULL lookup when reporting IP address of failed
Bruce Momjian [Thu, 16 Dec 2010 15:13:43 +0000 (10:13 -0500)]
Fix crash caused by NULL lookup when reporting IP address of failed
libpq connection, per report from Magnus.  This happens only on GIT
master and only on Win32 because that is the platform where "" maps to
an IP address (localhost).

14 years agoFix up getopt() reset management so it works on recent mingw.
Tom Lane [Thu, 16 Dec 2010 04:50:41 +0000 (23:50 -0500)]
Fix up getopt() reset management so it works on recent mingw.

The mingw people don't appear to care about compatibility with non-GNU
versions of getopt, so force use of our own copy of getopt on Windows.
Also, ensure that we make use of optreset when using our own copy.

Per report from Andrew Dunstan.  Back-patch to all versions supported
on Windows.

14 years agoFix contrib/seg's GiST picksplit method.
Tom Lane [Thu, 16 Dec 2010 02:14:24 +0000 (21:14 -0500)]
Fix contrib/seg's GiST picksplit method.

This patch replaces Guttman's generalized split method with a simple
sort-by-center-points algorithm.  Since the data is only one-dimensional
we don't really need the slow and none-too-stable Guttman method.

This is in part a bug fix, since seg has the same size_alpha versus
size_beta typo that was recently fixed in contrib/cube.  It seems
prudent to apply this rather aggressive fix only in HEAD, though.
Back branches will just get the typo fix.

Alexander Korotkov, reviewed by Yeb Havinga

14 years agoSome copy editing of pg_read_binary_file() patch.
Robert Haas [Thu, 16 Dec 2010 02:02:31 +0000 (21:02 -0500)]
Some copy editing of pg_read_binary_file() patch.

14 years agoDocument timestamptz a little better.
Robert Haas [Thu, 16 Dec 2010 01:52:31 +0000 (20:52 -0500)]
Document timestamptz a little better.

14 years agoAdd pg_read_binary_file() and whole-file-at-once versions of pg_read_file().
Itagaki Takahiro [Wed, 15 Dec 2010 21:56:28 +0000 (06:56 +0900)]
Add pg_read_binary_file() and whole-file-at-once versions of pg_read_file().
One of the usages of the binary version is to read files in a different
encoding from the server encoding.

Dimitri Fontaine and Itagaki Takahiro.

14 years agoUse "upgrade" in preference over "migrate" in pg_upgrade messages and
Bruce Momjian [Wed, 15 Dec 2010 12:11:31 +0000 (07:11 -0500)]
Use "upgrade" in preference over "migrate" in pg_upgrade messages and
documentation.  (Many were left over from the old pg_migrator naming.)

14 years agoInstrument checkpoint sync calls.
Robert Haas [Tue, 14 Dec 2010 14:25:25 +0000 (09:25 -0500)]
Instrument checkpoint sync calls.

Greg Smith, reviewed by Jeff Janes

14 years agoImproved tab completion for views with triggers.
Robert Haas [Tue, 14 Dec 2010 03:37:55 +0000 (22:37 -0500)]
Improved tab completion for views with triggers.

Allow INSERT INTO, UPDATE, and DELETE FROM to be completed with
either the name of a table (as before) or the name of a view with
an appropriate INSTEAD OF rule.

Along the way, allow CREATE TRIGGER to be completed with INSTEAD OF,
as well as BEFORE and AFTER.

David Fetter, reviewed by Itagaki Takahiro

14 years agoUpdate release notes for releases 9.0.2, 8.4.6, 8.3.13, 8.2.19, and 8.1.23.
Tom Lane [Tue, 14 Dec 2010 01:21:51 +0000 (20:21 -0500)]
Update release notes for releases 9.0.2, 8.4.6, 8.3.13, 8.2.19, and 8.1.23.

14 years agoAllow plugins to suppress inlining and hook function entry/exit/abort.
Robert Haas [Mon, 13 Dec 2010 23:58:31 +0000 (18:58 -0500)]
Allow plugins to suppress inlining and hook function entry/exit/abort.

This is intended as infrastructure to allow an eventual SE-Linux plugin to
support trusted procedures.

KaiGai Kohei

14 years agoRemove recently reintroduced CVS keyword
Peter Eisentraut [Mon, 13 Dec 2010 21:22:52 +0000 (23:22 +0200)]
Remove recently reintroduced CVS keyword

14 years agoDocument replacement of pg_class.relistemp with relpersistence.
Robert Haas [Mon, 13 Dec 2010 18:07:08 +0000 (13:07 -0500)]
Document replacement of pg_class.relistemp with relpersistence.

Noted by Tom Lane.

14 years agoUpdate time zone data files to tzdata release 2010o: DST law changes in
Tom Lane [Mon, 13 Dec 2010 17:41:57 +0000 (12:41 -0500)]
Update time zone data files to tzdata release 2010o: DST law changes in
Fiji and Samoa.  Historical corrections for Hong Kong.

14 years agoGeneralize concept of temporary relations to "relation persistence".
Robert Haas [Mon, 13 Dec 2010 17:34:26 +0000 (12:34 -0500)]
Generalize concept of temporary relations to "relation persistence".

This commit replaces pg_class.relistemp with pg_class.relpersistence;
and also modifies the RangeVar node type to carry relpersistence rather
than istemp.  It also removes removes rd_istemp from RelationData and
instead performs the correct computation based on relpersistence.

For clarity, we add three new macros: RelationNeedsWAL(),
RelationUsesLocalBuffers(), and RelationUsesTempNamespace(), so that we
can clarify the purpose of each check that previous depended on
rd_istemp.

This is intended as infrastructure for the upcoming unlogged tables
patch, as well as for future possible work on global temporary tables.

14 years agoReset all database-level stats in pgstat_recv_resetcounter().
Tom Lane [Sun, 12 Dec 2010 20:09:53 +0000 (15:09 -0500)]
Reset all database-level stats in pgstat_recv_resetcounter().

We were failing to zero out some pg_stat_database counters that have
been added since the initial pgstats coding.  This is a bug, but not
back-patching the fix since changing this behavior in a minor release
seems a cure worse than the disease.

Report and patch by Tomas Vondra.

14 years agoMake S_IRGRP etc available in mingw builds as well as MSVC.
Tom Lane [Sun, 12 Dec 2010 18:43:44 +0000 (13:43 -0500)]
Make S_IRGRP etc available in mingw builds as well as MSVC.

(Hm, I wonder whether BCC defines them either...)

Also label dangling endifs a bit better in this area.

14 years agoClean up some copied-and-pasted code in pg_upgrade.
Tom Lane [Sat, 11 Dec 2010 19:17:46 +0000 (14:17 -0500)]
Clean up some copied-and-pasted code in pg_upgrade.

1. Don't reimplement S_ISDIR() and S_ISREG() badly.
2. Don't reimplement access() badly.

This code appears to have been copied from ancient versions of the
corresponding backend routines, and not patched to incorporate subsequent
fixes (see my commits of 2008-03-31 and 2010-01-14 respectively).
It might be a good idea to change it to just *call* those routines,
but for now I'll just transpose these fixes over.

14 years agoProvide a complete set of file-permission-bit macros in win32.h.
Tom Lane [Sat, 11 Dec 2010 18:11:18 +0000 (13:11 -0500)]
Provide a complete set of file-permission-bit macros in win32.h.

My previous patch exposed the fact that we didn't have these.  Those
hard-wired octal constants were actually wrong on Windows, not just
inconsistent.

14 years agoAllow bidirectional copy messages in streaming replication mode.
Robert Haas [Sat, 11 Dec 2010 14:27:37 +0000 (09:27 -0500)]
Allow bidirectional copy messages in streaming replication mode.

Fujii Masao.  Review by Alvaro Herrera, Tom Lane, and myself.

14 years agoAdd required new port files to MSVC builds.
Magnus Hagander [Sat, 11 Dec 2010 13:06:38 +0000 (14:06 +0100)]
Add required new port files to MSVC builds.

14 years agoMinor documentation cleanup.
Robert Haas [Sat, 11 Dec 2010 04:22:50 +0000 (23:22 -0500)]
Minor documentation cleanup.

Fujii Masao

14 years agoMove a couple of initdb's subroutines into src/port/.
Tom Lane [Sat, 11 Dec 2010 00:42:44 +0000 (19:42 -0500)]
Move a couple of initdb's subroutines into src/port/.

mkdir_p and check_data_dir will be useful in CREATE TABLESPACE, since we
have agreed that that command should handle subdirectory creation just like
initdb creates the PGDATA directory.  Push them into src/port/ so that they
are available to both initdb and the backend.  Rename to pg_mkdir_p and
pg_check_dir, just to be on the safe side.  Add FreeBSD's copyright notice
to pgmkdirp.c, since that's where the code came from originally (this
really should have been in initdb.c).  Very marginal code/comment cleanup.

14 years agoUse symbolic names not octal constants for file permission flags.
Tom Lane [Fri, 10 Dec 2010 22:35:33 +0000 (17:35 -0500)]
Use symbolic names not octal constants for file permission flags.

Purely cosmetic patch to make our coding standards more consistent ---
we were doing symbolic some places and octal other places.  This patch
fixes all C-coded uses of mkdir, chmod, and umask.  There might be some
other calls I missed.  Inconsistency noted while researching tablespace
directory permissions issue.

14 years agoFix efficiency problems in tuplestore_trim().
Tom Lane [Fri, 10 Dec 2010 16:33:38 +0000 (11:33 -0500)]
Fix efficiency problems in tuplestore_trim().

The original coding in tuplestore_trim() was only meant to work efficiently
in cases where each trim call deleted most of the tuples in the store.
Which, in fact, was the pattern of the original usage with a Material node
supporting mark/restore operations underneath a MergeJoin.  However,
WindowAgg now uses tuplestores and it has considerably less friendly
trimming behavior.  In particular it can attempt to trim one tuple at a
time off a large tuplestore.  tuplestore_trim() had O(N^2) runtime in this
situation because of repeatedly shifting its tuple pointer array.  Fix by
avoiding shifting the array until a reasonably large number of tuples have
been deleted.  This can waste some pointer space, but we do still reclaim
the tuples themselves, so the percentage wastage should be pretty small.

Per Jie Li's report of slow percent_rank() evaluation.  cume_dist() and
ntile() would certainly be affected as well, along with any other window
function that has a moving frame start and requires reading substantially
ahead of the current row.

Back-patch to 8.4, where window functions were introduced.  There's no
need to tweak it before that.

14 years agoEliminate O(N^2) behavior in parallel restore with many blobs.
Tom Lane [Thu, 9 Dec 2010 18:03:11 +0000 (13:03 -0500)]
Eliminate O(N^2) behavior in parallel restore with many blobs.

With hundreds of thousands of TOC entries, the repeated searches in
reduce_dependencies() become the dominant cost.  Get rid of that searching
by constructing reverse-dependency lists, which we can do in O(N) time
during the fix_dependencies() preprocessing.  I chose to store the reverse
dependencies as DumpId arrays for consistency with the forward-dependency
representation, and keep the previously-transient tocsByDumpId[] array
around to locate actual TOC entry structs quickly from dump IDs.

While this fixes the slow case reported by Vlad Arkhipov, there is still
a potential for O(N^2) behavior with sufficiently many tables:
fix_dependencies itself, as well as mark_create_done and
inhibit_data_for_failed_table, are doing repeated searches to deal with
table-to-table-data dependencies.  Possibly this work could be extended
to deal with that, although the latter two functions are also used in
non-parallel restore where we currently don't run fix_dependencies.

Another TODO is that we fail to parallelize restore of multiple blobs
at all.  This appears to require changes in the archive format to fix.

Back-patch to 9.0 where the problem was reported.  8.4 has potential issues
as well; but since it doesn't create a separate TOC entry for each blob,
it's at much less risk of having enough TOC entries to cause real problems.

14 years agoSelf review of previous patch. Fix assumption that xmax >= xmin.
Simon Riggs [Thu, 9 Dec 2010 10:20:49 +0000 (10:20 +0000)]
Self review of previous patch. Fix assumption that xmax >= xmin.

14 years agoReduce spurious Hot Standby conflicts from never-visible records.
Simon Riggs [Thu, 9 Dec 2010 09:41:47 +0000 (09:41 +0000)]
Reduce spurious Hot Standby conflicts from never-visible records.
Hot Standby conflicts only with tuples that were visible at
some point. So ignore tuples from aborted transactions or for
tuples updated/deleted during the inserting transaction when
generating the conflict transaction ids.

Following detailed analysis and test case by Noah Misch.
Original report covered btree delete records, correctly observed
by Heikki Linnakangas that this applies to other cases also.
Fix covers all sources of cleanup records via common code.

14 years agoForce default wal_sync_method to be fdatasync on Linux.
Tom Lane [Thu, 9 Dec 2010 01:01:09 +0000 (20:01 -0500)]
Force default wal_sync_method to be fdatasync on Linux.

Recent versions of the Linux system header files cause xlogdefs.h to
believe that open_datasync should be the default sync method, whereas
formerly fdatasync was the default on Linux.  open_datasync is a bad
choice, first because it doesn't actually outperform fdatasync (in fact
the reverse), and second because we try to use O_DIRECT with it, causing
failures on certain filesystems (e.g., ext4 with data=journal option).
This part of the patch is largely per a proposal from Marti Raudsepp.
More extensive changes are likely to follow in HEAD, but this is as much
change as we want to back-patch.

Also clean up confusing code and incorrect documentation surrounding the
fsync_writethrough option.  Those changes shouldn't result in any actual
behavioral change, but I chose to back-patch them anyway to keep the
branches looking similar in this area.

In 9.0 and HEAD, also do some copy-editing on the WAL Reliability
documentation section.

Back-patch to all supported branches, since any of them might get used
on modern Linux versions.

14 years agoOptimize commit_siblings in two ways to improve group commit.
Simon Riggs [Wed, 8 Dec 2010 18:48:03 +0000 (18:48 +0000)]
Optimize commit_siblings in two ways to improve group commit.
First, avoid scanning the whole ProcArray once we know there
are at least commit_siblings active; second, skip the check
altogether if commit_siblings = 0.

Greg Smith

14 years agoFix bugs in the hot standby known-assigned-xids tracking logic. If there's
Heikki Linnakangas [Tue, 7 Dec 2010 08:23:30 +0000 (09:23 +0100)]
Fix bugs in the hot standby known-assigned-xids tracking logic. If there's
an old transaction running in the master, and a lot of transactions have
started and finished since, and a WAL-record is written in the gap between
the creating the running-xacts snapshot and WAL-logging it, recovery will fail
with "too many KnownAssignedXids" error. This bug was reported by
Joachim Wieland on Nov 19th.

In the same scenario, when fewer transactions have started so that all the
xids fit in KnownAssignedXids despite the first bug, a more serious bug
arises. We incorrectly initialize the clog code with the oldest still running
transaction, and when we see the WAL record belonging to a transaction with
an XID larger than one that committed already before the checkpoint we're
recovering from, we zero the clog page containing the already committed
transaction, leading to data loss.

In hindsight, trying to track xids in the known-assigned-xids array before
seeing the running-xacts record was too complicated. To fix that, hold
XidGenLock while the running-xacts snapshot is taken and WAL-logged. That
ensures that no transaction can begin or end in that gap, so that in recvoery
we know that the snapshot contains all transactions running at that point in
WAL.

14 years agoAdd a stack overflow check to copyObject().
Tom Lane [Tue, 7 Dec 2010 03:55:43 +0000 (22:55 -0500)]
Add a stack overflow check to copyObject().

There are some code paths, such as SPI_execute(), where we invoke
copyObject() on raw parse trees before doing parse analysis on them.  Since
the bison grammar is capable of building heavily nested parsetrees while
itself using only minimal stack depth, this means that copyObject() can be
the front-line function that hits stack overflow before anything else does.
Accordingly, it had better have a check_stack_depth() call.  I did a bit of
performance testing and found that this slows down copyObject() by only a
few percent, so the hit ought to be negligible in the context of complete
processing of a query.

Per off-list report from Toshihide Katayama.  Back-patch to all supported
branches.

14 years agoAllow the low level COPY routines to read arbitrary numbers of fields.
Andrew Dunstan [Mon, 6 Dec 2010 20:31:55 +0000 (15:31 -0500)]
Allow the low level COPY routines to read arbitrary numbers of fields.
This doesn't involve any user-visible change in behavior, but will be
useful when the COPY routines are exposed to allow their use by Foreign
Data Wrapper routines, which will be able to use these routines to read
irregular CSV files, for example.

14 years agoFix two typos, by Fujii Masao.
Heikki Linnakangas [Mon, 6 Dec 2010 11:36:26 +0000 (12:36 +0100)]
Fix two typos, by Fujii Masao.

14 years agoPut only single space after "Sort Method:", for consistency
Peter Eisentraut [Mon, 6 Dec 2010 11:35:47 +0000 (13:35 +0200)]
Put only single space after "Sort Method:", for consistency

14 years agoReduce memory consumption inside inheritance_planner().
Tom Lane [Sun, 5 Dec 2010 20:10:28 +0000 (15:10 -0500)]
Reduce memory consumption inside inheritance_planner().

Avoid eating quite so much memory for large inheritance trees, by
reclaiming the space used by temporary copies of the original parsetree and
range table, as well as the workspace needed during planning.  The cost is
needing to copy the finished plan trees out of the child memory context.
Although this looks like it ought to slow things down, my testing shows
it actually is faster, apparently because fewer interactions with malloc()
are needed and/or we can do the work within a more readily cacheable amount
of memory.  That result might be platform-dependent, but I'll take it.

Per a gripe from John Papandriopoulos, in which it was pointed out that the
memory consumption actually grew as O(N^2) for sufficiently many child
tables, since we were creating N copies of the N-element range table.