]> granicus.if.org Git - postgresql/log
postgresql
12 years agosyncrep.h must include xlogdefs.h
Alvaro Herrera [Tue, 28 Aug 2012 13:46:08 +0000 (09:46 -0400)]
syncrep.h must include xlogdefs.h

12 years agoSmall punctuation fixes
Peter Eisentraut [Tue, 28 Aug 2012 07:10:04 +0000 (03:10 -0400)]
Small punctuation fixes

12 years agoImprove a couple of 9.2 release note entries.
Tom Lane [Tue, 28 Aug 2012 00:54:00 +0000 (20:54 -0400)]
Improve a couple of 9.2 release note entries.

Clarify the compatibility notes about EXTRACT() and about statistics
timing columns.

12 years agoAdd section IDs to subsections of syntax.sgml that lacked them.
Tom Lane [Tue, 28 Aug 2012 00:17:16 +0000 (20:17 -0400)]
Add section IDs to subsections of syntax.sgml that lacked them.

This is so that these sections will have stable HTML tags that one can
link to, rather than things like "AEN1902".  Perhaps we should mount a
campaign to do this everywhere, but I've found myself pointing at
syntax.sgml subsections often enough to be sure it's useful here.

12 years agoFix DROP INDEX CONCURRENTLY IF EXISTS.
Tom Lane [Mon, 27 Aug 2012 16:45:51 +0000 (12:45 -0400)]
Fix DROP INDEX CONCURRENTLY IF EXISTS.

This threw ERROR, not the expected NOTICE, if the index didn't exist.
The bug was actually visible in not-as-expected regression test output,
so somebody wasn't paying too close attention in commit
8cb53654dbdb4c386369eb988062d0bbb6de725e.
Per report from Brendan Byrd.

12 years agopg_basebackup: Correct error message
Peter Eisentraut [Mon, 27 Aug 2012 04:49:39 +0000 (00:49 -0400)]
pg_basebackup: Correct error message

It still thought that the --xlog-method option argument could be
empty, as in a previous version of this feature.

12 years agoSome spelling adjustments in release notes
Peter Eisentraut [Sat, 25 Aug 2012 02:36:24 +0000 (22:36 -0400)]
Some spelling adjustments in release notes

12 years agoNormalize some British spellings
Peter Eisentraut [Sat, 25 Aug 2012 02:35:53 +0000 (22:35 -0400)]
Normalize some British spellings

12 years agoFix issues with checks for unsupported transaction states in Hot Standby.
Tom Lane [Fri, 24 Aug 2012 17:09:12 +0000 (13:09 -0400)]
Fix issues with checks for unsupported transaction states in Hot Standby.

The GUC check hooks for transaction_read_only and transaction_isolation
tried to check RecoveryInProgress(), so as to disallow setting read/write
mode or serializable isolation level (respectively) in hot standby
sessions.  However, GUC check hooks can be called in many situations where
we're not connected to shared memory at all, resulting in a crash in
RecoveryInProgress().  Among other cases, this results in EXEC_BACKEND
builds crashing during child process start if default_transaction_isolation
is serializable, as reported by Heikki Linnakangas.  Protect those calls
by silently allowing any setting when not inside a transaction; which is
okay anyway since these GUCs are always reset at start of transaction.

Also, add a check to GetSerializableTransactionSnapshot() to complain
if we are in hot standby.  We need that check despite the one in
check_XactIsoLevel() because default_transaction_isolation could be
serializable.  We don't want to complain any sooner than this in such
cases, since that would prevent running transactions at all in such a
state; but a transaction can be run, if SET TRANSACTION ISOLATION is done
before setting a snapshot.  Per report some months ago from Robert Haas.

Back-patch to 9.1, since these problems were introduced by the SSI patch.

Kevin Grittner and Tom Lane, with ideas from Heikki Linnakangas

12 years agoPut options on man page and in help output in slightly better order
Peter Eisentraut [Fri, 24 Aug 2012 04:06:59 +0000 (00:06 -0400)]
Put options on man page and in help output in slightly better order

12 years agolibpq: Fix memory leak in URI parser
Peter Eisentraut [Fri, 24 Aug 2012 02:33:04 +0000 (22:33 -0400)]
libpq: Fix memory leak in URI parser

When an invalid query parameter is reported, some memory leaks.

found by Coverity

12 years agoTranslation updates
Peter Eisentraut [Fri, 24 Aug 2012 01:24:06 +0000 (21:24 -0400)]
Translation updates

12 years agoStamp 9.2rc1. REL9_2_RC1
Tom Lane [Thu, 23 Aug 2012 22:06:49 +0000 (18:06 -0400)]
Stamp 9.2rc1.

12 years agoFix cascading privilege revoke to notice when privileges are still held.
Tom Lane [Thu, 23 Aug 2012 21:25:17 +0000 (17:25 -0400)]
Fix cascading privilege revoke to notice when privileges are still held.

If we revoke a grant option from some role X, but X still holds the option
via another grant, we should not recursively revoke the privilege from
role(s) Y that X had granted it to.  This was supposedly fixed as one
aspect of commit 4b2dafcc0b1a579ef5daaa2728223006d1ff98e9, but I must not
have tested it, because in fact that code never worked: it forgot to shift
the grant-option bits back over when masking the bits being revoked.

Per bug #6728 from Daniel German.  Back-patch to all active branches,
since this has been wrong since 8.0.

12 years agoFix typo in example.
Heikki Linnakangas [Thu, 23 Aug 2012 08:57:34 +0000 (11:57 +0300)]
Fix typo in example.

12 years agoRemove overly-pessimistic statement about constraint exclusion.
Tom Lane [Thu, 23 Aug 2012 03:55:34 +0000 (23:55 -0400)]
Remove overly-pessimistic statement about constraint exclusion.

As of 9.2, constraint exclusion should work okay with prepared statements:
the planner will try custom plans with actual values of the parameters,
and observe that they are a lot cheaper than the generic plan, and thus
never fall back to using the generic plan.  Noted by Tatsuhito Kasahara.

12 years agoMake a cut at a major-features list for 9.2.
Tom Lane [Wed, 22 Aug 2012 21:58:06 +0000 (17:58 -0400)]
Make a cut at a major-features list for 9.2.

This is open to debate of course, but it's past time we had *something*
here.

12 years agoMake an editorial pass over the 9.2 release notes.
Tom Lane [Wed, 22 Aug 2012 21:37:02 +0000 (17:37 -0400)]
Make an editorial pass over the 9.2 release notes.

A very large number of small improvements ...

12 years agoFix erroneous documentation of synchronous_commit = remote_write.
Tom Lane [Wed, 22 Aug 2012 18:04:02 +0000 (14:04 -0400)]
Fix erroneous documentation of synchronous_commit = remote_write.

The docs claimed that this mode only waits for the standby to receive WAL
data, but actually it waits for the data to be written out to the standby's
OS; which is a pretty significant difference because it removes the risk of
crash of the walreceiver process.

12 years agoUpdate 9.2 release notes to reflect commits to date.
Tom Lane [Wed, 22 Aug 2012 02:56:10 +0000 (22:56 -0400)]
Update 9.2 release notes to reflect commits to date.

I was unable to entirely resist the temptation to copy-edit related
entries, but will save most of that for a separate pass.

12 years agoFix dumping of security_barrier views with circular dependencies.
Tom Lane [Tue, 21 Aug 2012 19:18:36 +0000 (15:18 -0400)]
Fix dumping of security_barrier views with circular dependencies.

If a view has circular dependencies, pg_dump splits it into a CREATE TABLE
and a CREATE RULE command to break the dependency loop.  However, if the
view has reloptions, those options cannot be applied in the CREATE TABLE
command, because views and tables have different allowed reloptions so
CREATE TABLE would reject them.  Instead apply the reloptions after the
CREATE RULE, using ALTER VIEW SET.

12 years agoFix bugs in contrib/pg_trgm's LIKE pattern analysis code.
Tom Lane [Mon, 20 Aug 2012 17:24:58 +0000 (13:24 -0400)]
Fix bugs in contrib/pg_trgm's LIKE pattern analysis code.

Extraction of trigrams did not process LIKE escape sequences properly,
leading to possible misidentification of trigrams near escapes, resulting
in incorrect index search results.

Fujii Masao

12 years agoCheck LIBXML_VERSION instead of testing in configure script.
Tom Lane [Fri, 17 Aug 2012 04:05:33 +0000 (00:05 -0400)]
Check LIBXML_VERSION instead of testing in configure script.

We had put a test for libxml2's xmlStructuredErrorContext variable in
configure, but of course that doesn't work on Windows builds.  The next
best alternative seems to be to test the LIBXML_VERSION symbol provided
by xmlversion.h.

Per report from Talha Bin Rizwan, though this fixes it in a different way
than his proposed patch.

12 years agoAllow create_index_paths() to consider multiple join bitmapscan paths.
Tom Lane [Thu, 16 Aug 2012 17:04:03 +0000 (13:04 -0400)]
Allow create_index_paths() to consider multiple join bitmapscan paths.

In the initial cut at the "parameterized paths" feature, I'd simplified
create_index_paths() to the point where it would only generate a single
parameterized bitmap path per relation.  Experimentation with an example
supplied by Josh Berkus convinces me that that's not good enough: we really
need to consider a bitmap path for each possible outer relation.  Otherwise
we have regressions relative to pre-9.2 versions, in which the planner
picks a plain indexscan where it should have used a bitmap scan in queries
involving three or more tables.  Indeed, after fixing this, several queries
in the regression tests show improved plans as a result of using bitmap not
plain indexscans.

12 years agoFix GiST buffering build bug, which caused "failed to re-find parent" errors.
Heikki Linnakangas [Thu, 16 Aug 2012 09:42:11 +0000 (12:42 +0300)]
Fix GiST buffering build bug, which caused "failed to re-find parent" errors.

We use a hash table to track the parents of inner pages, but when inserting
to a leaf page, the caller of gistbufferinginserttuples() must pass a
correct block number of the leaf's parent page. Before gistProcessItup()
descends to a child page, it checks if the downlink needs to be adjusted to
accommodate the new tuple, and updates the downlink if necessary. However,
updating the downlink might require splitting the page, which might move the
downlink to a page to the right. gistProcessItup() doesn't realize that, so
when it descends to the leaf page, it might pass an out-of-date parent block
number as a result. Fix that by returning the block a tuple was inserted to
from gistbufferinginserttuples().

This fixes the bug reported by Zdeněk Jílovec.

12 years agoFix rescan logic in nodeCtescan.
Tom Lane [Wed, 15 Aug 2012 23:01:23 +0000 (19:01 -0400)]
Fix rescan logic in nodeCtescan.

The previous coding essentially assumed that nodes would be rescanned in
the same order they were initialized in; or at least that the "leader" of
a group of CTEscans would be rescanned before any others were required to
execute.  Unfortunately, that isn't even a little bit true.  It's possible
to devise queries in which the leader isn't rescanned until other CTEscans
on the same CTE have run to completion, or even in which the leader never
gets a rescan call at all.

The fix makes the leader specially responsible only for initial creation
and final destruction of the tuplestore; rescan resets are now a
symmetrically shared responsibility.  This means that we might reset the
tuplestore multiple times when restarting a plan subtree containing
multiple CTEscans; but resetting an already-empty tuplestore is cheap
enough that that doesn't seem like a problem.

Per report from Adam Mackler; the new regression test cases are based on
his example query.

Back-patch to 8.4 where CTE scans were introduced.

12 years agoDisallow extensions from owning the schema they are assigned to.
Tom Lane [Wed, 15 Aug 2012 15:27:00 +0000 (11:27 -0400)]
Disallow extensions from owning the schema they are assigned to.

This situation creates a dependency loop that confuses pg_dump and probably
other things.  Moreover, since the mental model is that the extension
"contains" schemas it owns, but "is contained in" its extschema (even
though neither is strictly true), having both true at once is confusing for
people too.  So prevent the situation from being set up.

Reported and patched by Thom Brown.  Back-patch to 9.1 where extensions
were added.

12 years agoResurrect the "last ditch" code path in join_search_one_level().
Tom Lane [Wed, 15 Aug 2012 04:07:15 +0000 (00:07 -0400)]
Resurrect the "last ditch" code path in join_search_one_level().

This essentially reverts commit e54b10a62db2991235fe800c629baef4531a6d67,
in which I'd decided that the "last ditch" join logic was useless.  The
folly of that is now exposed by a report from Pavel Stehule: although the
function should always find at least one join in a self-contained join
problem, it can still fail to do so in a sub-problem created by artificial
from_collapse_limit or join_collapse_limit constraints.  Adjust the
comments to describe this, and simplify the code a bit to match the new
coding of the earlier loop in the function.

I'm not terribly happy about this: I still subscribe to the opinion stated
in the previous commit message that the "last ditch" code can obscure logic
bugs elsewhere.  But the alternative seems to be to complicate the earlier
tests for does-this-relation-have-a-join-clause to the point where they can
tell whether the join clauses link outside the current join sub-problem.
And that looks messy, slow, and possibly a source of bugs in itself.
In any case, now is not the time to be inserting experimental code into
9.2, so let's just go back to the time-tested solution.

12 years agoStamp 9.2beta4. REL9_2_BETA4
Tom Lane [Tue, 14 Aug 2012 22:38:49 +0000 (18:38 -0400)]
Stamp 9.2beta4.

12 years agoUpdate release notes for 9.1.5, 9.0.9, 8.4.13, 8.3.20.
Tom Lane [Tue, 14 Aug 2012 22:24:11 +0000 (18:24 -0400)]
Update release notes for 9.1.5, 9.0.9, 8.4.13, 8.3.20.

12 years agoPrevent access to external files/URLs via contrib/xml2's xslt_process().
Tom Lane [Tue, 14 Aug 2012 22:28:37 +0000 (18:28 -0400)]
Prevent access to external files/URLs via contrib/xml2's xslt_process().

libxslt offers the ability to read and write both files and URLs through
stylesheet commands, thus allowing unprivileged database users to both read
and write data with the privileges of the database server.  Disable that
through proper use of libxslt's security options.

Also, remove xslt_process()'s ability to fetch documents and stylesheets
from external files/URLs.  While this was a documented "feature", it was
long regarded as a terrible idea.  The fix for CVE-2012-3489 broke that
capability, and rather than expend effort on trying to fix it, we're just
going to summarily remove it.

While the ability to write as well as read makes this security hole
considerably worse than CVE-2012-3489, the problem is mitigated by the fact
that xslt_process() is not available unless contrib/xml2 is installed,
and the longstanding warnings about security risks from that should have
discouraged prudent DBAs from installing it in security-exposed databases.

Reported and fixed by Peter Eisentraut.

Security: CVE-2012-3488

12 years agoPrevent access to external files/URLs via XML entity references.
Tom Lane [Tue, 14 Aug 2012 22:25:39 +0000 (18:25 -0400)]
Prevent access to external files/URLs via XML entity references.

xml_parse() would attempt to fetch external files or URLs as needed to
resolve DTD and entity references in an XML value, thus allowing
unprivileged database users to attempt to fetch data with the privileges
of the database server.  While the external data wouldn't get returned
directly to the user, portions of it could be exposed in error messages
if the data didn't parse as valid XML; and in any case the mere ability
to check existence of a file might be useful to an attacker.

The ideal solution to this would still allow fetching of references that
are listed in the host system's XML catalogs, so that documents can be
validated according to installed DTDs.  However, doing that with the
available libxml2 APIs appears complex and error-prone, so we're not going
to risk it in a security patch that necessarily hasn't gotten wide review.
So this patch merely shuts off all access, causing any external fetch to
silently expand to an empty string.  A future patch may improve this.

In HEAD and 9.2, also suppress warnings about undefined entities, which
would otherwise occur as a result of not loading referenced DTDs.  Previous
branches don't show such warnings anyway, due to different error handling
arrangements.

Credit to Noah Misch for first reporting the problem, and for much work
towards a solution, though this simplistic approach was not his preference.
Also thanks to Daniel Veillard for consultation.

Security: CVE-2012-3489

12 years agoTranslation updates
Peter Eisentraut [Tue, 14 Aug 2012 20:37:40 +0000 (16:37 -0400)]
Translation updates

12 years agoIn documentation, change "recommendable" to "recommended", per
Bruce Momjian [Tue, 14 Aug 2012 16:36:34 +0000 (12:36 -0400)]
In documentation, change "recommendable" to "recommended", per
consultation with word definitions.

Backpatch to 9.2.

12 years agoUpdate time zone data files to tzdata release 2012e.
Tom Lane [Tue, 14 Aug 2012 14:54:30 +0000 (10:54 -0400)]
Update time zone data files to tzdata release 2012e.

DST law changes in Morocco; Tokelau has relocated to the other side of
the International Date Line; and apparently Olson had Tokelau's GMT
offset wrong by an hour even before that.

There are also a large number of non-significant changes in this update.
Upstream took the opportunity to remove trailing whitespace, and the
SCCS-style version numbers on the individual files are gone too.

12 years agoAdd link from COPY ref page to psql \copy.
Tom Lane [Sat, 11 Aug 2012 17:51:22 +0000 (13:51 -0400)]
Add link from COPY ref page to psql \copy.

Jeff Janes

12 years agoFix dependencies generated during ALTER TABLE ADD CONSTRAINT USING INDEX.
Tom Lane [Sat, 11 Aug 2012 16:51:30 +0000 (12:51 -0400)]
Fix dependencies generated during ALTER TABLE ADD CONSTRAINT USING INDEX.

This command generated new pg_depend entries linking the index to the
constraint and the constraint to the table, which match the entries made
when a unique or primary key constraint is built de novo.  However, it did
not bother to get rid of the entries linking the index directly to the
table.  We had considered the issue when the ADD CONSTRAINT USING INDEX
patch was written, and concluded that we didn't need to get rid of the
extra entries.  But this is wrong: ALTER COLUMN TYPE wasn't expecting such
redundant dependencies to exist, as reported by Hubert Depesz Lubaczewski.
On reflection it seems rather likely to break other things as well, since
there are many bits of code that crawl pg_depend for one purpose or
another, and most of them are pretty naive about what relationships they're
expecting to find.  Fortunately it's not that hard to get rid of the extra
dependency entries, so let's do that.

Back-patch to 9.1, where ALTER TABLE ADD CONSTRAINT USING INDEX was added.

12 years agoPrevent pg_upgrade from crashing if it can't write to the current
Bruce Momjian [Fri, 10 Aug 2012 21:14:47 +0000 (17:14 -0400)]
Prevent pg_upgrade from crashing if it can't write to the current
directory.

Backpatch to 9.2.

12 years agoFix upper limit of superuser_reserved_connections, add limit for wal_senders
Magnus Hagander [Fri, 10 Aug 2012 12:49:03 +0000 (14:49 +0200)]
Fix upper limit of superuser_reserved_connections, add limit for wal_senders

Should be limited to the maximum number of connections excluding
autovacuum workers, not including.

Add similar check for max_wal_senders, which should never be higher than
max_connections.

12 years agoTurn off WalSender keepalives by default, users can enable if desired
Simon Riggs [Thu, 9 Aug 2012 16:06:47 +0000 (17:06 +0100)]
Turn off WalSender keepalives by default, users can enable if desired

12 years agoEnsure all replication message info is available and correct via WalRcv
Simon Riggs [Thu, 9 Aug 2012 16:03:10 +0000 (17:03 +0100)]
Ensure all replication message info is available and correct via WalRcv

12 years agoForce archive_status of .done for xlogs created by dearchival/replication.
Simon Riggs [Wed, 8 Aug 2012 22:58:49 +0000 (23:58 +0100)]
Force archive_status of .done for xlogs created by dearchival/replication.
This prevents spurious attempts to archive xlog files after promotion of
standby, a bug introduced by cascading replication patch in 9.2.

Fujii Masao, simplified and extended to cover streaming by Simon Riggs

12 years agoFix typo in comment
Alvaro Herrera [Wed, 8 Aug 2012 21:34:20 +0000 (17:34 -0400)]
Fix typo in comment

12 years agoDoc correction to point out that 9.2+ can overwrite pg_xlog files.
Simon Riggs [Wed, 8 Aug 2012 21:36:55 +0000 (22:36 +0100)]
Doc correction to point out that 9.2+ can overwrite pg_xlog files.

Noted by Noah Misch, patch by Fujii Masao

12 years agoFix minor bug in XLogFileRead() that accidentally worked.
Simon Riggs [Wed, 8 Aug 2012 20:28:41 +0000 (21:28 +0100)]
Fix minor bug in XLogFileRead() that accidentally worked.
Cascading replication copied the incoming file into pg_xlog but
didn't set path correctly, so the first attempt to open file failed
causing it to loop around and look for file in pg_xlog. So the
earlier coding worked, but accidentally rather than by design.

Spotted by Fujii Masao, fix by Fujii Masao and Simon Riggs

12 years agoUpdate isolation tests' README file.
Tom Lane [Wed, 8 Aug 2012 16:02:11 +0000 (12:02 -0400)]
Update isolation tests' README file.

The directions explaining about running the prepared-transactions test
were not updated in commit ae55d9fbe3871a5e6309d9b91629f1b0ff2b8cba.

12 years agoFix TwoPhaseGetDummyBackendId().
Tom Lane [Wed, 8 Aug 2012 15:52:06 +0000 (11:52 -0400)]
Fix TwoPhaseGetDummyBackendId().

This was broken in commit ed0b409d22346b1b027a4c2099ca66984d94b6dd,
which revised the GlobalTransactionData struct to not include the
associated PGPROC as its first member, but overlooked one place where
a cast was used in reliance on that equivalence.

The most effective way of fixing this seems to be to create a new function
that looks up the GlobalTransactionData struct given the XID, and make
both TwoPhaseGetDummyBackendId and TwoPhaseGetDummyProc rely on that.

Per report from Robert Ross.

12 years agoFix pg_upgrade file share violation on Windows created by the commit
Bruce Momjian [Tue, 7 Aug 2012 17:10:44 +0000 (13:10 -0400)]
Fix pg_upgrade file share violation on Windows created by the commit
4741e9afb93f0d769655b2d18c2b73b86f281010.  This was done by adding an
optional second log file parameter to exec_prog(), and closing and
reopening the log file between system() calls.

Backpatch to 9.2.

12 years agoFix redundant wording
Alvaro Herrera [Tue, 7 Aug 2012 15:02:53 +0000 (11:02 -0400)]
Fix redundant wording

12 years agofsync backup_label after pg_start_backup()
Simon Riggs [Tue, 7 Aug 2012 15:20:32 +0000 (16:20 +0100)]
fsync backup_label after pg_start_backup()

Dave Kerr

12 years agoTypo fixes for previous commit.
Robert Haas [Mon, 6 Aug 2012 20:12:17 +0000 (16:12 -0400)]
Typo fixes for previous commit.

Noted by Thom Brown.

12 years agoWarn more vigorously about the non-transactional behavior of sequences.
Robert Haas [Mon, 6 Aug 2012 19:18:00 +0000 (15:18 -0400)]
Warn more vigorously about the non-transactional behavior of sequences.

Craig Ringer, edited fairly heavily by me

12 years agoMake strings identical
Alvaro Herrera [Mon, 6 Aug 2012 16:45:08 +0000 (12:45 -0400)]
Make strings identical

12 years agoComplain with proper error message if streaming stops prematurely
Magnus Hagander [Mon, 6 Aug 2012 11:53:46 +0000 (13:53 +0200)]
Complain with proper error message if streaming stops prematurely

In particular, with a controlled shutdown of the master, pg_basebackup
with streaming log could terminate without an error message, even though
the backup is not consistent.

In passing, fix a few cases where walfile wasn't properly set to -1 after
closing.

Fujii Masao

12 years agoPerform conversion from Python unicode to string/bytes object via UTF-8.
Heikki Linnakangas [Mon, 6 Aug 2012 10:02:15 +0000 (13:02 +0300)]
Perform conversion from Python unicode to string/bytes object via UTF-8.

We used to convert the unicode object directly to a string in the server
encoding by calling Python's PyUnicode_AsEncodedString function. In other
words, we used Python's routines to do the encoding. However, that has a
few problems. First of all, it required keeping a mapping table of Python
encoding names and PostgreSQL encodings. But the real killer was that Python
doesn't support EUC_TW and MULE_INTERNAL encodings at all.

Instead, convert the Python unicode object to UTF-8, and use PostgreSQL's
encoding conversion functions to convert from UTF-8 to server encoding. We
were already doing the same in the other direction in PLyUnicode_FromString,
so this is more consistent, too.

Note: This makes SQL_ASCII to behave more leniently. We used to map
SQL_ASCII to Python's 'ascii', which on Python means strict 7-bit ASCII
only, so you got an error if the python string contained anything but pure
ASCII. You no longer get an error; you get the UTF-8 representation of the
string instead.

Backpatch to 9.0, where these conversions were introduced.

Jan Urbański

12 years agoReword documentation for concurrent index rebuilds to be clearer.
Bruce Momjian [Sat, 4 Aug 2012 14:35:37 +0000 (10:35 -0400)]
Reword documentation for concurrent index rebuilds to be clearer.

Backpatch to 9.1 and 9.2.

12 years agoFix bugs with parsing signed hh:mm and hh:mm:ss fields in interval input.
Tom Lane [Fri, 3 Aug 2012 21:39:45 +0000 (17:39 -0400)]
Fix bugs with parsing signed hh:mm and hh:mm:ss fields in interval input.

DecodeInterval() failed to honor the "range" parameter (the special SQL
syntax for indicating which fields appear in the literal string) if the
time was signed.  This seems inappropriate, so make it work like the
not-signed case.  The inconsistency was introduced in my commit
f867339c0148381eb1d01f93ab5c79f9d10211de, which as noted in its log message
was only really focused on making SQL-compliant literals work per spec.
Including a sign here is not per spec, but if we're going to allow it
then it's reasonable to expect it to work like the not-signed case.

Also, remove bogus setting of tmask, which caused subsequent processing to
think that what had been given was a timezone and not an hh:mm(:ss) field,
thus confusing checks for redundant fields.  This seems to be an aboriginal
mistake in Lockhart's commit 2cf1642461536d0d8f3a1cf124ead0eac04eb760.

Add regression test cases to illustrate the changed behaviors.

Back-patch as far as 8.4, where support for spec-compliant interval
literals was added.

Range problem reported and diagnosed by Amit Kapila, tmask problem by me.

12 years agoAdd link to synchronous_commit variables in high availability docs.
Bruce Momjian [Fri, 3 Aug 2012 20:33:09 +0000 (16:33 -0400)]
Add link to synchronous_commit variables in high availability docs.

Backpatch to 9.2

Erik Rijkers

12 years agoImprove underdocumented btree_xlog_delete_get_latestRemovedXid() code.
Tom Lane [Fri, 3 Aug 2012 19:41:23 +0000 (15:41 -0400)]
Improve underdocumented btree_xlog_delete_get_latestRemovedXid() code.

As noted by Noah Misch, btree_xlog_delete_get_latestRemovedXid is
critically dependent on the assumption that it's examining a consistent
state of the database.  This was undocumented though, so the
seemingly-unrelated check for no active HS sessions might be thought to be
merely an optional optimization.  Improve comments, and add an explicit
check of reachedConsistency just to be sure.

This function returns InvalidTransactionId (thereby killing all HS
transactions) in several cases that are not nearly unlikely enough for my
taste.  This commit doesn't attempt to fix those deficiencies, just
document them.

Back-patch to 9.2, not from any real functional need but just to keep the
branches more closely synced to simplify possible future back-patching.

12 years agoIn SPGiST replay, do conflict resolution before modifying the page.
Tom Lane [Fri, 3 Aug 2012 19:22:47 +0000 (15:22 -0400)]
In SPGiST replay, do conflict resolution before modifying the page.

In yesterday's commit 962e0cc71e839c58fb9125fa85511b8bbb8bdbee, I added the
ResolveRecoveryConflictWithSnapshot call in the wrong place.  I correctly
put it before spgRedoVacuumRedirect itself would modify the index page ---
but not before RestoreBkpBlocks, so replay of a record with a full-page
image would modify the page before kicking off any conflicting HS
transactions.  Oops.

12 years agoDocument that trying to exceed temp_file_limit causes a query cancel.
Bruce Momjian [Fri, 3 Aug 2012 19:15:27 +0000 (15:15 -0400)]
Document that trying to exceed temp_file_limit causes a query cancel.

Backpatch to 9.2.

12 years agoDocument that, for psql -c, only the result of the last command is
Bruce Momjian [Fri, 3 Aug 2012 18:02:22 +0000 (14:02 -0400)]
Document that, for psql -c, only the result of the last command is
returned, per report from Aleksey Tsalolikhin

Backpatch to 9.2 and 9.1.

12 years agoIn pg_upgrade, use pg_log() instead of prep_status() for
Bruce Momjian [Fri, 3 Aug 2012 16:43:37 +0000 (12:43 -0400)]
In pg_upgrade, use pg_log() instead of prep_status() for
newline-terminated messages, per suggestion from Tom.

Backpatch to 9.2.

12 years agoStamp 9.2beta3. REL9_2_BETA3
Tom Lane [Thu, 2 Aug 2012 22:23:20 +0000 (18:23 -0400)]
Stamp 9.2beta3.

12 years agoTranslation updates
Peter Eisentraut [Thu, 2 Aug 2012 20:01:01 +0000 (23:01 +0300)]
Translation updates

12 years agoFix race conditions associated with SPGiST redirection tuples.
Tom Lane [Thu, 2 Aug 2012 19:34:21 +0000 (15:34 -0400)]
Fix race conditions associated with SPGiST redirection tuples.

The correct test for whether a redirection tuple is removable is whether
tuple's xid < RecentGlobalXmin, not OldestXmin; the previous coding
failed to protect index searches being done in concurrent transactions that
have no XID.  This mirrors the recent fix in btree's page recycling logic
made in commit d3abbbebe52eb1e59e621c880ad57df9d40d13f2.

Also, WAL-log the newest XID of any removed redirection tuple on an index
page, and apply ResolveRecoveryConflictWithSnapshot during InHotStandby WAL
replay.  This protects against concurrent Hot Standby transactions possibly
needing to see the redirection tuple(s).

Per my query of 2012-03-12 and subsequent discussion.

12 years agoUpdate release notes for libpq feature change.
Tom Lane [Thu, 2 Aug 2012 17:21:24 +0000 (13:21 -0400)]
Update release notes for libpq feature change.

12 years agoReplace libpq's "row processor" API with a "single row" mode.
Tom Lane [Thu, 2 Aug 2012 17:10:36 +0000 (13:10 -0400)]
Replace libpq's "row processor" API with a "single row" mode.

After taking awhile to digest the row-processor feature that was added to
libpq in commit 92785dac2ee7026948962cd61c4cd84a2d052772, we've concluded
it is over-complicated and too hard to use.  Leave the core infrastructure
changes in place (that is, there's still a row processor function inside
libpq), but remove the exposed API pieces, and instead provide a "single
row" mode switch that causes PQgetResult to return one row at a time in
separate PGresult objects.

This approach incurs more overhead than proper use of a row processor
callback would, since construction of a PGresult per row adds extra cycles.
However, it is far easier to use and harder to break.  The single-row mode
still affords applications the primary benefit that the row processor API
was meant to provide, namely not having to accumulate large result sets in
memory before processing them.  Preliminary testing suggests that we can
probably buy back most of the extra cycles by micro-optimizing construction
of the extra results, but that task will be left for another day.

Marko Kreen

12 years agoAdd documentation cross-reference for JSON functions.
Tom Lane [Wed, 1 Aug 2012 04:41:45 +0000 (00:41 -0400)]
Add documentation cross-reference for JSON functions.

Thom Brown

12 years agoFix WITH attached to a nested set operation (UNION/INTERSECT/EXCEPT).
Tom Lane [Tue, 31 Jul 2012 21:56:27 +0000 (17:56 -0400)]
Fix WITH attached to a nested set operation (UNION/INTERSECT/EXCEPT).

Parse analysis neglected to cover the case of a WITH clause attached to an
intermediate-level set operation; it only handled WITH at the top level
or WITH attached to a leaf-level SELECT.  Per report from Adam Mackler.

In HEAD, I rearranged the order of SelectStmt's fields to put withClause
with the other fields that can appear on non-leaf SelectStmts.  In back
branches, leave it alone to avoid a possible ABI break for third-party
code.

Back-patch to 8.4 where WITH support was added.

12 years agoFix syslogger so that log_truncate_on_rotation works in the first rotation.
Tom Lane [Tue, 31 Jul 2012 18:36:58 +0000 (14:36 -0400)]
Fix syslogger so that log_truncate_on_rotation works in the first rotation.

In the original coding of the log rotation stuff, we did not bother to make
the truncation logic work for the very first rotation after postmaster
start (or after a syslogger crash and restart).  It just always appended
in that case.  It did not seem terribly important at the time, but we've
recently had two separate complaints from people who expected it to work
unsurprisingly.  (Both users tend to restart the postmaster about as often
as a log rotation is configured to happen, which is maybe not typical use,
but still...)  Since the initial log file is opened in the postmaster,
fixing this requires passing down some more state to the syslogger child
process.

It's always been like this, so back-patch to all supported branches.

12 years agopg_basebackup: stylistic adjustments
Alvaro Herrera [Tue, 31 Jul 2012 14:09:16 +0000 (10:09 -0400)]
pg_basebackup: stylistic adjustments

The most user-visible part of this is to change the long options
--statusint and --noloop to --status-interval and --no-loop,
respectively, per discussion.

Also, consistently enclose file names in double quotes, per our
conventions; and consistently use the term "transaction log file" to
talk about WAL segments.  (Someday we may need to go over this
terminology and make it consistent across the whole source code.)

Finally, reflow the code to better fit in 80 columns, and have pgindent
fix it up some more.

12 years agoFix memory and file descriptor leaks in pg_receivexlog/pg_basebackup
Alvaro Herrera [Tue, 31 Jul 2012 13:00:23 +0000 (09:00 -0400)]
Fix memory and file descriptor leaks in pg_receivexlog/pg_basebackup

When the internal loop mode was added, freeing memory and closing
filedescriptors before returning became important, and a few cases
in the code missed that.

This is a backpatch of commit 058a050e to the 9.2 branch, which seems to
have been neglected (in error, because the bugs it fixes were introduced
in commit 16282ae6 which is present in both master and 9.2).

Fujii Masao

12 years agoNow that the diskchecker.pl author has updated the download link on his
Bruce Momjian [Mon, 30 Jul 2012 14:15:57 +0000 (10:15 -0400)]
Now that the diskchecker.pl author has updated the download link on his
website, revert the separate link to the download git repository.

Backpatch from 9.0 to current.

12 years agoImprove reporting of error situations in find_other_exec().
Tom Lane [Fri, 27 Jul 2012 23:31:19 +0000 (19:31 -0400)]
Improve reporting of error situations in find_other_exec().

This function suppressed any stderr output from the called program, which
is unnecessary in the normal case and unhelpful in error cases.  It also
gave a rather opaque message along the lines of "fgets failure: Success"
in case the called program failed to return anything on stdout.  Since
we've seen multiple reports of people not understanding what's wrong when
pg_ctl reports this, improve the message.

Back-patch to all active branches.

12 years agoUpdate doc mention of diskchecker.pl to add URL for script; retain URL
Bruce Momjian [Fri, 27 Jul 2012 01:25:26 +0000 (21:25 -0400)]
Update doc mention of diskchecker.pl to add URL for script; retain URL
for description.

Patch to 9.0 and later, where script is mentioned.

12 years agoDocument that the pg_upgrade user of rsync might want to skip some
Bruce Momjian [Thu, 26 Jul 2012 18:30:07 +0000 (14:30 -0400)]
Document that the pg_upgrade user of rsync might want to skip some
files, like postmaster.pid.

Backpatch to 9.2.

12 years agoOnly allow autovacuum to be auto-canceled by a directly blocked process.
Tom Lane [Thu, 26 Jul 2012 18:29:32 +0000 (14:29 -0400)]
Only allow autovacuum to be auto-canceled by a directly blocked process.

In the original coding of the autovacuum cancel feature, commit
acac68b2bcae818bc8803b8cb8cbb17eee8d5e2b, an autovacuum process was
considered a target for cancellation if it was found to hard-block any
process examined in the deadlock search.  This patch tightens the test so
that the autovacuum must directly hard-block the current process.  This
should make the behavior more predictable in general, and in particular
it ensures that an autovacuum will not be canceled with less than
deadlock_timeout grace period.  In the old coding, it was possible for an
autovacuum to be canceled almost instantly, given unfortunate timing of two
or more other processes' lock attempts.

This also justifies the logging methodology in the recent commit
d7318d43d891bd63e82dcfc27948113ed7b1db80; without this restriction, that
patch isn't providing enough information to see the connection of the
canceling process to the autovacuum.  Like that one, patch all the way
back.

12 years agoLog a better message when canceling autovacuum.
Robert Haas [Thu, 26 Jul 2012 13:18:32 +0000 (09:18 -0400)]
Log a better message when canceling autovacuum.

The old message was at DEBUG2, so typically it didn't show up in the
log at all.  As a result, in most cases where autovacuum was canceled,
the only information that was logged was the table being vacuumed,
with no indication as to what problem caused the cancel.  Crank up
the level to LOG and add some more details to assist with debugging.

Back-patch all the way, per discussion on pgsql-hackers.

12 years agoSimplify pg_upgrade's handling when returning directory listings.
Bruce Momjian [Thu, 26 Jul 2012 10:22:06 +0000 (06:22 -0400)]
Simplify pg_upgrade's handling when returning directory listings.

Backpatch to 9.2.

12 years agoFix longstanding crash-safety bug with newly-created-or-reset sequences.
Tom Lane [Wed, 25 Jul 2012 21:40:43 +0000 (17:40 -0400)]
Fix longstanding crash-safety bug with newly-created-or-reset sequences.

If a crash occurred immediately after the first nextval() call for a serial
column, WAL replay would restore the sequence to a state in which it
appeared that no nextval() had been done, thus allowing the first sequence
value to be returned again by the next nextval() call; as reported in
bug #6748 from Xiangming Mei.

More generally, the problem would occur if an ALTER SEQUENCE was executed
on a freshly created or reset sequence.  (The manifestation with serial
columns was introduced in 8.2 when we added an ALTER SEQUENCE OWNED BY step
to serial column creation.)  The cause is that sequence creation attempted
to save one WAL entry by writing out a WAL record that made it appear that
the first nextval() had already happened (viz, with is_called = true),
while marking the sequence's in-database state with log_cnt = 1 to show
that the first nextval() need not emit a WAL record.  However, ALTER
SEQUENCE would emit a new WAL entry reflecting the actual in-database state
(with is_called = false).  Then, nextval would allocate the first sequence
value and set is_called = true, but it would trust the log_cnt value and
not emit any WAL record.  A crash at this point would thus restore the
sequence to its post-ALTER state, causing the next nextval() call to return
the first sequence value again.

To fix, get rid of the idea of logging an is_called status different from
reality.  This means that the first nextval-driven WAL record will happen
at the first nextval call not the second, but the marginal cost of that is
pretty negligible.  In addition, make sure that ALTER SEQUENCE resets
log_cnt to zero in any case where it touches sequence parameters that
affect future nextval results.  This will result in some user-visible
changes in the contents of a sequence's log_cnt column, as reflected in the
patch's regression test changes; but no application should be depending on
that anyway, since it was already true that log_cnt changes rather
unpredictably depending on checkpoint timing.

In addition, make some basically-cosmetic improvements to get rid of
sequence.c's undesirable intimacy with page layout details.  It was always
really trying to WAL-log the contents of the sequence tuple, so we should
have it do that directly using a HeapTuple's t_data and t_len, rather than
backing into it with some magic assumptions about where the tuple would be
on the sequence's page.

Back-patch to all supported branches.

12 years agoDocument that pg_basebackup will create its output directory
Peter Eisentraut [Wed, 25 Jul 2012 19:00:00 +0000 (22:00 +0300)]
Document that pg_basebackup will create its output directory

12 years agoAdd translator comments to module names
Alvaro Herrera [Wed, 25 Jul 2012 04:02:49 +0000 (00:02 -0400)]
Add translator comments to module names

12 years agoChange syntax of new CHECK NO INHERIT constraints
Alvaro Herrera [Tue, 24 Jul 2012 19:49:54 +0000 (15:49 -0400)]
Change syntax of new CHECK NO INHERIT constraints

The initially implemented syntax, "CHECK NO INHERIT (expr)" was not
deemed very good, so switch to "CHECK (expr) NO INHERIT" instead.  This
way it looks similar to SQL-standards compliant constraint attribute.

Backport to 9.2 where the new syntax and feature was introduced.

Per discussion.

12 years agoFix name collision between concurrent regression tests.
Tom Lane [Sun, 22 Jul 2012 04:01:26 +0000 (00:01 -0400)]
Fix name collision between concurrent regression tests.

Commit f5bcd398addcbeb785f0513cf28cba5d1ecd2c8a introduced a test using
a table named "circles" in inherit.sql.  Unfortunately, the concurrently
executed constraints test was already using that table name, so the
parallel regression tests would sometimes fail.  Rename table to dodge
the problem.  Per buildfarm.

12 years agoAccount for SRFs in targetlists in planner rowcount estimates.
Tom Lane [Sat, 21 Jul 2012 21:45:15 +0000 (17:45 -0400)]
Account for SRFs in targetlists in planner rowcount estimates.

We made use of the ROWS estimate for set-returning functions used in FROM,
but not for those used in SELECT targetlists; which is a bit of an
oversight considering there are common usages that require the latter
approach.  Improve that.  (I had initially thought it might be worth
folding this into cost_qual_eval, but after investigation concluded that
that wouldn't be very helpful, so just do it separately.)  Per complaint
from David Johnston.

Back-patch to 9.2, but not further, for fear of destabilizing plan choices
in existing releases.

12 years agoRemove now unneeded results file for disabled prepared transactions case.
Andrew Dunstan [Fri, 20 Jul 2012 20:28:24 +0000 (16:28 -0400)]
Remove now unneeded results file for disabled prepared transactions case.

12 years agoRemove prepared transactions from main isolation test schedule.
Andrew Dunstan [Fri, 20 Jul 2012 20:02:51 +0000 (16:02 -0400)]
Remove prepared transactions from main isolation test schedule.

There is no point in running this test when prepared transactions are disabled,
which is the default. New make targets that include the test are provided. This
will save some useless waste of cycles on buildfarm machines.

Backpatch to 9.1 where these tests were introduced.

12 years agopg_dump: Simplify mkdir() error checking
Peter Eisentraut [Fri, 20 Jul 2012 19:34:11 +0000 (22:34 +0300)]
pg_dump: Simplify mkdir() error checking

mkdir() can check for errors itself.  We don't need to code that
ourselves again.

12 years agoconnoinherit may be true only for CHECK constraints
Alvaro Herrera [Fri, 20 Jul 2012 16:33:34 +0000 (12:33 -0400)]
connoinherit may be true only for CHECK constraints

The code was setting it true for other constraints, which is
bogus.  Doing so caused bogus catalog entries for such constraints, and
in particular caused an error to be raised when trying to drop a
constraint of types other than CHECK from a table that has children,
such as reported in bug #6712.

In 9.2, additionally ignore connoinherit=true for other constraint
types, to avoid having to force initdb; existing databases might already
contain bogus catalog entries.

Includes a catversion bump (in HEAD only).

Bug report from Miroslav Šulc
Analysis from Amit Kapila and Noah Misch; Amit also contributed the patch.

12 years agoFix whole-row Var evaluation to cope with resjunk columns (again).
Tom Lane [Fri, 20 Jul 2012 17:09:10 +0000 (13:09 -0400)]
Fix whole-row Var evaluation to cope with resjunk columns (again).

When a whole-row Var is reading the result of a subquery, we need it to
ignore any "resjunk" columns that the subquery might have evaluated for
GROUP BY or ORDER BY purposes.  We've hacked this area before, in commit
68e40998d058c1f6662800a648ff1e1ce5d99cba, but that fix only covered
whole-row Vars of named composite types, not those of RECORD type; and it
was mighty klugy anyway, since it just assumed without checking that any
extra columns in the result must be resjunk.  A proper fix requires getting
hold of the subquery's targetlist so we can actually see which columns are
resjunk (whereupon we can use a JunkFilter to get rid of them).  So bite
the bullet and add some infrastructure to make that possible.

Per report from Andrew Dunstan and additional testing by Merlin Moncure.
Back-patch to all supported branches.  In 8.3, also back-patch commit
292176a118da6979e5d368a4baf27f26896c99a5, which for some reason I had
not done at the time, but it's a prerequisite for this change.

12 years agoRethink checkpointer's fsync-request table representation.
Tom Lane [Thu, 19 Jul 2012 23:28:27 +0000 (19:28 -0400)]
Rethink checkpointer's fsync-request table representation.

Instead of having one hash table entry per relation/fork/segment, just have
one per relation, and use bitmapsets to represent which specific segments
need to be fsync'd.  This eliminates the need to scan the whole hash table
to implement FORGET_RELATION_FSYNC, which fixes the O(N^2) behavior
recently demonstrated by Jeff Janes for cases involving lots of TRUNCATE or
DROP TABLE operations during a single checkpoint cycle.  Per an idea from
Robert Haas.

(FORGET_DATABASE_FSYNC still sucks, but since dropping a database is a
pretty expensive operation anyway, we'll live with that.)

In passing, improve the delayed-unlink code: remove the pass over the list
in mdpreckpt, since it wasn't doing anything for us except supporting a
useless Assert in mdpostckpt, and fix mdpostckpt so that it will absorb
fsync requests every so often when clearing a large backlog of deletion
requests.

12 years agoSend only one FORGET_RELATION_FSYNC request when dropping a relation.
Tom Lane [Thu, 19 Jul 2012 17:07:41 +0000 (13:07 -0400)]
Send only one FORGET_RELATION_FSYNC request when dropping a relation.

We were sending one per fork, but a little bit of refactoring allows us
to send just one request with forknum == InvalidForkNumber.  This not only
reduces pressure on the shared-memory request queue, but saves repeated
traversals of the checkpointer's hash table.

12 years agoRefactor the way code is shared between some range type functions.
Heikki Linnakangas [Wed, 18 Jul 2012 19:34:06 +0000 (22:34 +0300)]
Refactor the way code is shared between some range type functions.

Functions like range_eq, range_before etc. are exposed at the SQL-level, but
they're also used internally by the GiST consistent support function. The
code sharing was done by a hack, TrickFunctionCall2, which relied on the
knowledge that all the functions used fn_extra the same way. This commit
splits the functions into internal versions that take a TypeCacheEntry as
argument, and thin wrappers to expose the functions at the SQL-level. The
internal versions can then be called directly and in a less hacky way from
the GiST consistent function.

This is just cosmetic, but backpatch to 9.2 anyway, to avoid having a
different version of this code in the 9.2 branch. That would make
backpatching fixes in this area more difficult.

Alexander Korotkov

12 years agoFix statistics breakage from bgwriter/checkpointer process split.
Tom Lane [Wed, 18 Jul 2012 19:40:35 +0000 (15:40 -0400)]
Fix statistics breakage from bgwriter/checkpointer process split.

ForwardFsyncRequest() supposed that it could only be called in regular
backends, which used to be true; but since the splitup of bgwriter and
checkpointer, it is also called in the bgwriter.  We do not want to count
such calls in pg_stat_bgwriter.buffers_backend statistics, so fix things
so that they aren't.

(It's worth noting here that this implies an alarmingly large increase in
the expected amount of cross-process fsync request traffic, which may well
mean that the process splitup was not such a hot idea.)

12 years agoFix management of pendingOpsTable in auxiliary processes.
Tom Lane [Wed, 18 Jul 2012 19:28:17 +0000 (15:28 -0400)]
Fix management of pendingOpsTable in auxiliary processes.

mdinit() was misusing IsBootstrapProcessingMode() to decide whether to
create an fsync pending-operations table in the current process.  This led
to creating a table not only in the startup and checkpointer processes as
intended, but also in the bgwriter process, not to mention other auxiliary
processes such as walwriter and walreceiver.  Creation of the table in the
bgwriter is fatal, because it absorbs fsync requests that should have gone
to the checkpointer; instead they just sit in bgwriter local memory and are
never acted on.  So writes performed by the bgwriter were not being fsync'd
which could result in data loss after an OS crash.  I think there is no
live bug with respect to walwriter and walreceiver because those never
perform any writes of shared buffers; but the potential is there for
future breakage in those processes too.

To fix, make AuxiliaryProcessMain() export the current process's
AuxProcType as a global variable, and then make mdinit() test directly for
the types of aux process that should have a pendingOpsTable.  Having done
that, we might as well also get rid of the random bool flags such as
am_walreceiver that some of the aux processes had grown.  (Note that we
could not have fixed the bug by examining those variables in mdinit(),
because it's called from BaseInit() which is run by AuxiliaryProcessMain()
before entering any of the process-type-specific code.)

Back-patch to 9.2, where the problem was introduced by the split-up of
bgwriter and checkpointer processes.  The bogus pendingOpsTable exists
in walwriter and walreceiver processes in earlier branches, but absent
any evidence that it causes actual problems there, I'll leave the older
branches alone.

12 years agoGet rid of useless global variable in pg_upgrade.
Tom Lane [Wed, 18 Jul 2012 05:23:16 +0000 (01:23 -0400)]
Get rid of useless global variable in pg_upgrade.

Since the scandir() emulation was taken out of pg_upgrade, there's
no longer any need for scandir_file_pattern to exist as a global
variable.  Replace it with a local in the one remaining function
that was making use of it.

12 years agoImprove pg_upgrade's load_directory() function.
Tom Lane [Wed, 18 Jul 2012 05:13:25 +0000 (01:13 -0400)]
Improve pg_upgrade's load_directory() function.

Error out on out-of-memory, rather than returning -1, which the sole
existing caller wasn't checking for anyway.  There doesn't seem to be
any use-case for making the caller check for failure here.

Detect failure return from readdir().

Use a less platform-dependent method of calculating the entrysize.
It's possible, but not yet confirmed, that this explains bug #6733,
in which Mike Wilson reports a pg_upgrade crash that did not occur
in 9.1.  (Note that load_directory is effectively new code in 9.2,
at least on platforms that have scandir().)

Fix up comments, avoid uselessly using two counters, reduce the number
of realloc calls to something sane.

12 years agoImprove coding around the fsync request queue.
Tom Lane [Tue, 17 Jul 2012 20:55:44 +0000 (16:55 -0400)]
Improve coding around the fsync request queue.

In all branches back to 8.3, this patch fixes a questionable assumption in
CompactCheckpointerRequestQueue/CompactBgwriterRequestQueue that there are
no uninitialized pad bytes in the request queue structs.  This would only
cause trouble if (a) there were such pad bytes, which could happen in 8.4
and up if the compiler makes enum ForkNumber narrower than 32 bits, but
otherwise would require not-currently-planned changes in the widths of
other typedefs; and (b) the kernel has not uniformly initialized the
contents of shared memory to zeroes.  Still, it seems a tad risky, and we
can easily remove any risk by pre-zeroing the request array for ourselves.
In addition to that, we need to establish a coding rule that struct
RelFileNode can't contain any padding bytes, since such structs are copied
into the request array verbatim.  (There are other places that are assuming
this anyway, it turns out.)

In 9.1 and up, the risk was a bit larger because we were also effectively
assuming that struct RelFileNodeBackend contained no pad bytes, and with
fields of different types in there, that would be much easier to break.
However, there is no good reason to ever transmit fsync or delete requests
for temp files to the bgwriter/checkpointer, so we can revert the request
structs to plain RelFileNode, getting rid of the padding risk and saving
some marginal number of bytes and cycles in fsync queue manipulation while
we are at it.  The savings might be more than marginal during deletion of
a temp relation, because the old code transmitted an entirely useless but
nonetheless expensive-to-process ForgetRelationFsync request to the
background process, and also had the background process perform the file
deletion even though that can safely be done immediately.

In addition, make some cleanup of nearby comments and small improvements to
the code in CompactCheckpointerRequestQueue/CompactBgwriterRequestQueue.

12 years agoShow step titles in the pg_upgrade man page
Peter Eisentraut [Tue, 17 Jul 2012 18:34:22 +0000 (21:34 +0300)]
Show step titles in the pg_upgrade man page

The upstream XSLT stylesheets missed that case.

found by Álvaro Herrera