]> granicus.if.org Git - postgresql/blob - doc/src/FAQ/FAQ.html
Add info about selecting a random row.
[postgresql] / doc / src / FAQ / FAQ.html
1 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
2 <HTML>
3   <HEAD>
4     <META name="generator" content="HTML Tidy, see www.w3.org">
5     <META http-equiv="Content-Type" content="text/html; charset=US-ASCII">
6     <TITLE>PostgreSQL FAQ</TITLE>
7   </HEAD>
8
9   <BODY bgcolor="#ffffff" text="#000000" link="#ff0000" vlink="#a00000"
10   alink="#0000ff">
11     <H1>Frequently Asked Questions (FAQ) for PostgreSQL</H1>
12
13     <P>Last updated: Wed May 28 00:35:16 EDT 2003</P>
14
15     <P>Current maintainer: Bruce Momjian (<A href=
16     "mailto:pgman@candle.pha.pa.us">pgman@candle.pha.pa.us</A>)<BR>
17     </P>
18
19     <P>The most recent version of this document can be viewed at <A
20     href=
21     "http://www.PostgreSQL.org/docs/faqs/FAQ.html">http://www.PostgreSQL.org/docs/faqs/FAQ.html</A>.</P>
22
23     <P>Platform-specific questions are answered at <A href=
24     "http://www.PostgreSQL.org/docs/index.html">http://www.PostgreSQL.org/docs/index.html</A>.</P>
25     <HR>
26
27     <H2 align="center">General Questions</H2>
28     <A href="#1.1">1.1</A>) What is PostgreSQL? How is it pronounced?<BR>
29      <A href="#1.2">1.2</A>) What is the copyright on PostgreSQL?<BR>
30      <A href="#1.3">1.3</A>) What Unix platforms does PostgreSQL run
31     on?<BR>
32      <A href="#1.4">1.4</A>) What non-Unix ports are available?<BR>
33      <A href="#1.5">1.5</A>) Where can I get PostgreSQL?<BR>
34      <A href="#1.6">1.6</A>) Where can I get support?<BR>
35      <A href="#1.7">1.7</A>) What is the latest release?<BR>
36      <A href="#1.8">1.8</A>) What documentation is available?<BR>
37      <A href="#1.9">1.9</A>) How do I find out about known bugs or
38     missing features?<BR>
39      <A href="#1.10">1.10</A>) How can I learn <SMALL>SQL</SMALL>?<BR>
40      <A href="#1.11">1.11</A>) Is PostgreSQL Y2K compliant?<BR>
41      <A href="#1.12">1.12</A>) How do I join the development team?<BR>
42      <A href="#1.13">1.13</A>) How do I submit a bug report?<BR>
43      <A href="#1.14">1.14</A>) How does PostgreSQL compare to other
44     <SMALL>DBMS</SMALL>s?<BR>
45      <A href="#1.15">1.15</A>) How can I financially assist
46     PostgreSQL?<BR>
47      
48
49     <H2 align="center">User Client Questions</H2>
50     <A href="#2.1">2.1</A>) Are there <SMALL>ODBC</SMALL> drivers for
51     PostgreSQL?<BR>
52      <A href="#2.2">2.2</A>) What tools are available for using
53     PostgreSQL with Web pages?<BR>
54      <A href="#2.3">2.3</A>) Does PostgreSQL have a graphical user
55     interface?<BR>
56      <A href="#2.4">2.4</A>) What languages are available to
57     communicate with PostgreSQL?<BR>
58      
59
60     <H2 align="center">Administrative Questions</H2>
61     <A href="#3.1">3.1</A>) How do I install PostgreSQL somewhere other
62     than <I>/usr/local/pgsql</I>?<BR>
63      <A href="#3.2">3.2</A>) When I start <I>postmaster</I>, I get a
64     <I>Bad System Call</I> or core dumped message. Why?<BR>
65      <A href="#3.3">3.3</A>) When I try to start <I>postmaster</I>, I
66     get <I>IpcMemoryCreate</I> errors. Why?<BR>
67      <A href="#3.4">3.4</A>) When I try to start <I>postmaster</I>, I
68     get <I>IpcSemaphoreCreate</I> errors. Why?<BR>
69      <A href="#3.5">3.5</A>) How do I control connections from other
70     hosts?<BR>
71      <A href="#3.6">3.6</A>) How do I tune the database engine for
72     better performance?<BR>
73      <A href="#3.7">3.7</A>) What debugging features are available?<BR>
74      <A href="#3.8">3.8</A>) Why do I get <I>"Sorry, too many
75     clients"</I> when trying to connect?<BR>
76      <A href="#3.9">3.9</A>) What is in the  <I>pgsql_tmp</I>
77     directory?<BR>
78      <A href="#3.10">3.10</A>) Why do I need to do a dump and restore
79     to upgrade PostgreSQL releases?<BR>
80
81
82     <H2 align="center">Operational Questions</H2>
83     <A href="#4.1">4.1</A>) What is the difference between binary
84     cursors and normal cursors?<BR>
85      <A href="#4.2">4.2</A>) How do I <SMALL>SELECT</SMALL> only the
86     first few rows of a query?  A random row?<BR>
87      <A href="#4.3">4.3</A>) How do I get a list of tables or other
88     things I can see in <I>psql</I>?<BR>
89      <A href="#4.4">4.4</A>) How do you remove a column from a
90     table, or change it's data type?<BR>
91      <A href="#4.5">4.5</A>) What is the maximum size for a row, a
92     table, and a database?<BR>
93      <A href="#4.6">4.6</A>) How much database disk space is required
94     to store data from a typical text file?<BR>
95      <A href="#4.7">4.7</A>) How do I find out what tables, indexes,
96     databases, and users are defined?<BR>
97      <A href="#4.8">4.8</A>) My queries are slow or don't make use of
98     the indexes. Why?<BR>
99      <A href="#4.9">4.9</A>) How do I see how the query optimizer is
100     evaluating my query?<BR>
101      <A href="#4.10">4.10</A>) What is an R-tree index?<BR>
102      <A href="#4.11">4.11</A>) What is the Genetic Query Optimizer?<BR>
103      <A href="#4.12">4.12</A>) How do I perform regular expression
104     searches and case-insensitive regular expression searches? How do I
105     use an index for case-insensitive searches?<BR>
106      <A href="#4.13">4.13</A>) In a query, how do I detect if a field
107     is <SMALL>NULL</SMALL>?<BR>
108      <A href="#4.14">4.14</A>) What is the difference between the
109     various character types?<BR>
110      <A href="#4.15.1">4.15.1</A>) How do I create a
111     serial/auto-incrementing field?<BR>
112      <A href="#4.15.2">4.15.2</A>) How do I get the value of a
113     <SMALL>SERIAL</SMALL> insert?<BR>
114      <A href="#4.15.3">4.15.3</A>) Don't <I>currval()</I> and
115     <I>nextval()</I> lead to a race condition with other users?<BR>
116      <A href="#4.15.4">4.15.4</A>) Why aren't my sequence numbers
117     reused on transaction abort? Why are there gaps in the numbering of
118     my sequence/SERIAL column?<BR>
119      <A href="#4.16">4.16</A>) What is an <SMALL>OID</SMALL>? What is a
120     <SMALL>TID</SMALL>?<BR>
121      <A href="#4.17">4.17</A>) What is the meaning of some of the terms
122     used in PostgreSQL?<BR>
123      <A href="#4.18">4.18</A>) Why do I get the error <I>"ERROR: Memory
124     exhausted in AllocSetAlloc()"</I>?<BR>
125      <A href="#4.19">4.19</A>) How do I tell what PostgreSQL version I
126     am running?<BR>
127      <A href="#4.20">4.20</A>) Why does my large-object operations get
128     <I>"invalid large obj descriptor"</I>?<BR>
129      <A href="#4.21">4.21</A>) How do I create a column that will
130     default to the current time?<BR>
131      <A href="#4.22">4.22</A>) Why are my subqueries using
132     <CODE><SMALL>IN</SMALL></CODE> so slow?<BR>
133      <A href="#4.23">4.23</A>) How do I perform an outer join?<BR>
134      <A href="#4.24">4.24</A>) How do I perform queries using multiple
135     databases?<BR>
136      <A href="#4.25">4.25</A>) How do I return multiple rows or columns
137     from a function?<BR>
138      <A href="#4.26">4.26</A>) Why can't I reliably create/drop
139     temporary tables in PL/PgSQL functions?<BR>
140      <A href="#4.27">4.27</A>) What replication options are available?<BR>
141      <A href="#4.28">4.28</A>) What encryption options are available?<BR>
142      
143
144     <H2 align="center">Extending PostgreSQL</H2>
145     <A href="#5.1">5.1</A>) I wrote a user-defined function. When I run
146     it in <I>psql</I>, why does it dump core?<BR>
147      <A href="#5.2">5.2</A>) How can I contribute some nifty new types
148     and functions to PostgreSQL?<BR>
149      <A href="#5.3">5.3</A>) How do I write a C function to return a
150     tuple?<BR>
151      <A href="#5.4">5.4</A>) I have changed a source file. Why does the
152     recompile not see the change?<BR>
153      
154     <HR>
155
156     <H2 align="center">General Questions</H2>
157
158     <H4><A name="1.1">1.1</A>) What is PostgreSQL? How is it pronounced?</H4>
159
160     <P>PostgreSQL is pronounced <I>Post-Gres-Q-L</I>.</P>
161
162     <P>PostgreSQL is an enhancement of the POSTGRES database management
163     system, a next-generation <SMALL>DBMS</SMALL> research prototype.
164     While PostgreSQL retains the powerful data model and rich data
165     types of POSTGRES, it replaces the PostQuel query language with an
166     extended subset of <SMALL>SQL</SMALL>. PostgreSQL is free and the
167     complete source is available.</P>
168
169     <P>PostgreSQL development is performed by a team of
170     developers who all subscribe to the PostgreSQL development mailing
171     list. The current coordinator is Marc G. Fournier (<A href=
172     "mailto:scrappy@PostgreSQL.org">scrappy@PostgreSQL.org</A>). (See
173     section <a href="#1.6">1.6</a> on how to join). This team is now 
174     responsible for all development of PostgreSQL.</P>
175
176     <P>The authors of PostgreSQL 1.01 were Andrew Yu and Jolly Chen.
177     Many others have contributed to the porting, testing, debugging,
178     and enhancement of the code. The original Postgres code, from which
179     PostgreSQL is derived, was the effort of many graduate students,
180     undergraduate students, and staff programmers working under the
181     direction of Professor Michael Stonebraker at the University of
182     California, Berkeley.</P>
183
184     <P>The original name of the software at Berkeley was Postgres. When
185     <SMALL>SQL</SMALL> functionality was added in 1995, its name was
186     changed to Postgres95. The name was changed at the end of 1996 to
187     PostgreSQL.</P>
188
189     <H4><A name="1.2">1.2</A>) What is the copyright on
190     PostgreSQL?</H4>
191
192     <P>PostgreSQL is subject to the following COPYRIGHT:</P>
193
194     <P>PostgreSQL Data Base Management System</P>
195
196     <P>Portions copyright (c) 1996-2002, PostgreSQL Global Development
197     Group Portions Copyright (c) 1994-6 Regents of the University of
198     California</P>
199
200     <P>Permission to use, copy, modify, and distribute this software
201     and its documentation for any purpose, without fee, and without a
202     written agreement is hereby granted, provided that the above
203     copyright notice and this paragraph and the following two
204     paragraphs appear in all copies.</P>
205
206     <P>IN NO EVENT SHALL THE UNIVERSITY OF CALIFORNIA BE LIABLE TO ANY
207     PARTY FOR DIRECT, INDIRECT, SPECIAL, INCIDENTAL, OR CONSEQUENTIAL
208     DAMAGES, INCLUDING LOST PROFITS, ARISING OUT OF THE USE OF THIS
209     SOFTWARE AND ITS DOCUMENTATION, EVEN IF THE UNIVERSITY OF
210     CALIFORNIA HAS BEEN ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</P>
211
212     <P>THE UNIVERSITY OF CALIFORNIA SPECIFICALLY DISCLAIMS ANY
213     WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
214     OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE. THE
215     SOFTWARE PROVIDED HEREUNDER IS ON AN "AS IS" BASIS, AND THE
216     UNIVERSITY OF CALIFORNIA HAS NO OBLIGATIONS TO PROVIDE MAINTENANCE,
217     SUPPORT, UPDATES, ENHANCEMENTS, OR MODIFICATIONS.</P>
218
219     <P>The above is the BSD license, the classic open-source license.
220     It has no restrictions on how the source code may be used. We like
221     it and have no intention of changing it.</P>
222
223     <H4><A name="1.3">1.3</A>) What Unix platforms does PostgreSQL run
224     on?</H4>
225
226     <P>In general, a modern Unix-compatible platform should be able to
227     run PostgreSQL. The platforms that had received explicit testing at
228     the time of release are listed in the installation
229     instructions.</P>
230
231     <H4><A name="1.4">1.4</A>) What non-Unix ports are available?</H4>
232
233     <P><STRONG>Client</STRONG></P>
234
235     <P>It is possible to compile the <I>libpq</I> C library, psql, and
236     other interfaces and client applications to run on MS Windows platforms.
237     In this case, the client is running on MS Windows, and communicates
238     via TCP/IP to a server running on one of our supported Unix
239     platforms. A file <I>win32.mak</I> is included in the distribution
240     for making a Win32 <I>libpq</I> library and <I>psql</I>. PostgreSQL
241     also communicates with <SMALL>ODBC</SMALL> clients.</P>
242
243     <P><STRONG>Server</STRONG></P>
244
245     <P>The database server can run on Windows NT and Win2k using
246     Cygwin, the Cygnus Unix/NT porting library. See
247     <I>pgsql/doc/FAQ_MSWIN</I> in the distribution or the MS Windows FAQ
248     at <A href="http://www.PostgreSQL.org/docs/faqs/text/FAQ_MSWIN">
249     http://www.PostgreSQL.org/docs/faqs/text/FAQ_MSWIN</A>.</P>
250
251     <p>A native port to MS Win NT/2000/XP is currently being worked
252     on. For more details on the current status of PostgreSQL on Windows see
253     <a href="http://techdocs.postgresql.org/guides/Windows">
254     http://techdocs.postgresql.org/guides/Windows</a>.</p>
255
256     <p>There is also a Novell Netware 6 port at
257     <a href="http://forge.novell.com">http://forge.novell.com</a>.</p>
258
259     <H4><A name="1.5">1.5</A>) Where can I get PostgreSQL?</H4>
260
261     <P>The primary anonymous ftp site for PostgreSQL is <A href=
262     "ftp://ftp.PostgreSQL.org/pub">ftp://ftp.PostgreSQL.org/pub</A>.
263     For mirror sites, see our main web site.</P>
264
265     <H4><A name="1.6">1.6</A>) Where can I get support?</H4>
266
267     <P>The main mailing list is: <A href=
268     "mailto:pgsql-general@PostgreSQL.org">pgsql-general@PostgreSQL.org</A>.
269     It is available for discussion of matters pertaining to PostgreSQL.
270     To subscribe, send mail with the following lines in the body (not
271     the subject line):</P>
272 <PRE>
273     subscribe
274     end
275 </PRE>
276
277     <P>to <A href=
278     "mailto:pgsql-general-request@PostgreSQL.org">pgsql-general-request@PostgreSQL.org</A>.</P>
279
280     <P>There is also a digest list available. To subscribe to this
281     list, send email to: <A href=
282     "mailto:pgsql-general-digest-request@PostgreSQL.org">pgsql-general-digest-request@PostgreSQL.org</A>
283     with a body of:</P>
284 <PRE>
285     subscribe
286     end
287 </PRE>
288
289     Digests are sent out to members of this list whenever the main list
290     has received around 30k of messages. 
291
292     <P>The bugs mailing list is available. To subscribe to this list,
293     send email to <A href=
294     "mailto:pgsql-bugs-request@PostgreSQL.org">pgsql-bugs-request@PostgreSQL.org</A>
295     with a body of:</P>
296 <PRE>
297     subscribe
298     end
299 </PRE>
300
301     There is also a developers discussion mailing list available. To
302     subscribe to this list, send email to <A href=
303     "mailto:pgsql-hackers-request@PostgreSQL.org">pgsql-hackers-request@PostgreSQL.org</A>
304     with a body of: 
305 <PRE>
306     subscribe
307     end
308 </PRE>
309
310     <P>Additional mailing lists and information about PostgreSQL can be
311     found via the PostgreSQL WWW home page at:</P>
312
313     <BLOCKQUOTE>
314       <A href="http://www.PostgreSQL.org">http://www.PostgreSQL.org</A>
315     </BLOCKQUOTE>
316
317     <P>There is also an IRC channel on EFNet and OpenProjects,
318     channel <I>#PostgreSQL</I>. I use the Unix command <CODE>irc -c
319     '#PostgreSQL' "$USER" irc.phoenix.net.</CODE></P>
320
321     <P>A list of commercial support companies is available at <A href=
322     "http://www.ca.PostgreSQL.org/users-lounge/commercial-support.html">http://www.ca.PostgreSQL.org/users-lounge/commercial-support.html</A>.</P>
323
324     <H4><A name="1.7">1.7</A>) What is the latest release?</H4>
325
326     <P>The latest release of PostgreSQL is version 7.3.2.</P>
327
328     <P>We plan to have major releases every four months.</P>
329
330     <H4><A name="1.8">1.8</A>) What documentation is available?</H4>
331
332     <P>Several manuals, manual pages, and some small test examples are
333     included in the distribution. See the <I>/doc</I> directory. You
334     can also browse the manuals online at <A href=
335     "http://www.PostgreSQL.org/docs">http://www.PostgreSQL.org/docs</A>.</P>
336
337     <P>There are two PostgreSQL books available online at <A href=
338     "http://www.PostgreSQL.org/docs/awbook.html">http://www.PostgreSQL.org/docs/awbook.html</A>
339     and <A href=
340     "http://www.commandprompt.com/ppbook/">http://www.commandprompt.com/ppbook/</A>.
341     There is a list of PostgreSQL books available for purchase at <A
342     href=
343     "http://www.ca.PostgreSQL.org/books/">http://www.ca.PostgreSQL.org/books/</A>.
344     There is also a collection of PostgreSQL technical articles at <A
345     href=
346     "http://techdocs.PostgreSQL.org/">http://techdocs.PostgreSQL.org/</A>.</P>
347
348     <P><I>psql</I> has some nice \d commands to show information about
349     types, operators, functions, aggregates, etc.</P>
350
351     <P>Our web site contains even more documentation.</P>
352
353     <H4><A name="1.9">1.9</A>) How do I find out about known bugs or
354     missing features?</H4>
355
356     <P>PostgreSQL supports an extended subset of <SMALL>SQL</SMALL>-92.
357     See our <A href="http://developer.PostgreSQL.org/todo.php">TODO</A>
358     list for known bugs, missing features, and future plans.</P>
359
360     <H4><A name="1.10">1.10</A>) How can I learn
361     <SMALL>SQL</SMALL>?</H4>
362
363     <P>The PostgreSQL book at <A href=
364     "http://www.PostgreSQL.org/docs/awbook.html">http://www.PostgreSQL.org/docs/awbook.html</A>
365     teaches <SMALL>SQL</SMALL>. There is another PostgreSQL book at <A
366     href=
367     "http://www.commandprompt.com/ppbook/">http://www.commandprompt.com/ppbook.</A>
368     There is a nice tutorial at <A href=
369     "http://www.intermedia.net/support/sql/sqltut.shtm">http://www.intermedia.net/support/sql/sqltut.shtm,</A>
370     at <A href=
371     "http://ourworld.compuserve.com/homepages/graeme_birchall/HTM_COOK.HTM">
372     http://ourworld.compuserve.com/homepages/graeme_birchall/HTM_COOK.HTM,</A>
373     and at <A href=
374     "http://sqlcourse.com/">http://sqlcourse.com.</A></P>
375
376     <P>Another one is "Teach Yourself SQL in 21 Days, Second Edition"
377     at <A href=
378     "http://members.tripod.com/er4ebus/sql/index.htm">http://members.tripod.com/er4ebus/sql/index.htm</A></P>
379
380     <P>Many of our users like <I>The Practical SQL Handbook</I>,
381     Bowman, Judith S., et al., Addison-Wesley. Others like <I>The
382     Complete Reference SQL</I>, Groff et al., McGraw-Hill.</P>
383
384     <H4><A name="1.11">1.11</A>) Is PostgreSQL Y2K compliant?</H4>
385
386     <P>Yes, we easily handle dates past the year 2000 AD, and before
387     2000 BC.</P>
388
389     <H4><A name="1.12">1.12</A>) How do I join the development
390     team?</H4>
391
392     <P>First, download the latest source and read the PostgreSQL
393     Developers documentation on our web site, or in the distribution.
394     Second, subscribe to the <I>pgsql-hackers</I> and
395     <I>pgsql-patches</I> mailing lists. Third, submit high quality
396     patches to pgsql-patches.</P>
397
398     <P>There are about a dozen people who have commit privileges to the
399     PostgreSQL <SMALL>CVS</SMALL> archive. They each have submitted so
400     many high-quality patches that it was impossible for the existing
401     committers to keep up, and we had confidence that patches they
402     committed were of high quality.</P>
403
404     <H4><A name="1.13">1.13</A>) How do I submit a bug report?</H4>
405
406     <P>Please visit the PostgreSQL BugTool page at <A href=
407     "http://www.PostgreSQL.org/bugs/bugs.php">http://www.PostgreSQL.org/bugs/bugs.php</A>,
408     which gives guidelines and directions on how to submit a
409     bug report.</P>
410
411     <P>Also check out our ftp site <A href=
412     "ftp://ftp.PostgreSQL.org/pub">ftp://ftp.PostgreSQL.org/pub</A> to
413     see if there is a more recent PostgreSQL version or patches.</P>
414
415     <H4><A name="1.14">1.14</A>) How does PostgreSQL compare to other
416     <SMALL>DBMS</SMALL>s?</H4>
417
418     <P>There are several ways of measuring software: features,
419     performance, reliability, support, and price.</P>
420
421     <DL>
422       <DT><B>Features</B></DT>
423
424       <DD>PostgreSQL has most features present in large commercial
425       <SMALL>DBMS</SMALL>s, like transactions, subselects, triggers,
426       views, foreign key referential integrity, and sophisticated
427       locking. We have some features they do not have, like
428       user-defined types, inheritance, rules, and multi-version
429       concurrency control to reduce lock contention.<BR>
430       <BR>
431       </DD>
432
433       <DT><B>Performance</B></DT>
434
435       <DD>PostgreSQL has performance similar to other commercial and
436       open source databases. it is faster for some things, slower for
437       others. In comparison to MySQL or leaner database systems, we are
438       slower on inserts/updates because of transaction overhead. Of
439       course, MySQL does not have any of the features mentioned in the
440       <I>Features</I> section above. We are built for reliability and
441       features, though we continue to improve performance in every
442       release. There is an interesting Web page comparing PostgreSQL to
443       MySQL at <A href="http://openacs.org/philosophy/why-not-mysql.html">
444       http://openacs.org/philosophy/why-not-mysql.html</A><BR>
445
446       <BR>
447       </DD>
448
449       <DT><B>Reliability</B></DT>
450
451       <DD>We realize that a <SMALL>DBMS</SMALL> must be reliable, or it
452       is worthless. We strive to release well-tested, stable code that
453       has a minimum of bugs. Each release has at least one month of
454       beta testing, and our release history shows that we can provide
455       stable, solid releases that are ready for production use. We
456       believe we compare favorably to other database software in this
457       area.<BR>
458       <BR>
459       </DD>
460
461       <DT><B>Support</B></DT>
462
463       <DD>Our mailing lists provide contact with a large group of developers
464       and users to help resolve any problems encountered. While we cannot
465       guarantee a fix, commercial <SMALL>DBMS</SMALL>s do not always
466       supply a fix either. Direct access to developers, the user
467       community, manuals, and the source code often make PostgreSQL
468       support superior to other <SMALL>DBMS</SMALL>s. There is
469       commercial per-incident support available for those who need it.
470       (See <A href="#1.6">FAQ section 1.6</A>.)<BR>
471       <BR>
472       </DD>
473
474       <DT><B>Price</B></DT>
475
476       <DD>We are free for all use, both commercial and non-commercial.
477       You can add our code to your product with no limitations, except
478       those outlined in our BSD-style license stated above.<BR>
479       <BR>
480       </DD>
481     </DL>
482
483     <H4><A name="1.15">1.15</A>) How can I financially assist
484     PostgreSQL?</H4>
485
486     <P>PostgreSQL has had a first-class infrastructure since we started
487     in 1996. This is all thanks to Marc Fournier, who has created
488     and managed this infrastructure over the years.</P>
489
490     <P>Quality infrastructure is very important to an open-source
491     project. It prevents disruptions that can greatly delay forward
492     movement of the project.</P>
493
494     <P>Of course, this infrastructure is not cheap. There are a variety
495     of monthly and one-time expenses that are required to keep it
496     going. If you or your company has money it can donate to help fund
497     this effort, please go to <A href="http://store.pgsql.com/shopping/">http://store.pgsql.com/shopping/</A>
498     and make a donation.</P>
499
500     <P>Although the web page mentions PostgreSQL, Inc, the
501     "contributions" item is solely to support the PostgreSQL project
502     and does not fund any specific company. If you prefer, you can also
503     send a check to the contact address.</P>
504     <HR>
505
506     <H2 align="center">User Client Questions</H2>
507
508     <H4><A name="2.1">2.1</A>) Are there <SMALL>ODBC</SMALL> drivers
509     for PostgreSQL?</H4>
510
511     <P>There are two <SMALL>ODBC</SMALL> drivers available, PsqlODBC
512     and OpenLink <SMALL>ODBC</SMALL>.</P>
513
514     <P>You can download PsqlODBC from <A href=
515     "http://gborg.postgresql.org/project/psqlodbc/projdisplay.php">
516     http://gborg.postgresql.org/project/psqlodbc/projdisplay.php</A>.</P>
517
518     <P>OpenLink <SMALL>ODBC</SMALL> can be gotten from <A href=
519     "http://www.openlinksw.com/">http://www.openlinksw.com</A>. It
520     works with their standard <SMALL>ODBC</SMALL> client software so
521     you'll have PostgreSQL <SMALL>ODBC</SMALL> available on every
522     client platform they support (Win, Mac, Unix, VMS).</P>
523
524     <P>They will probably be selling this product to people who need
525     commercial-quality support, but a freeware version will always be
526     available. Please send questions to <A href=
527     "mailto:postgres95@openlink.co.uk">postgres95@openlink.co.uk</A>.</P>
528
529     <H4><A name="2.2">2.2</A>) What tools are available for using
530     PostgreSQL with Web pages?</H4>
531
532     <P>A nice introduction to Database-backed Web pages can be seen at:
533     <A href="http://www.webreview.com">http://www.webreview.com</A></P>
534
535     <P>For Web integration, PHP is an excellent interface. It is at <A
536     href="http://www.php.net">http://www.php.net</A>.</P>
537
538     <P>For complex cases, many use the Perl interface and CGI.pm or mod_perl.</P>
539
540     <H4><A name="2.3">2.3</A>) Does PostgreSQL have a graphical user
541     interface?</H4>
542
543     <P>Yes, there are several graphical interfaces to PostgreSQL available.
544     These include PgAccess <a href="http://www.pgaccess.org">
545     http://www.pgaccess.org</a>), PgAdmin II (<a
546     href="http://www.pgadmin.org">http://www.pgadmin.org</a>,
547     Win32-only), RHDB Admin (<a
548     href="http://sources.redhat.com/rhdb/">http://sources.redhat.com/rhdb/
549     </a>) and Rekall (<a href="http://www.thekompany.com/products/rekall/">
550     http://www.thekompany.com/products/rekall/</a>, proprietary). There is 
551     also PHPPgAdmin (<a href="http://phppgadmin.sourceforge.net/">
552     http://phppgadmin.sourceforge.net/ </a>), a web-based interface to 
553     PostgreSQL.</P>
554
555     <P>See <a href="http://techdocs.postgresql.org/guides/GUITools">http://techdocs.postgresql.org/guides/GUITools</a> for a more detailed list.</P>
556
557     <H4><A name="2.4">2.4</A>) What languages are able to communicate with 
558     PostgreSQL?</H4>
559
560     <P>Most popular programming languages contain an interface to
561     PostgreSQL. Check your programming language's list of extension
562     modules.</P>
563
564     <P>The following interfaces are included in the PostgreSQL
565     distribution:</P>
566
567     <UL>
568       <LI>C (libpq)</LI>
569
570       <LI>Embedded C (ecpg)</LI>
571
572       <LI>Java (jdbc)</LI>
573
574       <LI>Python (PyGreSQL)</LI>
575
576       <LI>TCL (libpgtcl)</LI>
577
578     </UL>
579     <P>Additional interfaces are available at 
580     <a href="http://gborg.postgresql.org">http://gborg.postgresql.org</A>
581     in the <I>Drivers/Interfaces</I> section.
582     </P>
583     <HR>
584
585     <H2 align="center">Administrative Questions</H2>
586
587     <H4><A name="3.1">3.1</A>) How do I install PostgreSQL somewhere
588     other than <I>/usr/local/pgsql</I>?</H4>
589
590     <P>Specify the <I>--prefix</I> option when running
591     <I>configure</I>.</P>
592
593     <H4><A name="3.2">3.2</A>) When I start <I>postmaster</I>, I get a
594     <I>Bad System Call</I> or core dumped message. Why?</H4>
595
596     <P>It could be a variety of problems, but first check to see that
597     you have System V extensions installed in your kernel. PostgreSQL
598     requires kernel support for shared memory and semaphores.</P>
599
600     <H4><A name="3.3">3.3</A>) When I try to start <I>postmaster</I>, I
601     get <I>IpcMemoryCreate</I> errors. Why?</H4>
602
603     <P>You either do not have shared memory configured properly in your
604     kernel or you need to enlarge the shared memory available in the
605     kernel. The exact amount you need depends on your architecture and
606     how many buffers and backend processes you configure for
607     <I>postmaster</I>. For most systems, with default numbers of
608     buffers and processes, you need a minimum of ~1 MB. See the <A
609     href=
610     "http://www.PostgreSQL.org/docs/view.php?version=current&idoc=1&file=kernel-resources.html">PostgreSQL
611     Administrator's Guide</A> for more detailed information about
612     shared memory and semaphores.</P>
613
614     <H4><A name="3.4">3.4</A>) When I try to start <I>postmaster</I>, I
615     get <I>IpcSemaphoreCreate</I> errors. Why?</H4>
616
617     <P>If the error message is <I>IpcSemaphoreCreate: semget failed (No
618     space left on device)</I> then your kernel is not configured with
619     enough semaphores. Postgres needs one semaphore per potential
620     backend process. A temporary solution is to start <I>postmaster</I>
621     with a smaller limit on the number of backend processes. Use
622     <I>-N</I> with a parameter less than the default of 32. A more
623     permanent solution is to increase your kernel's
624     <SMALL>SEMMNS</SMALL> and <SMALL>SEMMNI</SMALL> parameters.</P>
625
626     <P>Inoperative semaphores can also cause crashes during heavy
627     database access.</P>
628
629     <P>If the error message is something else, you might not have
630     semaphore support configured in your kernel at all. See the
631     PostgreSQL Administrator's Guide for more detailed information
632     about shared memory and semaphores.</P>
633
634     <H4><A name="3.5">3.5</A>) How do I control connections from other
635     hosts?</H4>
636
637     <P>By default, PostgreSQL only allows connections from the local
638     machine using Unix domain sockets. Other machines will not be able
639     to connect unless you add the <I>-i</I> flag to <I>postmaster</I>,
640     <B>and</B> enable host-based authentication by modifying the file
641     <I>$PGDATA/pg_hba.conf</I> accordingly. This will allow TCP/IP
642     connections.</P>
643
644     <H4><A name="3.6">3.6</A>) How do I tune the database engine for
645     better performance?</H4>
646
647     <P>Certainly, indexes can speed up queries. The
648     <SMALL>EXPLAIN</SMALL> command allows you to see how PostgreSQL is
649     interpreting your query, and which indexes are being used.</P>
650
651     <P>If you are doing many <SMALL>INSERTs</SMALL>, consider doing
652     them in a large batch using the <SMALL>COPY</SMALL> command. This
653     is much faster than individual <SMALL>INSERTS</SMALL>. Second,
654     statements not in a <SMALL>BEGIN WORK/COMMIT</SMALL> transaction
655     block are considered to be in their own transaction. Consider
656     performing several statements in a single transaction block. This
657     reduces the transaction overhead. Also, consider dropping and
658     recreating indexes when making large data changes.</P>
659
660     <P>There are several tuning options. You can disable <I>fsync()</I>
661     by starting <I>postmaster</I> with a <I>-o -F</I> option. This will
662     prevent <I>fsync()</I>s from flushing to disk after every
663     transaction.</P>
664
665     <P>You can also use the <I>postmaster</I> <I>-B</I> option to
666     increase the number of shared memory buffers used by the backend
667     processes. If you make this parameter too high, the
668     <I>postmaster</I> may not start because you have exceeded your
669     kernel's limit on shared memory space. Each buffer is 8K and the
670     default is 64 buffers.</P>
671
672     <P>You can also use the backend <I>-S</I> option to increase the
673     maximum amount of memory used by the backend process for temporary
674     sorts. The <I>-S</I> value is measured in kilobytes, and the
675     default is 512 (i.e. 512K).</P>
676
677     <P>You can also use the <SMALL>CLUSTER</SMALL> command to group
678     data in tables to match an index. See the <SMALL>CLUSTER</SMALL>
679     manual page for more details.</P>
680
681     <H4><A name="3.7">3.7</A>) What debugging features are
682     available?</H4>
683
684     <P>PostgreSQL has several features that report status information
685     that can be valuable for debugging purposes.</P>
686
687     <P>First, by running <I>configure</I> with the --enable-cassert
688     option, many <I>assert()</I>s monitor the progress of the backend
689     and halt the program when something unexpected occurs.</P>
690
691     <P>Both <I>postmaster</I> and <I>postgres</I> have several debug
692     options available. First, whenever you start <I>postmaster</I>,
693     make sure you send the standard output and error to a log file,
694     like:</P>
695 <PRE>
696     cd /usr/local/pgsql
697     ./bin/postmaster &gt;server.log 2&gt;&amp;1 &amp;
698 </PRE>
699
700     <P>This will put a server.log file in the top-level PostgreSQL
701     directory. This file contains useful information about problems or
702     errors encountered by the server. <I>Postmaster</I> has a <I>-d</I>
703     option that allows even more detailed information to be reported.
704     The <I>-d</I> option takes a number that specifies the debug level.
705     Be warned that high debug level values generate large log
706     files.</P>
707
708     <P>If <I>postmaster</I> is not running, you can actually run the
709     <I>postgres</I> backend from the command line, and type your
710     <SMALL>SQL</SMALL> statement directly. This is recommended
711     <B>only</B> for debugging purposes. Note that a newline terminates
712     the query, not a semicolon. If you have compiled with debugging
713     symbols, you can use a debugger to see what is happening. Because
714     the backend was not started from <I>postmaster</I>, it is not
715     running in an identical environment and locking/backend interaction
716     problems may not be duplicated.</P>
717
718     <P>If <I>postmaster</I> is running, start <I>psql</I> in one
719     window, then find the <SMALL>PID</SMALL> of the <I>postgres</I>
720     process used by <I>psql</I>. Use a debugger to attach to the
721     <I>postgres</I> <SMALL>PID</SMALL>. You can set breakpoints in the
722     debugger and issue queries from <I>psql</I>. If you are debugging
723     <I>postgres</I> startup, you can set PGOPTIONS="-W n", then start
724     <I>psql</I>. This will cause startup to delay for <I>n</I> seconds
725     so you can attach to the process with the debugger, set any
726     breakpoints, and continue through the startup sequence.</P>
727
728     <P>The <I>postgres</I> program has <I>-s, -A</I>, and <I>-t</I>
729     options that can be very useful for debugging and performance
730     measurements.</P>
731
732     <P>You can also compile with profiling to see what functions are
733     taking execution time. The backend profile files will be deposited
734     in the <I>pgsql/data/base/dbname</I> directory. The client profile
735     file will be put in the client's current directory. Linux requires
736     a compile with <I>-DLINUX_PROFILE</I> for proper profiling.</P>
737
738     <H4><A name="3.8">3.8</A>) Why do I get <I>"Sorry, too many
739     clients"</I> when trying to connect?</H4>
740
741     <P>You need to increase <I>postmaster</I>'s limit on how many
742     concurrent backend processes it can start.</P>
743
744     <P>The default limit is 32 processes. You can increase it by
745     restarting <I>postmaster</I> with a suitable <I>-N</I> value or
746     modifying <I>postgresql.conf</I>.</P>
747
748     <P>Note that if you make <I>-N</I> larger than 32, you must also
749     increase <I>-B</I> beyond its default of 64; <I>-B</I> must be at
750     least twice <I>-N</I>, and probably should be more than that for
751     best performance. For large numbers of backend processes, you are
752     also likely to find that you need to increase various Unix kernel
753     configuration parameters. Things to check include the maximum size
754     of shared memory blocks, <SMALL>SHMMAX;</SMALL> the maximum number
755     of semaphores, <SMALL>SEMMNS</SMALL> and <SMALL>SEMMNI;</SMALL> the
756     maximum number of processes, <SMALL>NPROC;</SMALL> the maximum
757     number of processes per user, <SMALL>MAXUPRC;</SMALL> and the
758     maximum number of open files, <SMALL>NFILE</SMALL> and
759     <SMALL>NINODE</SMALL>. The reason that PostgreSQL has a limit on
760     the number of allowed backend processes is so your system won't run
761     out of resources.</P>
762
763     <H4><A name="3.9">3.9</A>) What is in the <I>pgsql_tmp</I> directory?</H4>
764
765     <P>This directory contains temporary files generated by the query 
766     executor. For example, if a sort needs to be done to satisfy an 
767     <SMALL>ORDER BY</SMALL> and the sort requires more space than the
768     backend's <I>-S</I> parameter allows, then temporary files are created
769     here to hold the extra data.</P>
770
771     <P>The temporary files are usually deleted automatically, but might
772     remain if a backend crashes during a sort. A stop and restart of the
773     <I>postmaster</I> will remove files from those directories.</P>
774
775     <H4><A name="3.10">3.10</A>) Why do I need to do a dump and restore
776     to upgrade between major PostgreSQL releases?</H4>
777
778     <P>The PostgreSQL team makes only small changes between minor releases,
779     so upgrading from 7.2 to 7.2.1 does not require a dump and restore.
780     However, major releases (e.g. from 7.2 to 7.3) often change the internal
781     format of system tables and data files. These changes are often complex,
782     so we don't maintain backward compatability for data files. A dump outputs
783     data in a generic format that can then be loaded in using the new internal
784     format.</P>
785
786     <P>In releases where the on-disk format does not change, the
787     <I>pg_upgrade</I> script can be used to upgrade without a dump/restore.
788     The release notes mention whether <I>pg_upgrade</I> is available for the
789     release.</P>
790
791     <HR>
792
793     <H2 align="center">Operational Questions</H2>
794
795     <H4><A name="4.1">4.1</A>) What is the difference between binary
796     cursors and normal cursors?</H4>
797
798     <P>See the <SMALL>DECLARE</SMALL> manual page for a
799     description.</P>
800
801     <H4><A name="4.2">4.2</A>) How do I <SMALL>SELECT</SMALL> only the
802     first few rows of a query?  A random row?</H4>
803
804     <P>See the <SMALL>FETCH</SMALL> manual page, or use
805     <SMALL>SELECT</SMALL> ... <SMALL>LIMIT</SMALL>....</P>
806
807     <P>The entire query may have to be evaluated, even if you only want
808     the first few rows. Consider using a query that has an <SMALL>ORDER
809     BY</SMALL>. If there is an index that matches the <SMALL>ORDER
810     BY</SMALL>, PostgreSQL may be able to evaluate only the first few
811     records requested, or the entire query may have to be evaluated
812     until the desired rows have been generated.</P>
813
814     <P>To <SMALL>SELECT</SMALL> a random row, use:
815 <PRE>
816     SELECT col
817     FROM tab
818     ORDER BY random()
819     LIMIT 1;
820 </PRE>
821
822     <H4><A name="4.3">4.3</A>) How do I get a list of tables or other
823     things I can see in <I>psql</I>?</H4>
824
825     <P>You can read the source code for <I>psql</I> in file
826     <I>pgsql/src/bin/psql/describe.c</I>. It contains
827     <SMALL>SQL</SMALL> commands that generate the output for psql's
828     backslash commands. You can also start <I>psql</I> with the
829     <I>-E</I> option so it will print out the queries it uses to
830     execute the commands you give.</P>
831
832     <H4><A name="4.4">4.4</A>) How do you remove a column from a
833     table, or change its data type?</H4>
834
835     <P><SMALL>DROP COLUMN</SMALL> functionality was added in release 7.3 with
836     <SMALL>ALTER TABLE DROP COLUMN</SMALL>.  In earlier versions,
837     you can do this:</P>
838 <PRE>
839     BEGIN;
840     LOCK TABLE old_table;
841     SELECT ...  -- select all columns but the one you want to remove
842     INTO TABLE new_table
843     FROM old_table;
844     DROP TABLE old_table;
845     ALTER TABLE new_table RENAME TO old_table;
846     COMMIT;
847 </PRE>
848
849     <P>To change the data type of a column, do this:</P>
850 <PRE>
851     BEGIN;
852     ALTER TABLE tab ADD COLUMN new_col <i>new_data_type</i>;
853     UPDATE tab SET new_col = CAST(old_col AS <i>new_data_type</i>);
854     ALTER TABLE DROP COLUMN old_col;
855     COMMIT;
856 </PRE>
857     <P>You might then want to do <I>VACUUM FULL tab</I> to reclaim the
858     disk space used by the expired rows.</P>
859     
860     <H4><A name="4.5">4.5</A>) What is the maximum size for a row, a
861     table, and a database?</H4>
862
863     <P>These are the limits:</P>
864 <PRE>
865     Maximum size for a database?             unlimited (4 TB databases exist)
866     Maximum size for a table?                16 TB
867     Maximum size for a row?                  1.6TB
868     Maximum size for a field?                1 GB
869     Maximum number of rows in a table?       unlimited
870     Maximum number of columns in a table?    250-1600 depending on column types
871     Maximum number of indexes on a table?    unlimited
872 </PRE>
873
874     Of course, these are not actually unlimited, but limited to
875     available disk space and memory/swap space. Performance may suffer
876     when these values get unusually large. 
877
878     <P>The maximum table size of 16 TB does not require large file
879     support from the operating system. Large tables are stored as
880     multiple 1 GB files so file system size limits are not
881     important.</P>
882
883     <P>The maximum table size and maximum number of columns can be
884     increased if the default block size is increased to 32k.</P>
885
886     <H4><A name="4.6">4.6</A>) How much database disk space is required
887     to store data from a typical text file?</H4>
888
889     <P>A PostgreSQL database may require up to five times the disk
890     space to store data from a text file.</P>
891
892     <P>As an example, consider a file of 100,000 lines with an integer
893     and text description on each line. Suppose the text string
894     avergages twenty bytes in length. The flat file would be 2.8 MB.
895     The size of the PostgreSQL database file containing this data can
896     be estimated as 6.4 MB:</P>
897 <PRE>
898     36 bytes: each row header (approximate)
899     24 bytes: one int field and one text field
900    + 4 bytes: pointer on page to tuple
901    ----------------------------------------
902     64 bytes per row
903
904    The data page size in PostgreSQL is 8192 bytes (8 KB), so:
905
906    8192 bytes per page
907    -------------------   =  128 rows per database page (rounded down)
908      64 bytes per row
909
910    100000 data rows
911    --------------------  =  782 database pages (rounded up)
912       128 rows per page
913
914 782 database pages * 8192 bytes per page  =  6,406,144 bytes (6.4 MB)
915 </PRE>
916
917     <P>Indexes do not require as much overhead, but do contain the data
918     that is being indexed, so they can be large also.</P>
919
920     <P><SMALL>NULL</SMALL>s are stored in bitmaps, so they
921     use very little space.</P>
922     
923     <H4><A name="4.7">4.7</A>) How do I find out what tables, indexes,
924     databases, and users are defined?</H4>
925
926     <P><I>psql</I> has a variety of backslash commands to show such
927     information. Use \? to see them. There are also system tables
928     beginning with <I>pg_</I> that describe these too. Also, <I>psql
929     -l</I> will list all databases.</P>
930
931     <P>Also try the file <I>pgsql/src/tutorial/syscat.source</I>. It
932     illustrates many of the <SMALL>SELECT</SMALL>s needed to get
933     information from the database system tables.</P>
934
935     <H4><A name="4.8">4.8</A>) My queries are slow or don't make use of
936     the indexes. Why?</H4>
937     Indexes are not automatically used by every query. Indexes are only
938     used if the table is larger than a minimum size, and the query
939     selects only a small percentage of the rows in the table. This is
940     because the random disk access caused by an index scan can be
941     slower than a straight read through the table, or sequential scan. 
942
943     <P>To determine if an index should be used, PostgreSQL must have
944     statistics about the table. These statistics are collected using
945     <SMALL>VACUUM ANALYZE</SMALL>, or simply <SMALL>ANALYZE</SMALL>.
946     Using statistics, the optimizer knows how many rows are in the
947     table, and can better determine if indexes should be used.
948     Statistics are also valuable in determining optimal join order and
949     join methods. Statistics collection should be performed
950     periodically as the contents of the table change.</P>
951
952     <P>Indexes are normally not used for <SMALL>ORDER BY</SMALL> or to
953     perform joins. A sequential scan followed by an explicit sort is
954     usually faster than an index scan of a large table.</P>
955     However, <SMALL>LIMIT</SMALL> combined with <SMALL>ORDER BY</SMALL>
956     often will use an index because only a small portion of the table
957     is returned.  In fact, though MAX() and MIN() don't use indexes,
958     it is possible to retrieve such values using an index with ORDER BY
959     and LIMIT:
960 <PRE>
961     SELECT col
962     FROM tab
963     ORDER BY col [ DESC ]
964     LIMIT 1;
965 </PRE>
966
967     <P>If you believe the optimizer is incorrect in choosing a
968     sequential scan, use <CODE>SET enable_seqscan TO 'off'</CODE> and
969     run tests to see if an index scan is indeed faster.</P>
970
971     <P>When using wild-card operators such as <SMALL>LIKE</SMALL> or
972     <I>~</I>, indexes can only be used in certain circumstances:</P>
973     <UL>
974     <LI>The beginning of the search string must be anchored to the start
975     of the string, i.e.
976     <UL>
977     <LI><SMALL>LIKE</SMALL> patterns must not start with <I>%</I>.</LI>
978     <LI><I>~</I> (regular expression) patterns must start with
979     <I>^</I>.</LI>
980     </UL></LI>
981     <LI>The search string can not start with a character class,
982     e.g. [a-e].</LI>
983     <LI>Case-insensitive searches such as <SMALL>ILIKE</SMALL> and
984     <I>~*</I> do not utilise indexes. Instead, use functional
985     indexes, which are described in section <a href="#4.12">4.12</a>.</LI>
986     <LI>The default <I>C</I> locale must be used during
987     <i>initdb</i>.</LI>
988     </UL>
989     <P>
990
991     <H4><A name="4.9">4.9</A>) How do I see how the query optimizer is
992     evaluating my query?</H4>
993
994     <P>See the <SMALL>EXPLAIN</SMALL> manual page.</P>
995
996     <H4><A name="4.10">4.10</A>) What is an R-tree index?</H4>
997
998     <P>An R-tree index is used for indexing spatial data. A hash index
999     can't handle range searches. A B-tree index only handles range
1000     searches in a single dimension. R-trees can handle
1001     multi-dimensional data. For example, if an R-tree index can be
1002     built on an attribute of type <I>point</I>, the system can more
1003     efficiently answer queries such as "select all points within a
1004     bounding rectangle."</P>
1005
1006     <P>The canonical paper that describes the original R-tree design
1007     is:</P>
1008
1009     <P>Guttman, A. "R-trees: A Dynamic Index Structure for Spatial
1010     Searching." Proceedings of the 1984 ACM SIGMOD Int'l Conf on Mgmt
1011     of Data, 45-57.</P>
1012
1013     <P>You can also find this paper in Stonebraker's "Readings in
1014     Database Systems".</P>
1015
1016     <P>Built-in R-trees can handle polygons and boxes. In theory,
1017     R-trees can be extended to handle higher number of dimensions. In
1018     practice, extending R-trees requires a bit of work and we don't
1019     currently have any documentation on how to do it.</P>
1020
1021     <H4><A name="4.11">4.11</A>) What is the Genetic Query
1022     Optimizer?</H4>
1023
1024     <P>The <SMALL>GEQO</SMALL> module speeds query optimization when
1025     joining many tables by means of a Genetic Algorithm (GA). It allows
1026     the handling of large join queries through nonexhaustive
1027     search.</P>
1028
1029     <H4><A name="4.12">4.12</A>) How do I perform regular expression
1030     searches and case-insensitive regular expression searches? How do I
1031     use an index for case-insensitive searches?</H4>
1032
1033     <P>The <I>~</I> operator does regular expression matching, and
1034     <I>~*</I> does case-insensitive regular expression matching. The
1035     case-insensitive variant of <SMALL>LIKE</SMALL> is called
1036     <SMALL>ILIKE</SMALL>.</P>
1037
1038     <P>Case-insensitive equality comparisons are normally expressed
1039     as:</P>
1040 <PRE>
1041     SELECT *
1042     FROM tab
1043     WHERE lower(col) = 'abc';
1044 </PRE>
1045
1046     This will not use an standard index. However, if you create a
1047     functional index, it will be used: 
1048 <PRE>
1049     CREATE INDEX tabindex ON tab (lower(col));
1050 </PRE>
1051
1052     <H4><A name="4.13">4.13</A>) In a query, how do I detect if a field
1053     is <SMALL>NULL</SMALL>?</H4>
1054
1055     <P>You test the column with <SMALL>IS NULL</SMALL> and <SMALL>IS
1056     NOT NULL</SMALL>.</P>
1057
1058     <H4><A name="4.14">4.14</A>) What is the difference between the
1059     various character types?</H4>
1060 <PRE>
1061 Type            Internal Name   Notes
1062 --------------------------------------------------
1063 VARCHAR(n)      varchar         size specifies maximum length, no padding
1064 CHAR(n)         bpchar          blank padded to the specified fixed length
1065 TEXT            text            no specific upper limit on length
1066 BYTEA           bytea           variable-length byte array (null-byte safe)
1067 "char"          char            one character
1068 </PRE>
1069
1070     <P>You will see the internal name when examining system catalogs
1071     and in some error messages.</P>
1072
1073     <P>The first four types above are "varlena" types (i.e., the first
1074     four bytes on disk are the length, followed by the data). Thus the
1075     actual space used is slightly greater than the declared size.
1076     However, these data types are also subject to compression or being
1077     stored out-of-line by <SMALL>TOAST</SMALL>, so the space on disk
1078     might also be less than expected.</P>
1079
1080     <SMALL>VARCHAR(n)</SMALL> is best when storing variable-length
1081     strings and it limits how long a string can be. <SMALL>TEXT</SMALL>
1082     is for strings of unlimited length, with a maximum of one gigabyte.
1083     <P><SMALL>CHAR(n)</SMALL> is for storing strings that are all the
1084     same length. <SMALL>CHAR(n)</SMALL> pads with blanks to the specified
1085     length, while <SMALL>VARCHAR(n)</SMALL> only stores the characters
1086     supplied.  <SMALL>BYTEA</SMALL> is for storing binary data,
1087     particularly values that include <SMALL>NULL</SMALL> bytes. All the
1088     types described here have similar performance characteristics.</P>
1089
1090     <H4><A name="4.15.1">4.15.1</A>) How do I create a
1091     serial/auto-incrementing field?</H4>
1092
1093     <P>PostgreSQL supports a <SMALL>SERIAL</SMALL> data type. It
1094     auto-creates a sequence and index on the column. For example,
1095     this:</P>
1096 <PRE>
1097     CREATE TABLE person ( 
1098         id   SERIAL, 
1099         name TEXT 
1100     );
1101 </PRE>
1102
1103     is automatically translated into this: 
1104 <PRE>
1105     CREATE SEQUENCE person_id_seq;
1106     CREATE TABLE person ( 
1107         id   INT4 NOT NULL DEFAULT nextval('person_id_seq'),
1108         name TEXT 
1109     );
1110     CREATE UNIQUE INDEX person_id_key ON person ( id );
1111 </PRE>
1112
1113     See the <I>create_sequence</I> manual page for more information
1114     about sequences. You can also use each row's <I>OID</I> field as a
1115     unique value. However, if you need to dump and reload the database,
1116     you need to use <I>pg_dump</I>'s <I>-o</I> option or <SMALL>COPY
1117     WITH OIDS</SMALL> option to preserve the <SMALL>OID</SMALL>s. 
1118
1119     <H4><A name="4.15.2">4.15.2</A>) How do I get the value of a
1120     <SMALL>SERIAL</SMALL> insert?</H4>
1121
1122     <P>One approach is to retrieve the next <SMALL>SERIAL</SMALL> value
1123     from the sequence object with the <I>nextval()</I> function
1124     <I>before</I> inserting and then insert it explicitly. Using the
1125     example table in <A href="#4.15.1">4.15.1</A>, an example in a
1126     pseudo-language would look like this:</P>
1127 <PRE>
1128     new_id = execute("SELECT nextval('person_id_seq')");
1129     execute("INSERT INTO person (id, name) VALUES (new_id, 'Blaise Pascal')");
1130 </PRE>
1131
1132     You would then also have the new value stored in
1133     <CODE>new_id</CODE> for use in other queries (e.g., as a foreign
1134     key to the <CODE>person</CODE> table). Note that the name of the
1135     automatically created <SMALL>SEQUENCE</SMALL> object will be named
1136     &lt;<I>table</I>&gt;_&lt;<I>serialcolumn</I>&gt;_<I>seq</I>, where
1137     <I>table</I> and <I>serialcolumn</I> are the names of your table
1138     and your <SMALL>SERIAL</SMALL> column, respectively.
1139
1140     <P>Alternatively, you could retrieve the assigned
1141     <SMALL>SERIAL</SMALL> value with the <I>currval()</I> function
1142     <I>after</I> it was inserted by default, e.g.,</P>
1143 <PRE>
1144     execute("INSERT INTO person (name) VALUES ('Blaise Pascal')");
1145     new_id = execute("SELECT currval('person_id_seq')");
1146 </PRE>
1147
1148     Finally, you could use the <A href="#4.16"><SMALL>OID</SMALL></A>
1149     returned from the <SMALL>INSERT</SMALL> statement to look up the
1150     default value, though this is probably the least portable approach.
1151     In Perl, using DBI with Edmund Mergl's DBD::Pg module, the oid
1152     value is made available via <I>$sth-&gt;{pg_oid_status}</I> after
1153     <I>$sth-&gt;execute()</I>.
1154
1155     <H4><A name="4.15.3">4.15.3</A>) Don't <I>currval()</I> and
1156     <I>nextval()</I> lead to a race condition with other users?</H4>
1157
1158     <P>No. <I>currval()</I> returns the current value assigned by your
1159     backend, not by all users.</P>
1160
1161     <H4><A name="4.15.4">4.15.4</A>) Why aren't my sequence numbers
1162     reused on transaction abort? Why are there gaps in the numbering of
1163     my sequence/SERIAL column?</H4>
1164
1165     <P>To improve concurrency, sequence values are given out to running
1166     transactions as needed and are not locked until the transaction
1167     completes. This causes gaps in numbering from aborted
1168     transactions.</P>
1169
1170     <H4><A name="4.16">4.16</A>) What is an <SMALL>OID</SMALL>? What is
1171     a <SMALL>TID</SMALL>?</H4>
1172
1173     <P><SMALL>OID</SMALL>s are PostgreSQL's answer to unique row ids.
1174     Every row that is created in PostgreSQL gets a unique
1175     <SMALL>OID</SMALL>. All <SMALL>OID</SMALL>s generated during
1176     <I>initdb</I> are less than 16384 (from
1177     <I>include/access/transam.h</I>). All user-created
1178     <SMALL>OID</SMALL>s are equal to or greater than this. By default,
1179     all these <SMALL>OID</SMALL>s are unique not only within a table or
1180     database, but unique within the entire PostgreSQL installation.</P>
1181
1182     <P>PostgreSQL uses <SMALL>OID</SMALL>s in its internal system
1183     tables to link rows between tables. These <SMALL>OID</SMALL>s can
1184     be used to identify specific user rows and used in joins. It is
1185     recommended you use column type <SMALL>OID</SMALL> to store
1186     <SMALL>OID</SMALL> values. You can create an index on the
1187     <SMALL>OID</SMALL> field for faster access.</P>
1188
1189     <P>O<SMALL>ID</SMALL>s are assigned to all new rows from a central
1190     area that is used by all databases. If you want to change the
1191     <SMALL>OID</SMALL> to something else, or if you want to make a copy
1192     of the table, with the original <SMALL>OID</SMALL>s, there is no
1193     reason you can't do it:</P>
1194 <PRE>
1195         CREATE TABLE new_table(old_oid oid, mycol int);
1196         SELECT old_oid, mycol INTO new FROM old;
1197         COPY new TO '/tmp/pgtable';
1198         DELETE FROM new;
1199         COPY new WITH OIDS FROM '/tmp/pgtable';
1200 </PRE>
1201 <!--
1202     CREATE TABLE new_table (mycol int);
1203     INSERT INTO new_table (oid, mycol) SELECT oid, mycol FROM old_table;
1204 -->
1205     <P>O<SMALL>ID</SMALL>s are stored as 4-byte integers, and will
1206     overflow at 4 billion. No one has reported this ever happening, and
1207     we plan to have the limit removed before anyone does.</P>
1208
1209     <P>T<SMALL>ID</SMALL>s are used to identify specific physical rows
1210     with block and offset values. T<SMALL>ID</SMALL>s change after rows
1211     are modified or reloaded. They are used by index entries to point
1212     to physical rows.</P>
1213
1214     <H4><A name="4.17">4.17</A>) What is the meaning of some of the
1215     terms used in PostgreSQL?</H4>
1216
1217     <P>Some of the source code and older documentation use terms that
1218     have more common usage. Here are some:</P>
1219
1220     <UL>
1221       <LI>table, relation, class</LI>
1222
1223       <LI>row, record, tuple</LI>
1224
1225       <LI>column, field, attribute</LI>
1226
1227       <LI>retrieve, select</LI>
1228
1229       <LI>replace, update</LI>
1230
1231       <LI>append, insert</LI>
1232
1233       <LI><SMALL>OID</SMALL>, serial value</LI>
1234
1235       <LI>portal, cursor</LI>
1236
1237       <LI>range variable, table name, table alias</LI>
1238     </UL>
1239
1240     <P>A list of general database terms can be found at: <A href=
1241     "http://hea-www.harvard.edu/MST/simul/software/docs/pkgs/pgsql/glossary/glossary.html">http://hea-www.harvard.edu/MST/simul/software/docs/pkgs/pgsql/glossary/glossary.html</A></P>
1242
1243     <H4><A name="4.18">4.18</A>) Why do I get the error <I>"ERROR:
1244     Memory exhausted in AllocSetAlloc()"</I>?</H4>
1245
1246     <P>You probably have run out of virtual memory on your system,
1247     or your kernel has a low limit for certain resources. Try this
1248     before starting <I>postmaster</I>:</P>
1249 <PRE>
1250     ulimit -d 262144
1251     limit datasize 256m
1252 </PRE>
1253
1254     Depending on your shell, only one of these may succeed, but it will
1255     set your process data segment limit much higher and perhaps allow
1256     the query to complete. This command applies to the current process,
1257     and all subprocesses created after the command is run. If you are
1258     having a problem with the <SMALL>SQL</SMALL> client because the
1259     backend is returning too much data, try it before starting the
1260     client.
1261
1262     <H4><A name="4.19">4.19</A>) How do I tell what PostgreSQL version
1263     I am running?</H4>
1264
1265     <P>From <I>psql</I>, type <CODE>SELECT version();</CODE></P>
1266
1267     <H4><A name="4.20">4.20</A>) Why does my large-object operations
1268     get <I>"invalid large obj descriptor"</I>?</H4>
1269
1270     <P>You need to put <CODE>BEGIN WORK</CODE> and <CODE>COMMIT</CODE>
1271     around any use of a large object handle, that is, surrounding
1272     <CODE>lo_open</CODE> ... <CODE>lo_close.</CODE></P>
1273
1274     <P>Currently PostgreSQL enforces the rule by closing large object
1275     handles at transaction commit. So the first attempt to do anything
1276     with the handle will draw <I>invalid large obj descriptor</I>. So
1277     code that used to work (at least most of the time) will now
1278     generate that error message if you fail to use a transaction.</P>
1279
1280     <P>If you are using a client interface like <SMALL>ODBC</SMALL> you
1281     may need to set <CODE>auto-commit off.</CODE></P>
1282
1283     <H4><A name="4.21">4.21</A>) How do I create a column that will
1284     default to the current time?</H4>
1285
1286     <P>Use <I>CURRENT_TIMESTAMP</I>:</P>
1287 <PRE>
1288 <CODE>CREATE TABLE test (x int, modtime timestamp DEFAULT CURRENT_TIMESTAMP );
1289 </CODE>
1290 </PRE>
1291
1292     <H4><A name="4.22">4.22</A>) Why are my subqueries using
1293     <CODE><SMALL>IN</SMALL></CODE> so slow?</H4>
1294
1295     <P>Currently, we join subqueries to outer queries by sequentially
1296     scanning the result of the subquery for each row of the outer
1297     query. If the subquery returns only a few rows and the outer query
1298     returns many rows, <CODE><SMALL>IN</SMALL></CODE> is fastest.  To
1299     speed up other queries, replace <CODE>IN</CODE> with
1300     <CODE>EXISTS</CODE>:</P>
1301 <PRE>    SELECT *
1302     FROM tab
1303     WHERE col IN (SELECT subcol FROM subtab);
1304 </PRE>
1305     to:
1306 <PRE>    SELECT *
1307     FROM tab
1308     WHERE EXISTS (SELECT subcol FROM subtab WHERE subcol = col);
1309 </PRE>
1310
1311     For this to be fast, <CODE>subcol</CODE> should be an indexed column.
1312     This preformance problem will be fixed in 7.4.
1313
1314     <H4><A name="4.23">4.23</A>) How do I perform an outer join?</H4>
1315
1316     <P>PostgreSQL supports outer joins using the SQL standard syntax.
1317     Here are two examples:</P>
1318 <PRE>
1319     SELECT *
1320     FROM t1 LEFT OUTER JOIN t2 ON (t1.col = t2.col);
1321 </PRE>
1322     or 
1323 <PRE>
1324     SELECT *
1325     FROM t1 LEFT OUTER JOIN t2 USING (col);
1326 </PRE>
1327
1328     <P>These identical queries join t1.col to t2.col, and also return
1329     any unjoined rows in t1 (those with no match in t2). A
1330     <SMALL>RIGHT</SMALL> join would add unjoined rows of t2. A
1331     <SMALL>FULL</SMALL> join would return the matched rows plus all
1332     unjoined rows from t1 and t2. The word <SMALL>OUTER</SMALL> is
1333     optional and is assumed in <SMALL>LEFT</SMALL>,
1334     <SMALL>RIGHT</SMALL>, and <SMALL>FULL</SMALL> joins. Ordinary joins
1335     are called <SMALL>INNER</SMALL> joins.</P>
1336
1337     <P>In previous releases, outer joins can be simulated using
1338     <SMALL>UNION</SMALL> and <SMALL>NOT IN</SMALL>. For example, when
1339     joining <I>tab1</I> and <I>tab2</I>, the following query does an
1340     <I>outer</I> join of the two tables:<BR>
1341     <BR>
1342     </P>
1343 <PRE>
1344     SELECT tab1.col1, tab2.col2
1345     FROM tab1, tab2
1346     WHERE tab1.col1 = tab2.col1
1347     UNION ALL
1348     SELECT tab1.col1, NULL
1349     FROM tab1
1350     WHERE tab1.col1 NOT IN (SELECT tab2.col1 FROM tab2)
1351     ORDER BY col1
1352 </PRE>
1353
1354     <H4><A name="4.24">4.24</A>) How do I perform queries using
1355     multiple databases?</H4>
1356
1357     <P>There is no way to query a database other than the current one.
1358     Because PostgreSQL loads database-specific system catalogs, it is
1359     uncertain how a cross-database query should even behave.</P>
1360
1361     <P><I>contrib/dblink</I> allows cross-database queries using
1362     function calls. Of course, a client can make simultaneous
1363     connections to different databases and merge the results on the
1364     client side.</P>
1365
1366     <H4><A name="4.25">4.25</A>) How do I return multiple rows or
1367     columns from a function?</H4>
1368
1369     <P>In 7.3, you can easily return multiple rows or columns from a
1370     function,
1371     <a href="http://techdocs.postgresql.org/guides/SetReturningFunctions">
1372     http://techdocs.postgresql.org/guides/SetReturningFunctions</a>.
1373
1374     <H4><A name="4.26">4.26</A>) Why can't I reliably create/drop
1375     temporary tables in PL/PgSQL functions?</H4>
1376     <P>PL/PgSQL caches function contents, and an unfortunate side effect
1377     is that if a PL/PgSQL function accesses a temporary table, and that
1378     table is later dropped and recreated, and the function called
1379     again, the function will fail because the cached function contents
1380     still point to the old temporary table. The solution is to use
1381     <SMALL>EXECUTE</SMALL> for temporary table access in PL/PgSQL. This
1382     will cause the query to be reparsed every time.</P>
1383
1384     <H4><A name="4.27">4.27</A>) What replication options are available?
1385     </H4>
1386     <P>There are several master/slave replication options available.
1387     These allow only the master to make database changes and the slave
1388     can only do database reads. The bottom of <a
1389     href="http://gborg.PostgreSQL.org/genpage?replication_research">
1390     http://gborg.PostgreSQL.org/genpage?replication_research</a> lists
1391     them. A multi-master replication solution is being worked on at <a
1392     href="http://gborg.PostgreSQL.org/project/pgreplication/projdisplay.php">http://gborg.PostgreSQL.org/project/pgreplication/projdisplay.php</a>.</P>
1393
1394     <H4><A name="4.28">4.28</A>) What encryption options are available?
1395     </H4>
1396     <UL>
1397     <LI><I>contrib/pgcrypto</I> contains many encryption functions for
1398     use in <SMALL>SQL</SMALL> queries.</LI>
1399     <LI>The only way to encrypt transmission from the client to the
1400     server is by using <I>hostssl</I> in <I>pg_hba.conf</I>.</LI>
1401     <LI>Database user passwords are automatically encrypted when stored
1402     in version 7.3. In previous versions, you must enable the option
1403     <I>PASSWORD_ENCRYPTION</I> in <I>postgresql.conf</I>.</LI>
1404     <LI>The server can run using an encrypted file system.</LI>
1405     </UL>
1406
1407     <HR>
1408
1409     <H2 align="center">Extending PostgreSQL</H2>
1410
1411     <H4><A name="5.1">5.1</A>) I wrote a user-defined function. When I
1412     run it in <I>psql</I>, why does it dump core?</H4>
1413
1414     <P>The problem could be a number of things. Try testing your
1415     user-defined function in a stand-alone test program first.</P>
1416
1417     <H4><A name="5.2">5.2</A>) How can I contribute some nifty new
1418     types and functions to PostgreSQL?</H4>
1419
1420     <P>Send your extensions to the <I>pgsql-hackers</I> mailing list,
1421     and they will eventually end up in the <I>contrib/</I>
1422     subdirectory.</P>
1423
1424     <H4><A name="5.3">5.3</A>) How do I write a C function to return a
1425     tuple?</H4>
1426
1427     <P>In versions of PostgreSQL beginning with 7.3, table-returning
1428     functions are fully supported in C, PL/PgSQL, and SQL. See the
1429     Programmer's Guide for more information. An example of a
1430     table-returning function defined in C can be found in
1431     <I>contrib/tablefunc</I>.</P>
1432
1433     <H4><A name="5.4">5.4</A>) I have changed a source file. Why does
1434     the recompile not see the change?</H4>
1435
1436     <P>The <I>Makefiles</I> do not have the proper dependencies for
1437     include files. You have to do a <I>make clean</I> and then another
1438     <I>make</I>. If you are using <SMALL>GCC</SMALL> you can use the
1439     <I>--enable-depend</I> option of <I>configure</I> to have the
1440     compiler compute the dependencies automatically.</P>
1441   </BODY>
1442 </HTML>
1443