]> granicus.if.org Git - postgresql/blob - doc/TODO
Remove:
[postgresql] / doc / TODO
1 TODO list for PostgreSQL
2 ========================
3 Last updated:           Thu Sep  5 12:32:58 EDT 2002
4
5 Current maintainer:     Bruce Momjian (pgman@candle.pha.pa.us)
6
7 The most recent version of this document can be viewed at
8 the PostgreSQL web site, http://www.PostgreSQL.org.
9
10 A dash (-) marks changes that will appear in the upcoming 7.3 release.
11
12 Bracketed items "[]" have more detailed.
13
14
15 Urgent
16 ======
17
18 * Add replication of distributed databases [replication]
19         o automatic failover
20         o load balancing
21         o master/slave replication
22         o multi-master replication
23         o partition data across servers
24         o sample implementation in contrib/rserv
25         o queries across databases or servers (two-phase commit)
26         o allow replication over unreliable or non-persistent links
27         o http://gborg.postgresql.org/project/pgreplication/projdisplay.php
28 * Point-in-time data recovery using backup and write-ahead log
29
30
31 Reporting
32 =========
33
34 * Allow elog() to return error codes, module name, file name, line
35   number, not just messages (Peter E)
36 * Add error codes (Peter E)
37 * Make error messages more consistent [error]
38 * -Change DEBUG startup tag to LOG (Bruce)
39 * Show location of syntax error in query [yacc]
40 * -Add getpid() function to backend
41 * -Allow logging of query durations
42
43
44 Permissions
45 ===========
46
47 * -Improve control over user privileges, including table creation
48 * -Allow user/group names to be specified directly in pg_hba.conf (Bruce)
49 * -Add PGPASSWORDFILE environment variable or ~/.pgpass to store
50   user/host/password combinations
51 * -Allow permissions for functions (Peter E)
52 * -Allow object creation to be disabled for specific users
53
54
55 Administration
56 ==============
57
58 * Incremental backups
59 * -Make it easier to create a database owned by someone who can't createdb,
60   perhaps CREATE DATABASE dbname WITH OWNER = "user" (Gavin)
61 * -Make equals sign optional in CREATE DATABASE WITH param = 'val'
62 * Remove unreferenced table files and temp tables during database vacuum
63   or postmaster startup (Bruce)
64 * Remove behavior of postmaster -o after making postmaster/postgres
65   flags unique
66 * -Prevent SIGHUP and 'pg_ctl reload' from changing command line
67   specified parameters to postgresql.conf defaults (Peter E)
68 * Allow easy display of usernames in a group
69 * Allow configuration files to be specified in a different directory
70 * -Reserve last few process slots for super-user if max_connections reached
71 * -Add GUC parameter to print queries that generate errors
72
73
74 Data Types
75 ==========
76
77 * -Add domain capability (Rod Taylor)
78 * Add IPv6 capability to INET/CIDR types
79 * Remove Money type, add money formatting for decimal type
80 * -SELECT cash_out(2) crashes because of opaque
81 * -Declare typein/out functions in pg_proc with a special "C string" data type
82 * -Functions returning sets do not totally work
83 * Change factorial to return a numeric
84 * Change NUMERIC data type to use base 10,000 internally
85 * Change NUMERIC to enforce the maximum precision, and increase it
86 * Add function to return compressed length of TOAST data values (Tom)
87 * -Add GUC parameter for DATESTYLE
88 * Allow INET subnet tests using non-constants
89 * -Allow bytea to handle LIKE with non-TEXT patterns
90 * to_char(0,'FM999.99') returns a period, to_char(1,'FM999.99') does not
91
92 * CONVERSION
93         o -Store binary-compatible type information in the system
94         o Allow better handling of numeric constants, type conversion 
95           [typeconv]
96
97 * ARRAYS
98         o Allow nulls in arrays
99         o Allow arrays to be ORDER'ed
100         o -Ensure we have array-eq operators for every built-in array type
101         o Support construction of array result values in expressions
102
103 * BINARY DATA
104         o Improve vacuum of large objects, like /contrib/vacuumlo
105         o Add security checking for large objects
106         o Make file in/out interface for TOAST columns, similar to large object
107           interface (force out-of-line storage and no compression)
108         o Auto-delete large objects when referencing row is deleted
109
110
111 Multi-Language Support
112 ======================
113
114 * Add NCHAR (as distinguished from ordinary varchar),
115 * Allow LOCALE on a per-column basis, default to ASCII
116 * Support multiple simultaneous character sets, per SQL92
117 * Improve Unicode combined character handling
118 * Optimize locale to have minimal performance impact when not used (Peter E)
119 * Add octet_length_server() and octet_length_client() (Thomas, Tatsuo)
120 * Make octet_length_client the same as octet_length() (?)
121 * Prevent mismatch of frontend/backend encodings from converting bytea
122   data from being interpreted as encoded strings
123 * Remove Cyrillic recode support
124
125  
126 Views / Rules
127 =============
128
129 * Automatically create rules on views so they are updateable, per SQL92 [view]
130 * Add the functionality for WITH CHECK OPTION clause of CREATE VIEW
131 * Allow NOTIFY in rules involving conditionals
132 * Have views on temporary tables exist in the temporary namespace
133 * Move psql backslash information into views
134 * Allow RULE recompilation
135 * -Remove brackets as multi-statement rule grouping, must use parens (Bruce)
136 * Prevent aggregates from being used in rule WHERE clauses
137
138
139 Indexes
140 =======
141
142 * Allow CREATE INDEX zman_index ON test (date_trunc( 'day', zman ) datetime_ops)
143   fails index can't store constant parameters
144 * Order duplicate index entries by tid for faster heap lookups
145 * Allow inherited tables to inherit index, UNIQUE constraint, and primary
146   key, foreign key  [inheritance]
147 * UNIQUE INDEX on base column not honored on inserts from inherited table
148   INSERT INTO inherit_table (unique_index_col) VALUES (dup) should fail
149   [inheritance]
150 * -Allow UPDATE/DELETE on inherited table
151 * Add UNIQUE capability to non-btree indexes
152 * Add btree index support for reltime, tinterval, regproc
153 * Add rtree index support for line, lseg, path, point
154 * Certain indexes will not shrink, e.g. indexes on ever-increasing
155   columns and indexes with many duplicate keys
156 * Use indexes for min() and max() or convert to SELECT col FROM tab ORDER
157   BY col DESC LIMIT 1 if appropriate index exists and WHERE clause acceptible
158 * Allow LIKE indexing optimization for non-ASCII locales
159 * Use index to restrict rows returned by multi-key index when used with
160   non-consecutive keys or OR clauses, so fewer heap accesses
161 * Be smarter about insertion of already-ordered data into btree index
162 * -Add deleted bit to index tuples to reduce heap access
163 * Prevent index uniqueness checks when UPDATE does not modifying column
164 * Use bitmaps to fetch heap pages in sequential order [performance]
165 * Use bitmaps to combine existing indexes [performance]
166 * Improve handling of index scans for NULL
167 * Allow SELECT * FROM tab WHERE int2col = 4 to use int2col index, int8,
168   float4, numeric/decimal too [optimizer]
169 * Add FILLFACTOR to btree index creation
170 * Improve concurrency in GIST
171 * Improve concurrency of hash indexes (Neil Conway)
172 * -Test hash index performance and discourage usage
173
174
175 Commands
176 ========
177
178 * -Add SIMILAR TO to allow character classes, 'pg_[a-c]%'
179 * Add BETWEEN ASYMMETRIC/SYMMETRIC (Christopher)
180 * -Remove LIMIT #,# and force use LIMIT and OFFSET clauses in 7.3 (Bruce)
181 * Allow LIMIT/OFFSET to use expressions
182 * -Disallow TRUNCATE on tables that are involved in referential constraints
183 * -Add OR REPLACE clauses to non-FUNCTION object creation
184 * CREATE TABLE AS can not determine column lengths from expressions [atttypmod]
185 * Allow UPDATE to handle complex aggregates [update]
186 * -Prevent create/drop scripts from allowing extra args (Bruce)
187 * Allow command blocks to ignore certain types of errors
188 * Allow backslash handling in quoted strings to be disabled for portability
189 * Return proper effected tuple count from complex commands [return]
190 * Allow DELETE to handle table aliases for self-joins [delete]
191 * Add CORRESPONDING BY to UNION/INTERSECT/EXCEPT
192 * Allow REINDEX to rebuild all indexes, remove /contrib/reindex
193
194 * ALTER
195         o ALTER TABLE ADD COLUMN does not honor DEFAULT and non-CHECK CONSTRAINT
196         o -Add ALTER TABLE DROP COLUMN feature
197         o -Add ALTER TABLE DROP non-CHECK CONSTRAINT
198         o -ALTER TABLE ADD PRIMARY KEY (Tom)
199         o -ALTER TABLE ADD UNIQUE (Tom)
200         o -ALTER TABLE ALTER COLUMN SET/DROP NOT NULL (Christopher)
201         o ALTER TABLE ADD COLUMN column DEFAULT should fill existing
202           rows with DEFAULT value
203         o ALTER TABLE ADD COLUMN column SERIAL doesn't create sequence because
204           of the item above
205         o -Have ALTER TABLE OWNER change all dependant objects like indexes
206         o Add ALTER TABLE tab SET WITHOUT OIDS
207
208 * CLUSTER
209         o -Cluster all tables at once using pg_index.indisclustered set during
210           previous CLUSTER
211         o -Prevent loss of indexes, permissions, inheritance
212         o Automatically maintain clustering on a table
213         o Allow CLUSTER to cluster all tables, remove clusterdb
214
215 * COPY
216         o -Allow specification of column names
217         o Allow dump/load of CSV format
218         o -Change syntax to WITH DELIMITER, (keep old syntax around?)
219         o Allow COPY to report error lines and continue;  optionally
220           allow error codes to be specified; requires savepoints or can
221           not be run in a multi-statement transaction
222         o -Generate failure on short COPY lines rather than pad NULLs
223
224 * CURSOR
225         o Allow BINARY option to SELECT, just like DECLARE
226         o MOVE 0 should not move to end of cursor
227         o Allow UPDATE/DELETE WHERE CURRENT OF cursor using per-cursor tid
228           stored in the backend
229         o Prevent DROP of table being referenced by our own open cursor
230         o Allow cursors outside transactions [cursor]
231
232 * INSERT
233         o Allow INSERT/UPDATE of system-generated oid value for a row
234         o Allow INSERT INTO tab (col1, ..) VALUES (val1, ..), (val2, ..)
235         o -Allow INSERT INTO my_table VALUES (a, b, c, DEFAULT, x, y, z, ...)
236         o -Disallow missing columns in INSERT ... (col) VALUES, per ANSI
237         o Allow INSERT/UPDATE ... RETURNING new.col or old.col; handle
238           RULE cases (Philip)
239
240 * SHOW/SET
241         o -Add command to display locks
242         o -Add SET or BEGIN timeout parameter to cancel query
243         o Add SET REAL_FORMAT and SET DOUBLE_PRECISION_FORMAT using printf args
244         o -Remove SET KSQO option now that OR processing is improved (Bruce)
245         o Add SET PERFORMANCE_TIPS option to suggest INDEX, VACUUM, VACUUM
246           ANALYZE, and CLUSTER
247         o -Add SHOW command to see locale
248         o -Allow SHOW to output as a query result, like EXPLAIN
249         o -Abort all SET changes made in an aborted transaction
250         o Add SET SCHEMA
251
252 * SERVER-SIDE LANGUAGES
253         o Allow PL/PgSQL's RAISE function to take expressions
254         o -Fix PL/PgSQL to handle quoted mixed-case identifiers
255         o Change PL/PgSQL to use palloc() instead of malloc()
256         o Add untrusted version of plpython
257         o Allow Java server-side programming, http://pljava.sourceforge.net
258           [java]
259         o Fix problems with complex temporary table creation/destruction
260           without using PL/PgSQL EXECUTE, needs cache prevention/invalidation
261         o Fix PL/pgSQL RENAME to work on variables other than OLD/NEW
262         o Improve PL/PgSQL exception handling
263         o Allow parameters to be specified by name and type during 
264           definition
265         o Allow function parameters to be passed by name,
266           get_employee_salary(emp_id => 12345, tax_year => 2001)
267         o Add PL/PgSQL packages
268         o Allow array declarations and other data types in PL/PgSQl DECLARE
269         o Add PL/PgSQL PROCEDURES that can return multiple values
270         o Add table function support to pltcl, plperl, plpython
271         o Make PL/PgSQL %TYPE schema-aware 
272
273 Clients
274 =======
275
276 * -Have pg_dump use LEFT OUTER JOIN in multi-table SELECTs
277   or multiple SELECTS to avoid bad system catalog entries
278 * -Have pg_dump -C dump database location and encoding information
279 * -Allow psql \d to show foreign keys
280 * -Allow psql \d to show temporary table structure (Tom)
281 * Allow psql to show transaction status if backend protocol changes made
282 * Add XML interface:  psql, pg_dump, COPY, separate server (?)
283 * -Have pg_dump use ADD PRIMARY KEY after COPY, for performance (Neil Conway)
284
285 * JDBC
286         o Comprehensive test suite. This may be available already.
287         o -Updateable resultSet
288         o JDBC-standard BLOB support
289         o Error Codes (pending backend implementation)
290         o Support both 'make' and 'ant'
291         o Fix LargeObject API to handle OIDs as unsigned ints
292         o -Implement cancel() method on Statement
293         o Use cursors implicitly to avoid large results (see setCursorName())
294         o -Add support for CallableStatements
295         o Add LISTEN/NOTIFY support to the JDBC driver (Barry)
296         o -Compile under jdk 1.4
297
298 * ECPG
299         o Implement set descriptor, using descriptor
300         o Make casts work in variable initializations
301         o Implement SQLDA
302         o Allow multi-threaded use of SQLCA
303         o Solve cardinality > 1 for input descriptors / variables
304         o Understand structure definitions outside a declare section
305         o sqlwarn[6] should be 'W' if the PRECISION or SCALE value specified
306         o Improve error handling
307         o Allow :var[:index] or :var[<integer>] as cvariable for an array var
308         o Add a semantic check level, e.g. check if a table really exists
309         o Fix nested C comments
310         o Add SQLSTATE
311         o fix handling of DB attributes that are arrays
312
313
314 Referential Integrity
315 =====================
316
317 * Add MATCH PARTIAL referential integrity [foreign]
318 * Add deferred trigger queue file (Jan)
319 * -Allow oid to act as a foreign key
320 * Implement dirty reads and use them in RI triggers
321 * Enforce referential integrity for system tables
322 * -Allow user to control trigger firing order (Tom)
323 * -Add ALTER TRIGGER ... RENAME
324 * Change foreign key constraint for array -> element to mean element
325   in array
326 * -Fix foreign key constraints to not error on intermediate db states (Stephan)
327 * Allow DEFERRABLE UNIQUE constraints
328 * Allow triggers to be disabled [trigger]
329
330
331 Dependency Checking
332 ===================
333
334 * -Add pg_depend table for dependency recording; use sysrelid, oid,
335   depend_sysrelid, depend_oid, name
336 * -Auto-destroy sequence on DROP of table with SERIAL; perhaps a separate
337   SERIAL type
338 * -Prevent column dropping if column is used by foreign key
339 * -Propagate column or table renaming to foreign key constraints
340 * -Automatically drop constraints/functions when object is dropped
341 * -Make foreign key constraints clearer in dump file
342 * -Make other constraints clearer in dump file
343 * -Make foreign keys easier to identify
344 * Flush cached query plans when their underlying catalog data changes
345 * Use dependency information to dump data in proper order
346
347
348 Transactions
349 ============
350
351 * -Allow autocommit so always in a transaction block
352 * Overhaul bufmgr/lockmgr/transaction manager
353 * Allow savepoints / nested transactions [transactions]
354
355
356 Exotic Features
357 ===============
358
359 * Add sql3 recursive unions
360 * Add the concept of dataspaces/tablespaces [tablespaces]
361 * -Add SQL92 schemas (Tom)
362 * Allow queries across multiple databases [crossdb]
363 * Add pre-parsing phase that converts non-ANSI features to supported features
364 * Allow plug-in modules to emulate features from other databases
365 * SQL*Net listener that makes PostgreSQL appear as an Oracle database
366   to clients
367
368
369 PERFORMANCE
370 ===========
371
372
373 Fsync
374 =====
375
376 * Delay fsync() when other backends are about to commit too [fsync]
377         o Determine optimal commit_delay value
378 * Determine optimal fdatasync/fsync, O_SYNC/O_DSYNC options
379         o Allow multiple blocks to be written to WAL with one write()
380
381
382 Cache
383 =====
384 * -Cache most recent query plan(s) (Neil) [prepare]
385 * Shared catalog cache, reduce lseek()'s by caching table size in shared area
386 * Add free-behind capability for large sequential scans (Bruce)
387 * Allow binding query args over FE/BE protocol
388 * Consider use of open/fcntl(O_DIRECT) to minimize OS caching
389 * Make blind writes go through the file descriptor cache
390
391
392 Vacuum
393 ======
394
395 * Improve speed with indexes (perhaps recreate index instead) [vacuum]
396 * Reduce lock time by moving tuples with read lock, then write
397   lock and truncate table [vacuum]
398 * Provide automatic running of vacuum in the background (Tom)
399 * Allow free space map to be auto-sized or warn when it is too small
400
401
402 Locking
403 =======
404
405 * Make locking of shared data structures more fine-grained
406 * Add code to detect an SMP machine and handle spinlocks accordingly
407   from distributted.net, http://www1.distributed.net/source, 
408   in client/common/cpucheck.cpp
409 * Research use of sched_yield() for spinlock acquisition failure
410
411
412 Startup Time
413 ============
414
415 * Experiment with multi-threaded backend [thread]
416 * Add connection pooling [pool]
417 * Allow persistent backends [persistent]
418 * Create a transaction processor to aid in persistent connections and
419   connection pooling
420 * Do listen() in postmaster and accept() in pre-forked backend
421 * Have pre-forked backend pre-connect to last requested database or pass
422   file descriptor to backend pre-forked for matching database
423 * -Cache system catalog information in per-database files (Tom)
424
425
426 Write-Ahead Log
427 ===============
428
429 * Have after-change WAL write()'s write only modified data to kernel
430 * Reduce number of after-change WAL writes; they exist only to gaurd against
431   partial page writes [wal]
432 * Turn off after-change writes if fsync is disabled (?)
433 * Add WAL index reliability improvement to non-btree indexes
434 * -Reorder postgresql.conf WAL items in order of importance (Bruce)
435 * -Remove wal_files postgresql.conf option because WAL files are now recycled
436 * Find proper defaults for postgresql.conf WAL entries
437 * Add checkpoint_min_warning postgresql.conf option to warn about checkpoints
438   that are too frequent
439 * Allow xlog directory location to be specified during initdb, perhaps
440   using symlinks
441
442
443 Optimizer / Executor
444 ====================
445
446 * Improve Subplan list handling
447 * Allow Subplans to use efficient joins(hash, merge) with upper variable
448 * -Improve dynamic memory allocation by introducing tuple-context memory
449   allocation (Tom)
450 * Add hash for evaluating GROUP BY aggregates
451 * -Nested FULL OUTER JOINs don't work (Tom)
452 * Allow merge and hash joins on expressions not just simple variables (Tom)
453 * -Add new pg_proc cachable settings to specify whether function can be
454   evaluated only once or once per query
455 * -Change FIXED_CHAR_SEL to 0.20 from 0.04 to give better selectivity (Bruce)
456 * Make IN/NOT IN have similar performance to EXISTS/NOT EXISTS [exists]
457 * Missing optimizer selectivities for date, r-tree, etc. [optimizer]
458 * Allow ORDER BY ... LIMIT to select top values without sort or index
459   using a sequential scan for highest/lowest values (Oleg)
460 * Inline simple SQL functions to avoid overhead (Tom)
461 * Precompile SQL functions to avoid overhead (Neil Conway)
462 * Add utility to compute accurate random_page_cost value
463 * Improve ability to display optimizer analysis using OPTIMIZER_DEBUG
464 * Use CHECK constraints to improve optimizer decisions
465
466
467 Miscellaneous
468 =============
469
470 * Do async I/O for faster random read-ahead of data
471 * Get faster regex() code from Henry Spencer <henry@zoo.utoronto.ca>
472   when it is available
473 * Use mmap() rather than SYSV shared memory or to write WAL files (?) [mmap]
474 * Improve caching of attribute offsets when NULLs exist in the row
475 * -Add Intimate Shared Memory(ISM) for Solaris
476 * Add documentation to lock shared memory into RAM for each OS, if possible
477 * -Use faster flex flags for performance improvement (Peter E)
478 * -Add BSD-licensed qsort() for Solaris
479
480
481 Source Code
482 ===========
483
484 * Add use of 'const' for variables in source tree
485 * -Fix problems with libpq non-blocking/async code
486 * -Make sure all block numbers are unsigned to increase maximum table size
487 * -Merge LockMethodCtl and LockMethodTable into one shared structure (Bruce)
488 * -HOLDER/HOLDERTAB rename to PROCLOCK/PROCLOCKTAG (Bruce)
489 * -Remove LockMethodTable.prio field, not used (Bruce)
490 * Rename some /contrib modules from pg* to pg_*
491 * Move some things from /contrib into main tree
492 * Remove warnings created by -Wcast-align
493 * Move platform-specific ps status display info from ps_status.c to ports
494 * -Make one version of simple_prompt() in code (Bruce, Tom)
495 * -Compile in syslog functionaility by default (Tatsuo)
496 * Modify regression tests to prevent failures do to minor numeric rounding
497 * Add OpenBSD's getpeereid() call for local socket authentication (Bruce)
498 * Improve access-permissions check on data directory in Cygwin (Tom)
499 * -Report failure to find readline or zlib at end of configure run
500 * Add --port flag to regression tests
501 * -Increase identifier length (NAMEDATALEN) if small performance hit,
502 * -Increase maximum number of function parameters if little wasted space
503 * Add documentation for perl, including mention of DBI/DBD perl location
504 * Add optional CRC checksum to heap and index pages
505 * Change representation of whole-tuple parameters to functions
506 * Clarify use of 'application' and 'command' tags in SGML docs
507 * Better document ability to build only certain interfaces (Marc)
508 * Remove or relicense modules that are not under the BSD license, if possible
509 * Remove memory/file descriptor freeing befor elog(ERROR)  (Bruce)
510 * Create native Win32 port [win32]
511 * Fix glibc's mktime() to handle pre-1970's dates
512
513
514 ---------------------------------------------------------------------------
515
516
517 Developers who have claimed items are:
518 --------------------------------------
519 * Barry is Barry Lind <barry@xythos.com>
520 * Billy is Billy G. Allie <Bill.Allie@mug.org>
521 * Bruce is Bruce Momjian <pgman@candle.pha.pa.us>
522 * Christopher is Christopher Kings-Lynne <chriskl@familyhealth.com.au>
523 * D'Arcy is D'Arcy J.M. Cain <darcy@druid.net>
524 * Dave is Dave Cramer <dave@fastcrypt.com>
525 * Edmund is Edmund Mergl <E.Mergl@bawue.de>
526 * Gavin Sherry <swm@linuxworld.com.au>
527 * Hiroshi is Hiroshi Inoue <Inoue@tpf.co.jp>
528 * Karel is Karel Zak <zakkr@zf.jcu.cz>
529 * Jan is Jan Wieck <wieck@sapserv.debis.de>
530 * Liam is Liam Stewart <liams@redhat.com>
531 * Marc is Marc Fournier <scrappy@hub.org>
532 * Mark is Mark Hollomon <mhh@mindspring.com>
533 * Marko is Marko Kreen <marko@l-t.ee>
534 * Michael is Michael Meskes <meskes@postgresql.org>
535 * Neil is Neil Conway <nconway@klamath.dyndns.org>
536 * Oleg is Oleg Bartunov <oleg@sai.msu.su>
537 * Peter M is Peter T Mount <peter@retep.org.uk>
538 * Peter E is Peter Eisentraut <peter_e@gmx.net>
539 * Philip is Philip Warner <pjw@rhyme.com.au>
540 * Rod is Rod Taylor <rbt@zort.ca>
541 * Ross is Ross J. Reedstrom <reedstrm@wallace.ece.rice.edu>
542 * Ryan is Ryan Bradetich <rbrad@hpb50023.boi.hp.com>
543 * Stephan is Stephan Szabo <sszabo@megazone23.bigpanda.com>
544 * Tatsuo is Tatsuo Ishii <t-ishii@sra.co.jp>
545 * Thomas is Thomas Lockhart <lockhart@fourpalms.org>
546 * Tom is Tom Lane <tgl@sss.pgh.pa.us>
547 * TomH is Tom I Helbekkmo <tih@Hamartun.Priv.no>
548 * Vadim is Vadim B. Mikheev <vadim4o@email.com>