]> granicus.if.org Git - postgresql/blobdiff - src/include/storage/s_lock.h
Add spinlock support for Itanium processor with Intel compiler.
[postgresql] / src / include / storage / s_lock.h
index d47f5ab53b9c4ebe30d0f5c89885ed3e8732faf6..49bb9f64c210e4a5e06c567f95233442b90b57f6 100644 (file)
 /*-------------------------------------------------------------------------
  *
- * s_lock.h--
- *        This file contains the implementation (if any) for spinlocks.
+ * s_lock.h
+ *        Hardware-dependent implementation of spinlocks.
  *
- * Copyright (c) 1994, Regents of the University of California
+ *     NOTE: none of the macros in this file are intended to be called directly.
+ *     Call them through the hardware-independent macros in spin.h.
  *
+ *     The following hardware-dependent macros must be provided for each
+ *     supported platform:
  *
- * IDENTIFICATION
- *       $Header: /cvsroot/pgsql/src/include/storage/s_lock.h,v 1.56 1998/10/31 02:06:08 momjian Exp $
+ *     void S_INIT_LOCK(slock_t *lock)
+ *             Initialize a spinlock (to the unlocked state).
  *
- *-------------------------------------------------------------------------
- */
-
-/*
- *      DESCRIPTION
- *             The public macros that must be provided are:
+ *     void S_LOCK(slock_t *lock)
+ *             Acquire a spinlock, waiting if necessary.
+ *             Time out and abort() if unable to acquire the lock in a
+ *             "reasonable" amount of time --- typically ~ 1 minute.
+ *
+ *     void S_UNLOCK(slock_t *lock)
+ *             Unlock a previously acquired lock.
+ *
+ *     bool S_LOCK_FREE(slock_t *lock)
+ *             Tests if the lock is free. Returns TRUE if free, FALSE if locked.
+ *             This does *not* change the state of the lock.
+ *
+ *     void SPIN_DELAY(void)
+ *             Delay operation to occur inside spinlock wait loop.
  *
- *             void S_INIT_LOCK(slock_t *lock)
+ *     Note to implementors: there are default implementations for all these
+ *     macros at the bottom of the file.  Check if your platform can use
+ *     these or needs to override them.
  *
- *             void S_LOCK(slock_t *lock)
+ *  Usually, S_LOCK() is implemented in terms of an even lower-level macro
+ *     TAS():
  *
- *             void S_UNLOCK(slock_t *lock)
+ *     int TAS(slock_t *lock)
+ *             Atomic test-and-set instruction.  Attempt to acquire the lock,
+ *             but do *not* wait.      Returns 0 if successful, nonzero if unable
+ *             to acquire the lock.
  *
- *             void S_LOCK_FREE(slock_t *lock)
- *                     Tests if the lock is free. Returns non-zero if free, 0 if locked.
+ *     TAS() is NOT part of the API, and should never be called directly.
  *
- *             The S_LOCK() macro      implements a primitive but still useful random
- *             backoff to avoid hordes of busywaiting lockers chewing CPU.
+ *     CAUTION: on some platforms TAS() may sometimes report failure to acquire
+ *     a lock even when the lock is not locked.  For example, on Alpha TAS()
+ *     will "fail" if interrupted.  Therefore TAS() should always be invoked
+ *     in a retry loop, even if you are certain the lock is free.
  *
- *             Effectively:
- *             void
- *             S_LOCK(slock_t *lock)
- *             {
- *                     while (TAS(lock))
- *                     {
- *                     // back off the cpu for a semi-random short time
- *                     }
- *             }
+ *     ANOTHER CAUTION: be sure that TAS() and S_UNLOCK() represent sequence
+ *     points, ie, loads and stores of other values must not be moved across
+ *     a lock or unlock.  In most cases it suffices to make the operation be
+ *     done through a "volatile" pointer.
  *
- *             This implementation takes advantage of a tas function written
- *             (in assembly language) on machines that have a native test-and-set
- *             instruction. Alternative mutex implementations may also be used.
- *             This function is hidden under the TAS macro to allow substitutions.
+ *     On most supported platforms, TAS() uses a tas() function written
+ *     in assembly language to execute a hardware atomic-test-and-set
+ *     instruction.  Equivalent OS-supplied mutex routines could be used too.
  *
- *             #define TAS(lock) tas(lock)
- *             int tas(slock_t *lock)          // True if lock already set
+ *     If no system-specific TAS() is available (ie, HAVE_SPINLOCKS is not
+ *     defined), then we fall back on an emulation that uses SysV semaphores
+ *     (see spin.c).  This emulation will be MUCH MUCH slower than a proper TAS()
+ *     implementation, because of the cost of a kernel call per lock or unlock.
+ *     An old report is that Postgres spends around 40% of its time in semop(2)
+ *     when using the SysV semaphore code.
  *
- *             There are default implementations for all these macros at the bottom
- *             of this file. Check if your platform can use these or needs to
- *             override them.
  *
- *     NOTES
- *             If none of this can be done, POSTGRES will default to using
- *             System V semaphores (and take a large performance hit -- around 40%
- *             of its time on a DS5000/240 is spent in semop(3)...).
+ * Portions Copyright (c) 1996-2005, PostgreSQL Global Development Group
+ * Portions Copyright (c) 1994, Regents of the University of California
  *
- *             AIX has a test-and-set but the recommended interface is the cs(3)
- *             system call.  This provides an 8-instruction (plus system call
- *             overhead) uninterruptible compare-and-set operation.  True
- *             spinlocks might be faster but using cs(3) still speeds up the
- *             regression test suite by about 25%.  I don't have an assembler
- *             manual for POWER in any case.
+ *       $PostgreSQL: pgsql/src/include/storage/s_lock.h,v 1.134 2005/03/10 21:41:01 momjian Exp $
  *
+ *-------------------------------------------------------------------------
  */
-#if !defined(S_LOCK_H)
+#ifndef S_LOCK_H
 #define S_LOCK_H
 
-#include "storage/ipc.h"
+#include "storage/pg_sema.h"
 
-#if defined(HAS_TEST_AND_SET)
+#ifdef HAVE_SPINLOCKS  /* skip spinlocks if requested */
 
 
-#if defined(__GNUC__)
+#if defined(__GNUC__) || defined(__ICC)
 /*************************************************************************
  * All the gcc inlines
+ * Gcc consistently defines the CPU as __cpu__.
+ * Other compilers use __cpu or __cpu__ so we test for both in those cases.
+ */
+
+/*----------
+ * Standard gcc asm format (assuming "volatile slock_t *lock"):
+
+       __asm__ __volatile__(
+               "       instruction     \n"
+               "       instruction     \n"
+               "       instruction     \n"
+:              "=r"(_res), "+m"(*lock)         // return register, in/out lock value
+:              "r"(lock)                                       // lock pointer, in input register
+:              "memory", "cc");                        // show clobbered registers here
+
+ * The output-operands list (after first colon) should always include
+ * "+m"(*lock), whether or not the asm code actually refers to this
+ * operand directly.  This ensures that gcc believes the value in the
+ * lock variable is used and set by the asm code.  Also, the clobbers
+ * list (after third colon) should always include "memory"; this prevents
+ * gcc from thinking it can cache the values of shared-memory fields
+ * across the asm code.  Add "cc" if your asm code changes the condition
+ * code register, and also list any temp registers the code uses.
+ *----------
  */
 
-#if defined(__alpha)
+
+#if defined(__i386__) || defined(__x86_64__) /* AMD Opteron */
+#define HAS_TEST_AND_SET
+
+typedef unsigned char slock_t;
+
 #define TAS(lock) tas(lock)
-#define S_UNLOCK(lock) { __asm__("mb"); *(lock) = 0; }
 
 static __inline__ int
 tas(volatile slock_t *lock)
 {
-       register slock_t _res;
-
-__asm__("    ldq   $0, %0              \n\
-                 bne   $0, 3f          \n\
-                 ldq_l $0, %0             \n\
-                 bne   $0, 3f          \n\
-                 or    $31, 1, $0          \n\
-                 stq_c $0, %0             \n\
-                 beq   $0, 2f              \n\
-                 bis   $31, $31, %1        \n\
-                 mb                               \n\
-                 jmp   $31, 4f            \n\
-              2: or    $31, 1, $0             \n\
-              3: bis   $0, $0, %1             \n\
-              4: nop      ": "=m"(*lock), "=r"(_res): :"0");
+       register slock_t _res = 1;
 
+       /* Use a non-locking test before asserting the bus lock */
+       __asm__ __volatile__(
+               "       cmpb    $0,%1   \n"
+               "       jne             1f              \n"
+               "       lock                    \n"
+               "       xchgb   %0,%1   \n"
+               "1: \n"
+:              "+q"(_res), "+m"(*lock)
+:
+:              "memory", "cc");
        return (int) _res;
 }
 
-#endif  /* __alpha */
+#define SPIN_DELAY() spin_delay()
 
+static __inline__ void
+spin_delay(void)
+{
+       /*
+        * This sequence is equivalent to the PAUSE instruction ("rep" is
+        * ignored by old IA32 processors if the following instruction is
+        * not a string operation); the IA-32 Architecture Software
+        * Developer's Manual, Vol. 3, Section 7.7.2 describes why using
+        * PAUSE in the inner loop of a spin lock is necessary for good
+        * performance:
+        *
+        *     The PAUSE instruction improves the performance of IA-32
+        *     processors supporting Hyper-Threading Technology when
+        *     executing spin-wait loops and other routines where one
+        *     thread is accessing a shared lock or semaphore in a tight
+        *     polling loop. When executing a spin-wait loop, the
+        *     processor can suffer a severe performance penalty when
+        *     exiting the loop because it detects a possible memory order
+        *     violation and flushes the core processor's pipeline. The
+        *     PAUSE instruction provides a hint to the processor that the
+        *     code sequence is a spin-wait loop. The processor uses this
+        *     hint to avoid the memory order violation and prevent the
+        *     pipeline flush. In addition, the PAUSE instruction
+        *     de-pipelines the spin-wait loop to prevent it from
+        *     consuming execution resources excessively.
+        */
+       __asm__ __volatile__(
+               " rep; nop                      \n");
+}
 
+#endif  /* __i386__ || __x86_64__ */
+
+
+#if defined(__ia64__) || defined(__ia64)
+/* Intel Itanium */
+#define HAS_TEST_AND_SET
+
+typedef unsigned int slock_t;
+
+#define TAS(lock) tas(lock)
+
+#ifndef __INTEL_COMPILER
+
+static __inline__ int
+tas(volatile slock_t *lock)
+{
+       long int        ret;
+
+       __asm__ __volatile__(
+               "       xchg4   %0=%1,%2        \n"
+:              "=r"(ret), "+m"(*lock)
+:              "r"(1)
+:              "memory");
+       return (int) ret;
+}
+
+#else
+
+static __inline__ int
+tas(volatile slock_t *lock)
+{
+       int             ret;
+
+       ret = _InterlockedExchange(lock,1);     /* this is a xchg asm macro */
+
+       return ret;
+}
+
+#endif
+#endif  /* __ia64__ || __ia64 */
+
+
+#if defined(__arm__) || defined(__arm)
+#define HAS_TEST_AND_SET
+
+typedef unsigned char slock_t;
 
-#if defined(i386)
 #define TAS(lock) tas(lock)
 
 static __inline__ int
@@ -114,105 +219,277 @@ tas(volatile slock_t *lock)
 {
        register slock_t _res = 1;
 
-__asm__("lock; xchgb %0,%1": "=q"(_res), "=m"(*lock):"0"(_res));
+       __asm__ __volatile__(
+               "       swpb    %0, %0, [%2]    \n"
+:              "+r"(_res), "+m"(*lock)
+:              "r"(lock)
+:              "memory");
        return (int) _res;
 }
 
-#endif  /* i386 */
+#endif  /* __arm__ */
+
 
+#if defined(__s390__) || defined(__s390x__)
+/* S/390 and S/390x Linux (32- and 64-bit zSeries) */
+#define HAS_TEST_AND_SET
 
+typedef unsigned int slock_t;
+
+#define TAS(lock)         tas(lock)
+
+static __inline__ int
+tas(volatile slock_t *lock)
+{
+       int                     _res = 0;
+
+       __asm__ __volatile__(
+               "       cs      %0,%3,0(%2)             \n"
+:              "+d"(_res), "+m"(*lock)
+:              "a"(lock), "d"(1)
+:              "memory", "cc");
+       return _res;
+}
+
+#endif  /* __s390__ || __s390x__ */
+
+
+#if defined(__sparc__)
+#define HAS_TEST_AND_SET
+
+typedef unsigned char slock_t;
 
-#if defined(sparc)
 #define TAS(lock) tas(lock)
 
 static __inline__ int
 tas(volatile slock_t *lock)
 {
-       register slock_t _res = 1;
+       register slock_t _res;
 
-       __asm__("ldstub [%2], %0" \
-:                      "=r"(_res), "=m"(*lock) \
-:                      "r"(lock));
+       __asm__ __volatile__(
+               "       ldstub  [%2], %0        \n"
+:              "=r"(_res), "+m"(*lock)
+:              "r"(lock)
+:              "memory");
        return (int) _res;
 }
 
-#endif  /* sparc */
+#endif  /* __sparc__ */
+
+
+#if defined(__ppc__) || defined(__powerpc__) || defined(__powerpc64__)
+#define HAS_TEST_AND_SET
+
+#if defined(__powerpc64__)
+typedef unsigned long slock_t;
+#else
+typedef unsigned int slock_t;
+#endif
+
+#define TAS(lock) tas(lock)
+/*
+ * NOTE: per the Enhanced PowerPC Architecture manual, v1.0 dated 7-May-2002,
+ * an isync is a sufficient synchronization barrier after a lwarx/stwcx loop.
+ */
+static __inline__ int
+tas(volatile slock_t *lock)
+{
+       slock_t _t;
+       int _res;
+
+       __asm__ __volatile__(
+"      lwarx   %0,0,%3         \n"
+"      cmpwi   %0,0            \n"
+"      bne     1f                      \n"
+"      addi    %0,%0,1         \n"
+"      stwcx.  %0,0,%3         \n"
+"      beq     2f              \n"
+"1:    li      %1,1            \n"
+"      b               3f                      \n"
+"2:                                            \n"
+"      isync                           \n"
+"      li      %1,0            \n"
+"3:                                            \n"
+
+:      "=&r"(_t), "=r"(_res), "+m"(*lock)
+:      "r"(lock)
+:      "memory", "cc");
+       return _res;
+}
+
+/* PowerPC S_UNLOCK is almost standard but requires a "sync" instruction */
+#define S_UNLOCK(lock) \
+do \
+{\
+       __asm__ __volatile__ (" sync \n"); \
+       *((volatile slock_t *) (lock)) = 0; \
+} while (0)
+
+#endif /* powerpc */
+
+
+#if defined(__mc68000__) && defined(__linux__)
+#define HAS_TEST_AND_SET
+
+typedef unsigned char slock_t;
+
+#define TAS(lock) tas(lock)
 
+static __inline__ int
+tas(volatile slock_t *lock)
+{
+       register int rv;
+
+       __asm__ __volatile__(
+               "       clrl    %0              \n"
+               "       tas             %1              \n"
+               "       sne             %0              \n"
+:              "=d"(rv), "+m"(*lock)
+:
+:              "memory", "cc");
+       return rv;
+}
+
+#endif  /* defined(__mc68000__) && defined(__linux__) */
 
 
-#if defined(NEED_VAX_TAS_ASM)
+#if defined(__vax__)
 /*
  * VAXen -- even multiprocessor ones
  * (thanks to Tom Ivar Helbekkmo)
  */
-#define TAS(lock) tas(lock)
+#define HAS_TEST_AND_SET
 
 typedef unsigned char slock_t;
 
+#define TAS(lock) tas(lock)
+
 static __inline__ int
 tas(volatile slock_t *lock)
 {
-       register        _res;
-
-       __asm__("       movl $1, r0 \
-                       bbssi $0, (%1), 1 f \
-                       clrl r0 \
-1:                     movl r0, %0 "
-:                      "=r"(_res)                      /* return value, in register */
-:                      "r"(lock)                       /* argument, 'lock pointer', in register */
-:                      "r0");                          /* inline code uses this register */
-       return (int) _res;
+       register int    _res;
+
+       __asm__ __volatile__(
+               "       movl    $1, %0                  \n"
+               "       bbssi   $0, (%2), 1f    \n"
+               "       clrl    %0                              \n"
+               "1: \n"
+:              "=&r"(_res), "+m"(*lock)
+:              "r"(lock)
+:              "memory");
+       return _res;
 }
 
-#endif  /* NEED_VAX_TAS_ASM */
+#endif  /* __vax__ */
 
 
+#if defined(__ns32k__)
+#define HAS_TEST_AND_SET
+
+typedef unsigned char slock_t;
 
-#if defined(NEED_NS32K_TAS_ASM)
 #define TAS(lock) tas(lock)
 
 static __inline__ int
 tas(volatile slock_t *lock)
 {
-  register _res;
-  __asm__("sbitb 0, %0 \n\
-       sfsd %1"
-       : "=m"(*lock), "=r"(_res));
-  return (int) _res; 
+       register int    _res;
+
+       __asm__ __volatile__(
+               "       sbitb   0, %1   \n"
+               "       sfsd    %0              \n"
+:              "=r"(_res), "+m"(*lock)
+:
+:              "memory");
+       return _res;
+}
+
+#endif  /* __ns32k__ */
+
+
+#if defined(__alpha) || defined(__alpha__)
+/*
+ * Correct multi-processor locking methods are explained in section 5.5.3
+ * of the Alpha AXP Architecture Handbook, which at this writing can be
+ * found at ftp://ftp.netbsd.org/pub/NetBSD/misc/dec-docs/index.html.
+ * For gcc we implement the handbook's code directly with inline assembler.
+ */
+#define HAS_TEST_AND_SET
+
+typedef unsigned long slock_t;
+
+#define TAS(lock)  tas(lock)
+
+static __inline__ int
+tas(volatile slock_t *lock)
+{
+       register slock_t _res;
+
+       __asm__ __volatile__(
+               "       ldq             $0, %1  \n"
+               "       bne             $0, 2f  \n"
+               "       ldq_l   %0, %1  \n"
+               "       bne             %0, 2f  \n"
+               "       mov             1,  $0  \n"
+               "       stq_c   $0, %1  \n"
+               "       beq             $0, 2f  \n"
+               "       mb                              \n"
+               "       br              3f              \n"
+               "2:     mov             1, %0   \n"
+               "3:                                     \n"
+:              "=&r"(_res), "+m"(*lock)
+:
+:              "memory", "0");
+       return (int) _res;
 }
 
-#endif  /* NEED_NS32K_TAS_ASM */
+#define S_UNLOCK(lock) \
+do \
+{\
+       __asm__ __volatile__ (" mb \n"); \
+       *((volatile slock_t *) (lock)) = 0; \
+} while (0)
+
+#endif /* __alpha || __alpha__ */
+
+
+/* These live in s_lock.c, but only for gcc */
+
+
+#if defined(__m68k__)
+#define HAS_TEST_AND_SET
+
+typedef unsigned char slock_t;
+#endif
+
+
+#if defined(__mips__) && !defined(__sgi)
+#define HAS_TEST_AND_SET
+
+typedef unsigned int slock_t;
+#endif
+
+
+#endif /* __GNUC__ */
 
 
 
-#else                                                  /* __GNUC__ */
 /***************************************************************************
- * All non gcc
+ * Platforms that use non-gcc inline assembly:
  */
 
-#if defined(__alpha)
-/*
- * OSF/1 (Alpha AXP)
- *
- * Note that slock_t on the Alpha AXP is msemaphore instead of char
- * (see storage/ipc.h).
- */
-#define TAS(lock)      (msem_lock((lock), MSEM_IF_NOWAIT) < 0)
-#define S_UNLOCK(lock) msem_unlock((lock), 0)
-#define S_INIT_LOCK(lock)      msem_init((lock), MSEM_UNLOCKED)
-#define S_LOCK_FREE(lock)      (!(lock)->msem_state)
-#endif  /* __alpha */
+#if !defined(HAS_TEST_AND_SET) /* We didn't trigger above, let's try here */
 
 
+#if defined(USE_UNIVEL_CC)
+#define HAS_TEST_AND_SET
 
-#if defined(NEED_I386_TAS_ASM)
-/* non gcc i386 based things */
+typedef unsigned char slock_t;
 
-#if defined(USE_UNIVEL_CC)
 #define TAS(lock)      tas(lock)
 
 asm int
-tas(slock_t *s_lock)
+tas(volatile slock_t *s_lock)
 {
 /* UNIVEL wants %mem in column 1, so we don't pg_indent this file */
 %mem s_lock
@@ -224,45 +501,120 @@ tas(slock_t *s_lock)
        popl %ebx
 }
 
-#endif  /* USE_UNIVEL_CC */
+#endif  /* defined(USE_UNIVEL_CC) */
 
-#endif  /* NEED_I386_TAS_ASM */
 
-#endif  /* defined(__GNUC__) */
+#if defined(__alpha) || defined(__alpha__)
+/*
+ * The Tru64 compiler doesn't support gcc-style inline asm, but it does
+ * have some builtin functions that accomplish much the same results.
+ * For simplicity, slock_t is defined as long (ie, quadword) on Alpha
+ * regardless of the compiler in use.  LOCK_LONG and UNLOCK_LONG only
+ * operate on an int (ie, longword), but that's OK as long as we define
+ * S_INIT_LOCK to zero out the whole quadword.
+ */
+#define HAS_TEST_AND_SET
 
+typedef unsigned long slock_t;
 
+#include <alpha/builtins.h>
+#define S_INIT_LOCK(lock)  (*(lock) = 0)
+#define TAS(lock)                 (__LOCK_LONG_RETRY((lock), 1) == 0)
+#define S_UNLOCK(lock)    __UNLOCK_LONG(lock)
+
+#endif  /* __alpha || __alpha__ */
 
-/*************************************************************************
- * These are the platforms that have common code for gcc and non-gcc
- */
 
-#if defined(__hpux)
+#if defined(__hppa) || defined(__hppa__)
 /*
- * HP-UX (PA-RISC)
+ * HP's PA-RISC
  *
- * Note that slock_t on PA-RISC is a structure instead of char
- * (see include/port/hpux.h).
+ * See src/backend/port/hpux/tas.c.template for details about LDCWX.  Because
+ * LDCWX requires a 16-byte-aligned address, we declare slock_t as a 16-byte
+ * struct.  The active word in the struct is whichever has the aligned address;
+ * the other three words just sit at -1.
  *
- * a "set" slock_t has a single word cleared.  a "clear" slock_t has
- * all words set to non-zero. tas() in tas.s
+ * When using gcc, we can inline the required assembly code.
  */
+#define HAS_TEST_AND_SET
 
-#define S_UNLOCK(lock) \
-{ \
-       volatile slock_t *lock_ = (volatile slock_t *) (lock); \
-       lock_->sema[0] = lock_->sema[1] = lock_->sema[2] = lock_->sema[3] = -1; \
+typedef struct
+{
+       int                     sema[4];
+} slock_t;
+
+#define TAS_ACTIVE_WORD(lock)  ((volatile int *) (((long) (lock) + 15) & ~15))
+
+#if defined(__GNUC__)
+
+static __inline__ int
+tas(volatile slock_t *lock)
+{
+       volatile int *lockword = TAS_ACTIVE_WORD(lock);
+       register int lockval;
+
+       __asm__ __volatile__(
+               "       ldcwx   0(0,%2),%0      \n"
+:              "=r"(lockval), "+m"(*lockword)
+:              "r"(lockword)
+:              "memory");
+       return (lockval == 0);
 }
 
-#define S_LOCK_FREE(lock)      ( *(int *) (((long) (lock) + 15) & ~15) != 0)
+#endif /* __GNUC__ */
+
+#define S_UNLOCK(lock) (*TAS_ACTIVE_WORD(lock) = -1)
+
+#define S_INIT_LOCK(lock) \
+       do { \
+               volatile slock_t *lock_ = (lock); \
+               lock_->sema[0] = -1; \
+               lock_->sema[1] = -1; \
+               lock_->sema[2] = -1; \
+               lock_->sema[3] = -1; \
+       } while (0)
+
+#define S_LOCK_FREE(lock)      (*TAS_ACTIVE_WORD(lock) != 0)
+
+#endif  /* __hppa || __hppa__ */
+
+
+#if defined(__hpux) && defined(__ia64) && !defined(__GNUC__)
+
+#define HAS_TEST_AND_SET
+
+typedef unsigned int slock_t;
+
+#include <ia64/sys/inline.h>
+#define TAS(lock) _Asm_xchg(_SZ_W, lock, 1, _LDHINT_NONE)
+
+#endif /* HPUX on IA64, non gcc */
+
+
+#if defined(__QNX__) && defined(__WATCOMC__)
+/*
+ * QNX 4 using WATCOM C
+ */
+#define HAS_TEST_AND_SET
+
+typedef unsigned char slock_t;
 
-#endif  /* __hpux */
+#define TAS(lock) wc_tas(lock)
+extern slock_t wc_tas(volatile slock_t *lock);
+#pragma aux wc_tas =\
+               "       mov   al,1    " \
+               " lock  xchg    al,[esi]" \
+               parm [esi]        \
+               value [al];
+
+#endif  /* __QNX__ and __WATCOMC__*/
 
 
 #if defined(__sgi)
 /*
  * SGI IRIX 5
  * slock_t is defined as a unsigned long. We use the standard SGI
- * mutex API. 
+ * mutex API.
  *
  * The following comment is left for historical reasons, but is probably
  * not a good idea since the mutex ABI is supported.
@@ -271,43 +623,53 @@ tas(slock_t *s_lock)
  * assembly from his NECEWS SVR4 port, but we probably ought to retain this
  * for the R3000 chips out there.
  */
-#include <mutex.h>
+#define HAS_TEST_AND_SET
+
+typedef unsigned long slock_t;
+
+#include "mutex.h"
 #define TAS(lock)      (test_and_set(lock,1))
 #define S_UNLOCK(lock) (test_then_and(lock,0))
 #define S_INIT_LOCK(lock)      (test_then_and(lock,0))
 #define S_LOCK_FREE(lock)      (test_then_add(lock,0) == 0)
 #endif  /* __sgi */
 
+
 #if defined(sinix)
 /*
- * SINIX / Reliant UNIX 
+ * SINIX / Reliant UNIX
  * slock_t is defined as a struct abilock_t, which has a single unsigned long
  * member. (Basically same as SGI)
- *
  */
+#define HAS_TEST_AND_SET
+
+#include "abi_mutex.h"
+typedef abilock_t slock_t;
+
 #define TAS(lock)      (!acquire_lock(lock))
 #define S_UNLOCK(lock) release_lock(lock)
 #define S_INIT_LOCK(lock)      init_lock(lock)
 #define S_LOCK_FREE(lock)      (stat_lock(lock) == UNLOCKED)
 #endif  /* sinix */
+
 
 #if defined(_AIX)
 /*
  * AIX (POWER)
- *
- * Note that slock_t on POWER/POWER2/PowerPC is int instead of char
- * (see storage/ipc.h).
  */
-#define TAS(lock)      cs((int *) (lock), 0, 1)
+#define HAS_TEST_AND_SET
+
+typedef unsigned int slock_t;
+
+#define TAS(lock)                      _check_lock(lock, 0, 1)
+#define S_UNLOCK(lock)         _clear_lock(lock, 0)
 #endif  /* _AIX */
 
 
 #if defined (nextstep)
-/*
- * NEXTSTEP (mach)
- * slock_t is defined as a struct mutex.
- */
+#define HAS_TEST_AND_SET
+
+typedef struct mutex slock_t;
 
 #define S_LOCK(lock)   mutex_lock(lock)
 #define S_UNLOCK(lock) mutex_unlock(lock)
@@ -317,19 +679,77 @@ tas(slock_t *s_lock)
 #endif  /* nextstep */
 
 
+/* These are in s_lock.c */
+
+
+#if defined(sun3)
+#define HAS_TEST_AND_SET
+
+typedef unsigned char slock_t;
+#endif
+
+
+#if defined(__sparc__) || defined(__sparc)
+#define HAS_TEST_AND_SET
+
+typedef unsigned char slock_t;
+#endif
+
+
+/* out-of-line assembler from src/backend/port/tas/foo.s */
+
+#if defined(__sun) && defined(__i386)
+/*
+ * Solaris/386 (we only get here for non-gcc case)
+ */
+#define HAS_TEST_AND_SET
+
+typedef unsigned char slock_t;
+#endif
+
+
+#endif /* !defined(HAS_TEST_AND_SET) */
+
 
+/* Blow up if we didn't have any way to do spinlocks */
+#ifndef HAS_TEST_AND_SET
+#error PostgreSQL does not have native spinlock support on this platform.  To continue the compilation, rerun configure using --disable-spinlocks.  However, performance will be poor.  Please report this to pgsql-bugs@postgresql.org.
+#endif
+
+
+#else  /* !HAVE_SPINLOCKS */
+
+
+/*
+ * Fake spinlock implementation using semaphores --- slow and prone
+ * to fall foul of kernel limits on number of semaphores, so don't use this
+ * unless you must!  The subroutines appear in spin.c.
+ */
+typedef PGSemaphoreData slock_t;
 
-/****************************************************************************
+extern bool s_lock_free_sema(volatile slock_t *lock);
+extern void s_unlock_sema(volatile slock_t *lock);
+extern void s_init_lock_sema(volatile slock_t *lock);
+extern int     tas_sema(volatile slock_t *lock);
+
+#define S_LOCK_FREE(lock)      s_lock_free_sema(lock)
+#define S_UNLOCK(lock)  s_unlock_sema(lock)
+#define S_INIT_LOCK(lock)      s_init_lock_sema(lock)
+#define TAS(lock)      tas_sema(lock)
+
+
+#endif /* HAVE_SPINLOCKS */
+
+
+/*
  * Default Definitions - override these above as needed.
  */
 
 #if !defined(S_LOCK)
-extern void s_lock(volatile slock_t *lock, const char *file, const int line);
-
 #define S_LOCK(lock) \
        do { \
-               if (TAS((volatile slock_t *) lock)) \
-                       s_lock((volatile slock_t *) lock, __FILE__, __LINE__); \
+               if (TAS(lock)) \
+                       s_lock((lock), __FILE__, __LINE__); \
        } while (0)
 #endif  /* S_LOCK */
 
@@ -338,19 +758,28 @@ extern void s_lock(volatile slock_t *lock, const char *file, const int line);
 #endif  /* S_LOCK_FREE */
 
 #if !defined(S_UNLOCK)
-#define S_UNLOCK(lock)         (*(lock) = 0)
+#define S_UNLOCK(lock)         (*((volatile slock_t *) (lock)) = 0)
 #endif  /* S_UNLOCK */
 
 #if !defined(S_INIT_LOCK)
 #define S_INIT_LOCK(lock)      S_UNLOCK(lock)
 #endif  /* S_INIT_LOCK */
 
+#if !defined(SPIN_DELAY)
+#define SPIN_DELAY()   ((void) 0)
+#endif  /* SPIN_DELAY */
+
 #if !defined(TAS)
-int                    tas(volatile slock_t *lock);            /* port/.../tas.s, or
+extern int     tas(volatile slock_t *lock);            /* in port/.../tas.s, or
                                                                                                 * s_lock.c */
 
-#define TAS(lock)              tas((volatile slock_t *) lock)
+#define TAS(lock)              tas(lock)
 #endif  /* TAS */
 
-#endif  /* HAS_TEST_AND_SET */
+
+/*
+ * Platform-independent out-of-line support routines
+ */
+extern void s_lock(volatile slock_t *lock, const char *file, int line);
+
 #endif  /* S_LOCK_H */