]> granicus.if.org Git - postgresql/blobdiff - src/include/storage/s_lock.h
Add spinlock support for Itanium processor with Intel compiler.
[postgresql] / src / include / storage / s_lock.h
index 9ab24f93ae7cfc412486879e9ab98dcf4ea23db7..49bb9f64c210e4a5e06c567f95233442b90b57f6 100644 (file)
  *     when using the SysV semaphore code.
  *
  *
- * Portions Copyright (c) 1996-2003, PostgreSQL Global Development Group
+ * Portions Copyright (c) 1996-2005, PostgreSQL Global Development Group
  * Portions Copyright (c) 1994, Regents of the University of California
  *
- *       $PostgreSQL: pgsql/src/include/storage/s_lock.h,v 1.124 2003/12/27 20:58:58 tgl Exp $
+ *       $PostgreSQL: pgsql/src/include/storage/s_lock.h,v 1.134 2005/03/10 21:41:01 momjian Exp $
  *
  *-------------------------------------------------------------------------
  */
  * Other compilers use __cpu or __cpu__ so we test for both in those cases.
  */
 
-/*
- * Standard gcc asm format is:
- *
+/*----------
+ * Standard gcc asm format (assuming "volatile slock_t *lock"):
+
        __asm__ __volatile__(
-               "       command \n"
-               "       command \n"
-               "       command \n"
-:              "=r"(_res)                      return value, in register
-:              "r"(lock)                       argument, 'lock pointer', in register
-:              "r0");                          inline code uses this register
+               "       instruction     \n"
+               "       instruction     \n"
+               "       instruction     \n"
+:              "=r"(_res), "+m"(*lock)         // return register, in/out lock value
+:              "r"(lock)                                       // lock pointer, in input register
+:              "memory", "cc");                        // show clobbered registers here
+
+ * The output-operands list (after first colon) should always include
+ * "+m"(*lock), whether or not the asm code actually refers to this
+ * operand directly.  This ensures that gcc believes the value in the
+ * lock variable is used and set by the asm code.  Also, the clobbers
+ * list (after third colon) should always include "memory"; this prevents
+ * gcc from thinking it can cache the values of shared-memory fields
+ * across the asm code.  Add "cc" if your asm code changes the condition
+ * code register, and also list any temp registers the code uses.
+ *----------
  */
 
 
@@ -117,8 +127,9 @@ tas(volatile slock_t *lock)
                "       lock                    \n"
                "       xchgb   %0,%1   \n"
                "1: \n"
-:              "=q"(_res), "=m"(*lock)
-:              "0"(_res));
+:              "+q"(_res), "+m"(*lock)
+:
+:              "memory", "cc");
        return (int) _res;
 }
 
@@ -127,15 +138,37 @@ tas(volatile slock_t *lock)
 static __inline__ void
 spin_delay(void)
 {
+       /*
+        * This sequence is equivalent to the PAUSE instruction ("rep" is
+        * ignored by old IA32 processors if the following instruction is
+        * not a string operation); the IA-32 Architecture Software
+        * Developer's Manual, Vol. 3, Section 7.7.2 describes why using
+        * PAUSE in the inner loop of a spin lock is necessary for good
+        * performance:
+        *
+        *     The PAUSE instruction improves the performance of IA-32
+        *     processors supporting Hyper-Threading Technology when
+        *     executing spin-wait loops and other routines where one
+        *     thread is accessing a shared lock or semaphore in a tight
+        *     polling loop. When executing a spin-wait loop, the
+        *     processor can suffer a severe performance penalty when
+        *     exiting the loop because it detects a possible memory order
+        *     violation and flushes the core processor's pipeline. The
+        *     PAUSE instruction provides a hint to the processor that the
+        *     code sequence is a spin-wait loop. The processor uses this
+        *     hint to avoid the memory order violation and prevent the
+        *     pipeline flush. In addition, the PAUSE instruction
+        *     de-pipelines the spin-wait loop to prevent it from
+        *     consuming execution resources excessively.
+        */
        __asm__ __volatile__(
-               " rep; nop                      \n"
-               : : : "memory");
+               " rep; nop                      \n");
 }
 
 #endif  /* __i386__ || __x86_64__ */
 
 
-#if defined(__ia64__) || defined(__ia64)  /* __ia64 used by ICC compiler? */
+#if defined(__ia64__) || defined(__ia64)
 /* Intel Itanium */
 #define HAS_TEST_AND_SET
 
@@ -143,6 +176,8 @@ typedef unsigned int slock_t;
 
 #define TAS(lock) tas(lock)
 
+#ifndef __INTEL_COMPILER
+
 static __inline__ int
 tas(volatile slock_t *lock)
 {
@@ -150,13 +185,25 @@ tas(volatile slock_t *lock)
 
        __asm__ __volatile__(
                "       xchg4   %0=%1,%2        \n"
-:              "=r"(ret), "=m"(*lock)
-:              "r"(1), "1"(*lock)
+:              "=r"(ret), "+m"(*lock)
+:              "r"(1)
 :              "memory");
-
        return (int) ret;
 }
 
+#else
+
+static __inline__ int
+tas(volatile slock_t *lock)
+{
+       int             ret;
+
+       ret = _InterlockedExchange(lock,1);     /* this is a xchg asm macro */
+
+       return ret;
+}
+
+#endif
 #endif  /* __ia64__ || __ia64 */
 
 
@@ -173,17 +220,18 @@ tas(volatile slock_t *lock)
        register slock_t _res = 1;
 
        __asm__ __volatile__(
-               "       swpb    %0, %0, [%3]    \n"
-:              "=r"(_res), "=m"(*lock)
-:              "0"(_res), "r"(lock));
+               "       swpb    %0, %0, [%2]    \n"
+:              "+r"(_res), "+m"(*lock)
+:              "r"(lock)
+:              "memory");
        return (int) _res;
 }
 
 #endif  /* __arm__ */
 
 
-#if defined(__s390__) && !defined(__s390x__)
-/* S/390 Linux */
+#if defined(__s390__) || defined(__s390x__)
+/* S/390 and S/390x Linux (32- and 64-bit zSeries) */
 #define HAS_TEST_AND_SET
 
 typedef unsigned int slock_t;
@@ -193,51 +241,17 @@ typedef unsigned int slock_t;
 static __inline__ int
 tas(volatile slock_t *lock)
 {
-       int                     _res;
+       int                     _res = 0;
 
        __asm__ __volatile__(
-               "       la      1,1                     \n"
-               "       l       2,%2            \n"
-               "       slr 0,0                 \n"
-               "       cs      0,1,0(2)        \n"
-               "       lr      %1,0            \n"
-:              "=m"(lock), "=d"(_res)
-:              "m"(lock)
-:              "0", "1", "2");
-
-       return (_res);
-}
-
-#endif  /* __s390__ */
-
-
-#if defined(__s390x__)
-/* S/390x Linux (64-bit zSeries) */
-#define HAS_TEST_AND_SET
-
-typedef unsigned int slock_t;
-
-#define TAS(lock)         tas(lock)
-
-static __inline__ int
-tas(volatile slock_t *lock)
-{
-       int                     _res;
-
-       __asm__ __volatile__(
-               "       la      1,1                     \n"
-               "       lg      2,%2            \n"
-               "       slr 0,0                 \n"
-               "       cs      0,1,0(2)        \n"
-               "       lr      %1,0            \n"
-:              "=m"(lock), "=d"(_res)
-:              "m"(lock)
-:              "0", "1", "2");
-
-       return (_res);
+               "       cs      %0,%3,0(%2)             \n"
+:              "+d"(_res), "+m"(*lock)
+:              "a"(lock), "d"(1)
+:              "memory", "cc");
+       return _res;
 }
 
-#endif  /* __s390x__ */
+#endif  /* __s390__ || __s390x__ */
 
 
 #if defined(__sparc__)
@@ -250,12 +264,13 @@ typedef unsigned char slock_t;
 static __inline__ int
 tas(volatile slock_t *lock)
 {
-       register slock_t _res = 1;
+       register slock_t _res;
 
        __asm__ __volatile__(
                "       ldstub  [%2], %0        \n"
-:              "=r"(_res), "=m"(*lock)
-:              "r"(lock));
+:              "=r"(_res), "+m"(*lock)
+:              "r"(lock)
+:              "memory");
        return (int) _res;
 }
 
@@ -283,11 +298,11 @@ tas(volatile slock_t *lock)
        int _res;
 
        __asm__ __volatile__(
-"      lwarx   %0,0,%2         \n"
+"      lwarx   %0,0,%3         \n"
 "      cmpwi   %0,0            \n"
 "      bne     1f                      \n"
 "      addi    %0,%0,1         \n"
-"      stwcx.  %0,0,%2         \n"
+"      stwcx.  %0,0,%3         \n"
 "      beq     2f              \n"
 "1:    li      %1,1            \n"
 "      b               3f                      \n"
@@ -296,10 +311,9 @@ tas(volatile slock_t *lock)
 "      li      %1,0            \n"
 "3:                                            \n"
 
-:      "=&r" (_t), "=r" (_res)
-:      "r" (lock)
-:      "cc", "memory"
-       );
+:      "=&r"(_t), "=r"(_res), "+m"(*lock)
+:      "r"(lock)
+:      "memory", "cc");
        return _res;
 }
 
@@ -330,10 +344,9 @@ tas(volatile slock_t *lock)
                "       clrl    %0              \n"
                "       tas             %1              \n"
                "       sne             %0              \n"
-:              "=d"(rv), "=m"(*lock)
-:              "1"(*lock)
-:              "cc");
-
+:              "=d"(rv), "+m"(*lock)
+:
+:              "memory", "cc");
        return rv;
 }
 
@@ -357,13 +370,13 @@ tas(volatile slock_t *lock)
        register int    _res;
 
        __asm__ __volatile__(
-               "       movl    $1, r0                  \n"
-               "       bbssi   $0, (%1), 1f    \n"
-               "       clrl    r0                              \n"
-               "1:     movl    r0, %0                  \n"
-:              "=r"(_res)
+               "       movl    $1, %0                  \n"
+               "       bbssi   $0, (%2), 1f    \n"
+               "       clrl    %0                              \n"
+               "1: \n"
+:              "=&r"(_res), "+m"(*lock)
 :              "r"(lock)
-:              "r0");
+:              "memory");
        return _res;
 }
 
@@ -383,9 +396,11 @@ tas(volatile slock_t *lock)
        register int    _res;
 
        __asm__ __volatile__(
-               "       sbitb   0, %0   \n"
-               "       sfsd    %1              \n"
-:              "=m"(*lock), "=r"(_res));
+               "       sbitb   0, %1   \n"
+               "       sfsd    %0              \n"
+:              "=r"(_res), "+m"(*lock)
+:
+:              "memory");
        return _res;
 }
 
@@ -404,12 +419,6 @@ tas(volatile slock_t *lock)
 typedef unsigned long slock_t;
 
 #define TAS(lock)  tas(lock)
-#define S_UNLOCK(lock) \
-do \
-{\
-       __asm__ __volatile__ (" mb \n"); \
-       *((volatile slock_t *) (lock)) = 0; \
-} while (0)
 
 static __inline__ int
 tas(volatile slock_t *lock)
@@ -417,24 +426,30 @@ tas(volatile slock_t *lock)
        register slock_t _res;
 
        __asm__ __volatile__(
-               "       ldq             $0, %0  \n"
+               "       ldq             $0, %1  \n"
                "       bne             $0, 2f  \n"
-               "       ldq_l   %1, %0  \n"
-               "       bne             %1, 2f  \n"
+               "       ldq_l   %0, %1  \n"
+               "       bne             %0, 2f  \n"
                "       mov             1,  $0  \n"
-               "       stq_c   $0, %0  \n"
+               "       stq_c   $0, %1  \n"
                "       beq             $0, 2f  \n"
                "       mb                              \n"
                "       br              3f              \n"
-               "2:     mov             1, %1   \n"
+               "2:     mov             1, %0   \n"
                "3:                                     \n"
-:              "=m"(*lock), "=r"(_res)
+:              "=&r"(_res), "+m"(*lock)
 :
-:              "0");
-
+:              "memory", "0");
        return (int) _res;
 }
 
+#define S_UNLOCK(lock) \
+do \
+{\
+       __asm__ __volatile__ (" mb \n"); \
+       *((volatile slock_t *) (lock)) = 0; \
+} while (0)
+
 #endif /* __alpha || __alpha__ */
 
 
@@ -451,7 +466,7 @@ typedef unsigned char slock_t;
 #if defined(__mips__) && !defined(__sgi)
 #define HAS_TEST_AND_SET
 
-typedef unsigned char slock_t;
+typedef unsigned int slock_t;
 #endif
 
 
@@ -510,7 +525,7 @@ typedef unsigned long slock_t;
 #endif  /* __alpha || __alpha__ */
 
 
-#if defined(__hppa)
+#if defined(__hppa) || defined(__hppa__)
 /*
  * HP's PA-RISC
  *
@@ -540,8 +555,9 @@ tas(volatile slock_t *lock)
 
        __asm__ __volatile__(
                "       ldcwx   0(0,%2),%0      \n"
-:              "=r"(lockval), "=m"(*lockword)
-:              "r"(lockword));
+:              "=r"(lockval), "+m"(*lockword)
+:              "r"(lockword)
+:              "memory");
        return (lockval == 0);
 }
 
@@ -560,7 +576,19 @@ tas(volatile slock_t *lock)
 
 #define S_LOCK_FREE(lock)      (*TAS_ACTIVE_WORD(lock) != 0)
 
-#endif  /* __hppa */
+#endif  /* __hppa || __hppa__ */
+
+
+#if defined(__hpux) && defined(__ia64) && !defined(__GNUC__)
+
+#define HAS_TEST_AND_SET
+
+typedef unsigned int slock_t;
+
+#include <ia64/sys/inline.h>
+#define TAS(lock) _Asm_xchg(_SZ_W, lock, 1, _LDHINT_NONE)
+
+#endif /* HPUX on IA64, non gcc */
 
 
 #if defined(__QNX__) && defined(__WATCOMC__)
@@ -668,6 +696,18 @@ typedef unsigned char slock_t;
 #endif
 
 
+/* out-of-line assembler from src/backend/port/tas/foo.s */
+
+#if defined(__sun) && defined(__i386)
+/*
+ * Solaris/386 (we only get here for non-gcc case)
+ */
+#define HAS_TEST_AND_SET
+
+typedef unsigned char slock_t;
+#endif
+
+
 #endif /* !defined(HAS_TEST_AND_SET) */