Use a shuffle with undef elements instead of inserting 0s in the 128-bit to 256-bit...

author Craig Topper <craig.topper@gmail.com>

Mon, 5 Aug 2013 06:17:21 +0000 (06:17 +0000)

committer Craig Topper <craig.topper@gmail.com>

Mon, 5 Aug 2013 06:17:21 +0000 (06:17 +0000)
author Craig Topper <craig.topper@gmail.com>
Mon, 5 Aug 2013 06:17:21 +0000 (06:17 +0000)
committer Craig Topper <craig.topper@gmail.com>
Mon, 5 Aug 2013 06:17:21 +0000 (06:17 +0000)
diff --git a/lib/Headers/avxintrin.h b/lib/Headers/avxintrin.h

index f522ac72f24301ce6dacf2f1a49f2ba4855778dd..50454f265368170146a261f43aa2d56b6a470174 100644 (file)
--- a/lib/Headers/avxintrin.h
+++ b/lib/Headers/avxintrin.h
@@ -1137,22 +1137,19 @@ _mm256_castsi256_si128(__m256i __a)
  static __inline __m256d __attribute__((__always_inline__, __nodebug__))
  _mm256_castpd128_pd256(__m128d __a)
  {
-  __m128d __zero = _mm_setzero_pd();
-  return __builtin_shufflevector(__a, __zero, 0, 1, 2, 2);
+  return __builtin_shufflevector(__a, __a, 0, 1, -1, -1);
  }
  
  static __inline __m256 __attribute__((__always_inline__, __nodebug__))
  _mm256_castps128_ps256(__m128 __a)
  {
-  __m128 __zero = _mm_setzero_ps();
-  return __builtin_shufflevector(__a, __zero, 0, 1, 2, 3, 4, 4, 4, 4);
+  return __builtin_shufflevector(__a, __a, 0, 1, 2, 3, -1, -1, -1, -1);
  }
  
  static __inline __m256i __attribute__((__always_inline__, __nodebug__))
  _mm256_castsi128_si256(__m128i __a)
  {
-  __m128i __zero = _mm_setzero_si128();
-  return __builtin_shufflevector(__a, __zero, 0, 1, 2, 2);
+  return __builtin_shufflevector(__a, __a, 0, 1, -1, -1);
  }
  
  /* SIMD load ops (unaligned) */
author	Craig Topper <craig.topper@gmail.com>
	Mon, 5 Aug 2013 06:17:21 +0000 (06:17 +0000)
committer	Craig Topper <craig.topper@gmail.com>
	Mon, 5 Aug 2013 06:17:21 +0000 (06:17 +0000)