this produces better assembly code
Change-Id: I80ed1a165512e941b35a4965faa0c44403357e91
src += src_stride;
dst += dst_stride;
h -= 2;
- } while (h > 0);
+ } while (h != 0);
} else if (w == 8) { // copy8
uint8x8_t s0, s1;
do {
vst1_u8(dst, s1);
dst += dst_stride;
h -= 2;
- } while (h > 0);
+ } while (h != 0);
} else if (w < 32) { // copy16
uint8x16_t s0, s1;
do {
vst1q_u8(dst, s1);
dst += dst_stride;
h -= 2;
- } while (h > 0);
+ } while (h != 0);
} else if (w == 32) { // copy32
uint8x16_t s0, s1, s2, s3;
do {
vst1q_u8(dst + 16, s3);
dst += dst_stride;
h -= 2;
- } while (h > 0);
+ } while (h != 0);
} else { // copy64
uint8x16_t s0, s1, s2, s3;
do {