]> granicus.if.org Git - postgresql/commit
Clean up the Simple-8b encoder code.
authorHeikki Linnakangas <heikki.linnakangas@iki.fi>
Mon, 25 Mar 2019 09:39:51 +0000 (11:39 +0200)
committerHeikki Linnakangas <heikki.linnakangas@iki.fi>
Mon, 25 Mar 2019 09:39:51 +0000 (11:39 +0200)
commitd303122eab616ccbcfb0bab0fc674bf625d17a7b
tree64569a591981fac71568bdc118493c8d34ea4f06
parent148cf5f462e53f374a2085b2fa8dcde944539b03
Clean up the Simple-8b encoder code.

Coverity complained that simple8b_encode() might read beyond the end of
the 'diffs' array, in the loop to encode the integers. That was a false
positive, because we never get into the loop in modes 0 or 1, and the
array is large enough for all the other modes. But I admit it's very
subtle, so it's not surprising that Coverity didn't see it, and it's not
very obvious to humans either. Refactor it, so that the second loop
re-computes the differences, instead of carrying them over from the first
loop in the 'diffs' array. This way, the 'diffs' array is not needed
anymore. It makes no measurable difference in performance, and seems more
straightforward this way.

Also, improve the comments in simple8b_encode(): fix the comment about its
return value that was flat-out wrong, and explain the condition when it
returns EMPTY_CODEWORD better.

In the passing, move the 'selector' from the codeword's low bits to the
high bits. It doesn't matter much, but looking at the original paper, and
googling around for other Simple-8b implementations, that's how it's
usually done.

Per Coverity, and Tom Lane's report off-list.
src/backend/lib/integerset.c
src/test/modules/test_integerset/test_integerset.c