]> granicus.if.org Git - llvm/commit
[BasicAA] Support arbitrary pointer sizes (and fix an overflow bug)
authorHal Finkel <hfinkel@anl.gov>
Wed, 2 Jan 2019 16:28:09 +0000 (16:28 +0000)
committerHal Finkel <hfinkel@anl.gov>
Wed, 2 Jan 2019 16:28:09 +0000 (16:28 +0000)
commitccb51b9cdd38481aa6658542590c034a8a34daff
treed8d79538388445979ee4cf944e403507e4f5b5c1
parent60162315869ce8d72a15a55d5a2c8a4bc7598eaf
[BasicAA] Support arbitrary pointer sizes (and fix an overflow bug)

Motivated by the discussion in D38499, this patch updates BasicAA to support
arbitrary pointer sizes by switching most remaining non-APInt calculations to
use APInt. The size of these APInts is set to the maximum pointer size (maximum
over all address spaces described by the data layout string).

Most of this translation is straightforward, but this patch contains a fix for
a bug that revealed itself during this translation process. In order for
test/Analysis/BasicAA/gep-and-alias.ll to pass, which is run with 32-bit
pointers, the intermediate calculations must be performed using 64-bit
integers. This is because, as noted in the patch, when GetLinearExpression
decomposes an expression into C1*V+C2, and we then multiply this by Scale, and
distribute, to get (C1*Scale)*V + C2*Scale, it can be the case that, even
through C1*V+C2 does not overflow for relevant values of V, (C2*Scale) can
overflow. If this happens, later logic will draw invalid conclusions from the
(base) offset value. Thus, when initially applying the APInt conversion,
because the maximum pointer size in this test is 32 bits, it started failing.
Suspicious, I created a 64-bit version of this test (included here), and that
failed (miscompiled) on trunk for a similar reason (the multiplication can
overflow).

After fixing this overflow bug, the first test case (at least) in
Analysis/BasicAA/q.bad.ll started failing. This is also a 32-bit test, and was
relying on having 64-bit intermediate values to have BasicAA return an accurate
result. In order to fix this problem, and because I believe that it is not
uncommon to use i64 indexing expressions in 32-bit code (especially portable
code using int64_t), it seems reasonable to always use at least 64-bit
integers. In this way, we won't regress our analysis capabilities (and there's
a command-line option added, so experimenting with this should be easy).

As pointed out by Eli during the review, there are other potential overflow
conditions that this patch does not address. Fixing those is left to follow-up
work.

Patch by me with contributions from Michael Ferguson (mferguson@cray.com).

Differential Revision: https://reviews.llvm.org/D38662

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@350220 91177308-0d34-0410-b5e6-96231b3b80d8
include/llvm/Analysis/BasicAliasAnalysis.h
include/llvm/IR/DataLayout.h
lib/Analysis/BasicAliasAnalysis.cpp
lib/IR/DataLayout.cpp
test/Analysis/BasicAA/128-bit-ptr.ll [new file with mode: 0644]
test/Analysis/BasicAA/gep-and-alias-64.ll [new file with mode: 0644]
test/Analysis/BasicAA/gep-and-alias.ll