]> granicus.if.org Git - zfs/commit
Illumos #3552
authorGeorge Wilson <george.wilson@delphix.com>
Thu, 21 Feb 2013 21:58:29 +0000 (13:58 -0800)
committerBrian Behlendorf <behlendorf1@llnl.gov>
Fri, 18 Oct 2013 21:34:01 +0000 (14:34 -0700)
commit7a6144076166944655d86f1449be8566d1a3c71a
treec038d9fa6ea3dd6c5b50936ce216618b7ff1d869
parenta6ce1eae54ca048ae7e7dfdcad05c5565a129226
Illumos #3552

3552 condensing one space map burns 3 seconds of CPU in spa_sync()
     thread (fix race condition)

References:
  https://www.illumos.org/issues/3552
  illumos/illumos-gate@03f8c366886542ed249a15d755ae78ea4e775d9d

Ported-by: Richard Yao <ryao@gentoo.org>
Signed-off-by: Brian Behlendorf <behlendorf1@llnl.gov>
Porting notes:

This fixes an upstream regression that was introduced in commit
zfsonlinux/zfs@e51be06697762215dc3b679f8668987034a5a048, which
ported the Illumos 3552 changes. This fix was added to upstream
rather quickly, but at the time of the port, no one spotted it and
the race was rare enough that it passed our regression tests. I
discovered this when comparing our metaslab.c to the illumos
metaslab.c.

Without this change it is possible for metaslab_group_alloc() to
consume a large amount of cpu time.  Since this occurs under a
mutex in a rcu critical section the kernel will log this to the
console as a self-detected cpu stall as follows:

  INFO: rcu_sched self-detected stall on CPU { 0}
  (t=60000 jiffies g=11431890 c=11431889 q=18271)

Closes #1687
Closes #1720
Closes #1731
Closes #1747
module/zfs/metaslab.c