]> granicus.if.org Git - zfs/commit
Batch free zpl_posix_acl_release
authorChunwei Chen <david.chen@osnexus.com>
Fri, 28 Oct 2016 20:37:00 +0000 (13:37 -0700)
committerBrian Behlendorf <behlendorf1@llnl.gov>
Mon, 7 Nov 2016 19:04:44 +0000 (11:04 -0800)
commit8e71ab99dc4a591d41ab0d9255ddca3e914f47e4
treea76b7f97cf6d18501094e37626fad5b235b44415
parent83bf769d500a231eac023c9f9f88719ad205694e
Batch free zpl_posix_acl_release

Currently every calls to zpl_posix_acl_release will schedule a delayed task,
and each delayed task will add a timer. This used to be fine except for
possibly bad performance impact.

However, in Linux 4.8, a new timer wheel implementation[1] is introduced. In
this new implementation, the larger the delay, the less accuracy the timer is.
So when we have a flood of timer from zpl_posix_acl_release, they will expire
at the same time. Couple with the fact that task_expire will do linear search
with lock held. This causes an extreme amount of contention inside interrupt
and would actually lockup the system.

We fix this by doing batch free to prevent a flood of delayed task. Every call
to zpl_posix_acl_release will put the posix_acl to be freed on a lockless
list. Every batch window, 1 sec, the zpl_posix_acl_free will fire up and free
every posix_acl that passed the grace period on the list. This way, we only
have one delayed task every second.

[1] https://lwn.net/Articles/646950/

Signed-off-by: Chunwei Chen <david.chen@osnexus.com>
include/linux/vfs_compat.h
module/zfs/zfs_vfsops.c
module/zfs/zpl_xattr.c