基于AMD EPYC平台的Linux内核5.0〜5.9基准测试表明,正在开发的Linux内核5.9在某些工作负载条件下降低了性能问题。 据报道,此问题主要发生在测试项目中,例如Apache HTTPD Web服务器。 为了解决这个问题,由Linus Torvalds领导的开发团队决定一分为二,并提出了一种基于侧锁公平性的解决方案。
这个问题的底层原理有些复杂,简单讲就是由于页面锁太讲究“公平性”,有时反而会导致性能的倒退。
Linus Torvalds 和其他开发者共同研究了如何进一步改善页面锁定行为,并于今日将一个短期解决方案合并到了 Linux 5.9 的主线补丁更新中。
这项名叫 2a9127fcf229 的合并提交(mm: rewrite wait_on_page_bit_common() logic”),允许更改页面锁中控制非公平性的参数。若在有锁的情况下等待,系统就会严格按照顺序来调动数据。
这项修订旨在消除长期存在的“看门狗”故障,其涉及在极端负载状况下的页面锁定。在此过程中,如果遭到其它页面的锁定,相关进程很可能陷入永久等待。
此外虽然 Linux 5.9 在某些基准测试项目上的跑分很是亮眼,但副作用却是导致其它一些基准测试项目的性能出现大幅滑退,比如平均延迟和吞吐量的恶化。
本次修订并非完全撤销此前的策略,而是引入了对页面锁定非公平性的可控制方案。虽然默认设置已经相对均衡,但有需要的开发者仍可通过 sysctl 接口进行调整。
显然,这些方案都围绕着页面锁定的重要性、以及某些锁定状况下的竞争程度来展开,但主要的争论似乎与 IO 无关(页面锁的起源)、对于页面文件的映射也是相对稳定的(除了错误地插入页表)。
此外开发者也可通过 sysctl sysctl_page_lock_unfairness(或 / proc / sys / vm / page_lock_unfairness)来调节内核页面锁定的非公平性程度(默认数值 0 为公平模式)。