<!DOCTYPE html><html><head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
  </head>
  <body>
    Am 22.08.24 um 08:47 schrieb Thomas Hellström:<br>
    <blockquote type="cite" cite="mid:e3716526ae9b530adddc815ca12c402b4cf7678b.camel@linux.intel.com"><span style="white-space: pre-wrap">
</span>
      <blockquote type="cite">
        <blockquote type="cite">
          <blockquote type="cite">
            <pre class="moz-quote-pre" wrap="">As Sima said, this is complicated but not beyond comprehension:
i915
<a class="moz-txt-link-freetext" href="https://elixir.bootlin.com/linux/v6.11-rc4/source/drivers/gpu/drm/i915/gem/i915_gem_shrinker.c#L317">https://elixir.bootlin.com/linux/v6.11-rc4/source/drivers/gpu/drm/i915/gem/i915_gem_shrinker.c#L317</a>
</pre>
          </blockquote>
          <pre class="moz-quote-pre" wrap="">
As far as I can tell what i915 does here is extremely questionable.

     if (sc->nr_scanned < sc->nr_to_scan && current_is_kswapd()) {
....
         with_intel_runtime_pm(&i915->runtime_pm, wakeref) {

with_intel_runtime_pm() then calls pm_runtime_get_sync().

So basically the i915 shrinker assumes that when called from
kswapd()
that it can synchronously wait for runtime PM to power up the
device
again.

As far as I can tell that means that a device driver makes strong
and
completely undocumented assumptions how kswapd works internally.
</pre>
        </blockquote>
        <pre class="moz-quote-pre" wrap="">
Admittedly that looks weird

But I'd really expect a reclaim lockdep splat to happen there if the
i915 pm did something not-allowed. IIRC, the design direction the
i915
people got from mm people regarding the shrinkers was to avoid any
sleeps in direct reclaim and punt it to kswapd. Need to ask i915
people
how they can get away with that.


</pre>
      </blockquote>
      <pre class="moz-quote-pre" wrap="">
So it turns out that Xe integrated pm resume is reclaim-safe, and I'd
expect i915's to be as well. Xe discrete pm resume isn't.

So that means that, at least for integrated, the i915 shrinker should
be ok from that POW, and punting certain bos to kswapd is not AFAICT
abusing any undocumented features of kswapd but rather a way to avoid
resuming the device during direct reclaim, like documented.</pre>
    </blockquote>
    <br>
    The more I think about this the more I disagree to this driver
    design. In my opinion device drivers should *never* resume runtime
    PM in a shrinker callback in the first place.<br>
    <br>
    When the device is turned off it means that all of it's operations
    are stopped and eventually power to caches etc turned off as well.
    So I don't see any ongoing writeback operations or similar either.<br>
    <br>
    So the question is why do we need to power on the device in a
    shrinker in the first place?<br>
    <br>
    What could be is that the device needs to flush GART TLBs or similar
    when it is turned on, e.g. that you grab a PM reference to make sure
    that during your HW operation the device doesn't suspend.<br>
    <br>
    But that doesn't mean that you should resume the device. In other
    words when the device is powered down you shouldn't power it up
    again.<br>
    <br>
    And for GART we already have the necessary move callback implemented
    in TTM. This is done by radeon, amdgpu and nouveu in a common way as
    far as I can see.<br>
    <br>
    So why should Xe be special and follow the very questionable
    approach of i915 here?<br>
    <br>
    Regards,<br>
    Christian.<br>
    <br>
    <br>
    <blockquote type="cite" cite="mid:e3716526ae9b530adddc815ca12c402b4cf7678b.camel@linux.intel.com">
      <pre class="moz-quote-pre" wrap="">

/Thomas



</pre>
    </blockquote>
    <br>
  </body>
</html>