<div dir="ltr"><div>Hi, </div><div>In my tests, the performance drop ranges from a few percent up to 13% in Unigine Superposition</div><div>under heavy memory usage on the CPU Core Ultra 155H with the Xe 128 EU GPU. </div><div>Other users have reported performance impact up to 30% on certain workloads.</div><div>Please find more  in the regressions reports:</div><div><a href="https://gitlab.freedesktop.org/drm/i915/kernel/-/issues/14645">https://gitlab.freedesktop.org/drm/i915/kernel/-/issues/14645</a></div><div><a href="https://gitlab.freedesktop.org/drm/i915/kernel/-/issues/13845">https://gitlab.freedesktop.org/drm/i915/kernel/-/issues/13845</a><br><br></div><div>I believe the change should be backported to all active kernel branches after version 6.12.</div><div><br></div><div>best regards,</div><div>Patryk</div><div><br></div><br><div class="gmail_quote gmail_quote_container"><div dir="ltr" class="gmail_attr">pon., 28 lip 2025 o 23:44 Andrew Morton <<a href="mailto:akpm@linux-foundation.org">akpm@linux-foundation.org</a>> napisał(a):<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">On Mon, 28 Jul 2025 16:03:53 +0800 Baolin Wang <<a href="mailto:baolin.wang@linux.alibaba.com" target="_blank">baolin.wang@linux.alibaba.com</a>> wrote:<br>
<br>
> After commit acd7ccb284b8 ("mm: shmem: add large folio support for tmpfs"),<br>
> we extend the 'huge=' option to allow any sized large folios for tmpfs,<br>
> which means tmpfs will allow getting a highest order hint based on the size<br>
> of write() and fallocate() paths, and then will try each allowable large order.<br>
> <br>
> However, when the i915 driver allocates shmem memory, it doesn't provide hint<br>
> information about the size of the large folio to be allocated, resulting in<br>
> the inability to allocate PMD-sized shmem, which in turn affects GPU performance.<br>
> <br>
> To fix this issue, add the 'end' information for shmem_read_folio_gfp()  to help<br>
> allocate PMD-sized large folios. Additionally, use the maximum allocation chunk<br>
> (via mapping_max_folio_size()) to determine the size of the large folios to<br>
> allocate in the i915 driver.<br>
<br>
What is the magnitude of the performance change?<br>
<br>
> Fixes: acd7ccb284b8 ("mm: shmem: add large folio support for tmpfs")<br>
> Reported-by: Patryk Kowalczyk <<a href="mailto:patryk@kowalczyk.ws" target="_blank">patryk@kowalczyk.ws</a>><br>
> Reported-by: Ville Syrjälä <<a href="mailto:ville.syrjala@linux.intel.com" target="_blank">ville.syrjala@linux.intel.com</a>><br>
> Tested-by: Patryk Kowalczyk <<a href="mailto:patryk@kowalczyk.ws" target="_blank">patryk@kowalczyk.ws</a>><br>
<br>
This isn't a regression fix, is it?  acd7ccb284b8 adds a new feature<br>
and we have now found a flaw in it.<br>
<br>
Still, we could bend the rules a little bit and backport this, depends<br>
on how significant the runtime effect is.<br>
</blockquote></div></div>