<div dir="auto"><div><br><div class="gmail_extra"><br><div class="gmail_quote">On Mar 28, 2017 10:41 AM, "Christian König" <<a href="mailto:deathsimple@vodafone.de">deathsimple@vodafone.de</a>> wrote:<br type="attribution"><blockquote class="quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="elided-text">Am 28.03.2017 um 10:35 schrieb Michel Dänzer:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
On 28/03/17 05:29 PM, Christian König wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Am 28.03.2017 um 08:00 schrieb Michel Dänzer:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
On 28/03/17 12:50 PM, zhoucm1 wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
On 2017年03月28日 10:40, Michel Dänzer wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
On 27/03/17 04:53 PM, Zhou, David(ChunMing) wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
For APU special case, can we prevent eviction happening between VRAM<br>
<----> GTT?<br>
</blockquote>
We can, if we can close the performance gap between VRAM and GTT. We<br>
measured around 30% gap a while ago, though right now I'm only<br>
measuring<br>
~5%, but the test system has slower RAM now (still dual channel<br>
though).<br>
</blockquote>
My impression VRAM and GTT have no much difference for APU case, if I'm<br>
wrong, pls correct me.<br>
</blockquote>
The Mesa patch below makes radeonsi use mostly GTT instead of mostly<br>
VRAM, and slows down Unigine Valley by about 5% on my desktop Kaveri.<br>
You can try it for yourself.<br>
</blockquote>
Additional to that you still need the stolen VRAM on APUs for page<br>
tables and DCE.<br>
<br>
So we need to keep the eviction from VRAM to GTT enabled, but what we<br>
don't do is swapping them back in because Marek added the GTT flags on<br>
APUs as extra domain to look into.<br>
</blockquote>
As long as there's a performance gap between VRAM and GTT, this means<br>
that performance of long-running apps (e.g. Xorg or the compositor) will<br>
degrade over time, or after e.g. a suspend-resume cycle.<br>
<br>
OTOH, if we can close the gap, we can stop trying to put most BOs in<br>
VRAM in the first place with APUs.<br>
</blockquote>
<br></div>
Yeah, John and I are already working on this (but mostly for GFX9).<br>
<br>
The difference is that VRAM allocations are mostly contiguously, while GTT allocations are scattered. So you got more TLB pressure with GTT.</blockquote></div></div></div><div dir="auto"><br></div><div dir="auto">Another aspect is that GART has smaller pages, so the translation cache has to fetch more of the page directory and also the cache is finite, meaning that it can be thrashed more easily with small pages.</div><div dir="auto"><br></div><div dir="auto">Marek</div><div dir="auto"><br></div><div dir="auto"><div class="gmail_extra"><div class="gmail_quote"><blockquote class="quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><font color="#888888"><br>
<br>
Christian.<br>
<br>
</font></blockquote></div><br></div></div></div>