<div dir="ltr">> <span style="font-size:12.8px">Quick benchmark of Tom's patches on shader-db.</span><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">Thomas' patch, sorry. It's hard to simultaneously compose messages, and play in Paw Patrol with 3 yo kid.</span></div></div><div class="gmail_extra"><br><div class="gmail_quote">2017-01-13 20:41 GMT+03:00 Vladislav Egorov <span dir="ltr"><<a href="mailto:vegorov180@gmail.com" target="_blank">vegorov180@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">13.01.2017 15:31, Tapani Pälli пишет:<span class=""><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
<br>
On 01/12/2017 09:23 PM, Thomas Helland wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Walking the whole hash table, inserting entries by hashing them first<br>
is just a really really bad idea. We can simply memcpy the whole thing.<br>
</blockquote>
<br>
Maybe it is just 'really' not 'really really' since I don't spot any difference in time running the torture test in bug #94477 (oscillates close to 120s with both with and without these patches), I would expect at least some difference as it is utilizing this path a lot. Did you measure performance difference?<br>
<br>
</blockquote>
<br></span>
It wouldn't help the torture case from the bug, because that shader doesn't have LOOP and IF blocks, so more efficient copying the ACP for LOOP/IF blocks would not be even touched.<br>
<br>
Quick benchmark of Tom's patches on shader-db.<br>
<br>
Default shader-db, ./run -1, 10 runs:<br>
<br>
              BEFORE    AFTER<br>
softpipe      3.20s     3.15s<br>
radeonsi      5.17s     5.12s<br>
i965/Haswell  7.33s     7.19s<br>
<br>
On my full shader-db (50K+ shaders from games):<br>
<br>
                  BEFORE   AFTER<br>
softpipe (5 runs) 156.6s   153.9s<br>
i965              625s     613s<br>
<br>
So it brings 1-2% speed across the board.<br>
</blockquote></div><br></div>