<html>
    <head>
      <base href="https://bugs.freedesktop.org/">
    </head>
    <body><span class="vcard"><a class="email" href="mailto:jason@jlekstrand.net" title="Jason Ekstrand <jason@jlekstrand.net>"> <span class="fn">Jason Ekstrand</span></a>
</span> changed
          <a class="bz_bug_link 
          bz_status_NEEDINFO "
   title="NEEDINFO - [PERF] Updating ubo offset via vkCmdBindDescriptorSets is causing flush that is taking 50% of rendering time"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=105695">bug 105695</a>
          <br>
             <table border="1" cellspacing="0" cellpadding="8">
          <tr>
            <th>What</th>
            <th>Removed</th>
            <th>Added</th>
          </tr>

         <tr>
           <td style="text-align:right;">Status</td>
           <td>NEW
           </td>
           <td>NEEDINFO
           </td>
         </tr></table>
      <p>
        <div>
            <b><a class="bz_bug_link 
          bz_status_NEEDINFO "
   title="NEEDINFO - [PERF] Updating ubo offset via vkCmdBindDescriptorSets is causing flush that is taking 50% of rendering time"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=105695#c1">Comment # 1</a>
              on <a class="bz_bug_link 
          bz_status_NEEDINFO "
   title="NEEDINFO - [PERF] Updating ubo offset via vkCmdBindDescriptorSets is causing flush that is taking 50% of rendering time"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=105695">bug 105695</a>
              from <span class="vcard"><a class="email" href="mailto:jason@jlekstrand.net" title="Jason Ekstrand <jason@jlekstrand.net>"> <span class="fn">Jason Ekstrand</span></a>
</span></b>
        <pre>(In reply to Vyacheslav from <a href="show_bug.cgi?id=105695#c0">comment #0</a>)
<span class="quote">> I do vkCmdBindDescriptorSets per draw call to change transformation matrix
> of an object. Basically I change only one number - offset into dynamic ubo.
> Then I call vkCmdDrawIndexed and it calls gen9_cmd_buffer_flush_state that
> amounts to 50% of rendering time (in terms of instr fetch metric). I dig
> deeper and find two culprits: flush_descriptor_sets,
> cmd_buffer_flush_push_constants.</span >

>From your cachegrind profile, it appears that you have a build of the driver
with asserts enabled.  Please try with an fully optimized driver build and see
how the performance looks.  We have a *lot* of asserts in our driver (every
field of every hardware packet has bounds-checking for instance) and enabling
them will kill performance.

<span class="quote">> And I don't even use push constants, I
> prefer dynamic ubos. Emitting binding tables is huge amount of work (23% of
> total rendering time). I don't understand why so much work has to be done
> just to change offset in memory.</span >

As far as push constants go, you are getting them whether you meant to or not. 
We push chunks of UBOs when we can and it significantly helps UBO performance
in most cases.

<span class="quote">> And this is the most popular usecase - everyone wants to change matrix per
> object.</span >

Yes and no.  If you really need to be changing matrices that often, there are
other mechanisms that are more efficient.  Frequently engines will do a large
draw (many vertices) with a single UBO with an array of matrices and index into
the array something they pass in as a vertex attribute.  Doing thousands of
back-to-back draws with descriptor sets re-binds in-between is basically a CPU
overhead micro-benchmark.

<span class="quote">> My opengl implementation is 2
> times faster than this. Are there any plans on improving performance in that
> area?</span >

That definitely shouldn't be the case. :-)  I suspect this would change if you
ran with a properly optimized build.</pre>
        </div>
      </p>


      <hr>
      <span>You are receiving this mail because:</span>

      <ul>
          <li>You are the QA Contact for the bug.</li>
          <li>You are the assignee for the bug.</li>
      </ul>
    </body>
</html>