<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Thu, May 4, 2017 at 9:26 AM, Juan A. Suarez Romero <span dir="ltr"><<a href="mailto:jasuarez@igalia.com" target="_blank">jasuarez@igalia.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5">On Thu, 2017-05-04 at 07:49 -0700, Jason Ekstrand wrote:<br>
> On Thu, May 4, 2017 at 1:00 AM, Juan A. Suarez Romero <<a href="mailto:jasuarez@igalia.com">jasuarez@igalia.com</a>> wrote:<br>
> > On Wed, 2017-04-26 at 07:35 -0700, Jason Ekstrand wrote:<br>
> > > Previously, the maximum size of a state that could be allocated from a<br>
> > > state pool was a block.  However, this has caused us various issues<br>
> > > particularly with shaders which are potentially very large.  We've also<br>
> > > hit issues with render passes with a large number of attachments when we<br>
> > > go to allocate the block of surface state.  This effectively removes the<br>
> > > restriction on the maximum size of a single state.  (There's still a<br>
> > > limit of 1MB imposed by a fixed-length bucket array.)<br>
> > ><br>
> > > For states larger than the block size, we just grab a large block off of<br>
> > > the block pool rather than sub-allocating.  When we go to allocate some<br>
> > > chunk of state and the current bucket does not have state, we try to<br>
> > > pull a chunk from some larger bucket and split it up.  This should<br>
> > > improve memory usage if a client occasionally allocates a large block of<br>
> > > state.<br>
> > ><br>
> > > This commit is inspired by some similar work done by Juan A. Suarez<br>
> > > Romero <<a href="mailto:jasuarez@igalia.com">jasuarez@igalia.com</a>>.<br>
> > > ---<br>
> > >  src/intel/vulkan/anv_<wbr>allocator.c | 43 ++++++++++++++++++++++++++++++<wbr>++++++++++<br>
> > >  1 file changed, 43 insertions(+)<br>
> > ><br>
> > > diff --git a/src/intel/vulkan/anv_<wbr>allocator.c b/src/intel/vulkan/anv_<wbr>allocator.c<br>
> > > index 7a687b7..68c389c 100644<br>
> > > --- a/src/intel/vulkan/anv_<wbr>allocator.c<br>
> > > +++ b/src/intel/vulkan/anv_<wbr>allocator.c<br>
> > > @@ -650,6 +650,12 @@ anv_fixed_size_state_pool_<wbr>alloc_new(struct anv_fixed_size_state_pool *pool,<br>
> > >     struct anv_block_state block, old, new;<br>
> > >     uint32_t offset;<br>
> > ><br>
> > > +   /* If our state is large, we don't need any sub-allocation from a block.<br>
> > > +    * Instead, we just grab whole (potentially large) blocks.<br>
> > > +    */<br>
> > > +   if (state_size >= block_size)<br>
> > > +      return anv_block_pool_alloc(block_<wbr>pool, state_size);<br>
> > > +<br>
> > >   restart:<br>
> > >     block.u64 = __sync_fetch_and_add(&pool-><wbr>block.u64, state_size);<br>
> > ><br>
> > > @@ -702,6 +708,43 @@ anv_state_pool_alloc_no_vg(<wbr>struct anv_state_pool *pool,<br>
> > >        goto done;<br>
> > >     }<br>
> > ><br>
> > > +   /* Try to grab a chunk from some larger bucket and split it up */<br>
> > > +   for (unsigned b = bucket + 1; b < ANV_STATE_BUCKETS; b++) {<br>
> > > +      int32_t chunk_offset;<br>
> > > +      if (anv_free_list_pop(&pool-><wbr>buckets[b].free_list,<br>
> > > +                            &pool->block_pool.map, &chunk_offset)) {<br>
> > > +         unsigned chunk_size = anv_state_pool_get_bucket_<wbr>size(b);<br>
> > > +<br>
> > > +         if (chunk_size > pool->block_size &&<br>
> > > +             state.alloc_size < pool->block_size) {<br>
> > > +            assert(chunk_size % pool->block_size == 0);<br>
> > > +            /* We don't want to split giant chunks into tiny chunks.  Instead,<br>
> > > +             * break anything bigger than a block into block-sized chunks and<br>
> > > +             * then break it down into bucket-sized chunks from there.  Return<br>
> > > +             * all but the first block of the chunk to the block bucket.<br>
> > > +             */<br>
> > > +            const uint32_t block_bucket =<br>
> > > +               anv_state_pool_get_bucket(<wbr>pool->block_size);<br>
> > > +            anv_free_list_push(&pool-><wbr>buckets[block_bucket].free_<wbr>list,<br>
> > > +                               pool->block_pool.map,<br>
> > > +                               chunk_offset + pool->block_size,<br>
> > > +                               pool->block_size,<br>
> > > +                               (chunk_size / pool->block_size) - 1);<br>
> > > +            chunk_size = pool->block_size;<br>
> > > +         }<br>
> > > +<br>
> > > +         assert(chunk_size % state.alloc_size == 0);<br>
> > > +         anv_free_list_push(&pool-><wbr>buckets[bucket].free_list,<br>
> > > +                            pool->block_pool.map,<br>
> > > +                            chunk_offset + state.alloc_size,<br>
> > > +                            state.alloc_size,<br>
> > > +                            (chunk_size / state.alloc_size) - 1);<br>
> > > +<br>
> > > +         state.offset = chunk_offset;<br>
> > > +         goto done;<br>
> > > +      }<br>
> ><br>
> ><br>
> > Wouldn't it better to split the bucket just in two parts, one to be<br>
> > used for our request, and the other with the available free space, but<br>
> > in on single bucket, instead of splitting it in various parts?<br>
> ><br>
> > This way, if we later get a new request that can potentially required<br>
> > the full (or part of) free single bucket we can assign it entirely (or<br>
> > splitting it again).<br>
><br>
> Would you mind rephrasing that?  I'm not really sure what you mean.  There are two other options in my mind:<br>
<br>
</div></div>After re-thinking, I think what I wanted to do is a non-sense.<br>
<br>
In the example below, I was thinking on using 16B out of 2MB for the<br>
request, and put the remaining space (2MB-16B) in *one* bucket. Which,<br>
of course, is a non sense.<br>
<span class=""><br>
><br>
>  1. Fully split the chunk.  This would mean that allocating a 16B state could potentially split a 2MB chunk into 512K smaller chunks.  I'm trying to avoid that quantity of fragmentation.<br>
><br>
>  2. Scatter the chunk through the buckets.  If you got a 2MB chunk, it would generate one of each: 2MB, 1MB, 512KB, 256KB, ..., 128B, 128B, 64B, and 32B and two 16B states.  The issue here is that you end up doing log2(chunk_size / state_size) atomics and it's very likely that you'll allocate more 16B states soon and every other one will have to go at least one bucket up.  Under the assumption that we tend to allocate identically-sized states, I think this is likely to perform worse than splitting a block_size thing into into block_size / state_size many chunks.<br>
><br>
> What I did is an attempt to split the difference by splitting it at two levels rather than one or all.<br>
><br>
<br>
<br>
</span>I see now. Thanks for the explanation! <br></blockquote><div><br></div><div>No problem.  I'll make that a comment. <br></div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Reviewed-by: Juan A. Suarez Romero <<a href="mailto:jasuarez@igalia.com">jasuarez@igalia.com</a>><br></blockquote><div><br></div><div>Thanks!<br></div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="HOEnZb"><div class="h5"><br>
<br>
> --Jason<br>
>  <br>
> >         J.A.<br>
> ><br>
> ><br>
> ><br>
> > > +   }<br>
> > > +<br>
> > >     state.offset = anv_fixed_size_state_pool_<wbr>alloc_new(&pool->buckets[<wbr>bucket],<br>
> > >                                                        &pool->block_pool,<br>
> > >                                                        state.alloc_size,<br>
> > ______________________________<wbr>_________________<br>
> > mesa-dev mailing list<br>
> > <a href="mailto:mesa-dev@lists.freedesktop.org">mesa-dev@lists.freedesktop.org</a><br>
> > <a href="https://lists.freedesktop.org/mailman/listinfo/mesa-dev" rel="noreferrer" target="_blank">https://lists.freedesktop.org/<wbr>mailman/listinfo/mesa-dev</a><br>
> ><br>
><br>
><br>
</div></div></blockquote></div><br></div></div>