Hi, all,<div><br></div><div>I have a problem with the usage of SLM, please help me.</div><div><br></div><div>Problem Description:</div><div>My hardware is Gen7.5, then the total SLM is 64KB. By someone telling me, once the workgroup using SLM, it will be allocated <font color="#ff0000">4KB SLM</font> at least. Meanwhile, in order to utilize full 64B bandwidth, in the mode of SIMD16, every workitem should read/write 4B once. </div><div>On the other hand, every subslice has 10 EUs, every EU could run 7 threads. So, one subslice could run <font color="#ff0000">7*10=70 threads</font> once.</div><div>Current situation is that, each workgroup of mine only contains 32 workitems, which could be splitted to <font color="#ff0000">2 threads</font>. And due to usage of SLM, one subslice can only load 64KB/4KB=<font color="#ff0000">16 workgroups</font> one time. Thus, one subslice can only run <font color="#ff0000">2*16=32 threads</font> at one time. This is just half of the full capacity of one subslice. It's a waste.</div><div><br></div><div>What do I want to do?</div><div>In fact, 4KB SLM for one workgoup of mine is redundant. Could I change this? Like, only preallocated 2KB SLM for one group.</div><div><br></div><div>Thanks for your help!</div><div><br></div><div>Regards</div>