Another question I had about __constant, was there seems to be no limit. I'm using __constant for every read-only parameter now totalling 1500Kb and this test now runs in 32ms. So, is there a limit? Is this method reliable? Can driver do this implicitly on all read-only buffers?<br><div>thanks</div><br><div class="gmail_quote">On Tue Nov 25 2014 at 2:11:26 PM Tony Moore <<a href="mailto:tonywmnix@gmail.com">tonywmnix@gmail.com</a>> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hello,<div>I notice that reads are not being combined when I use __constant on a read-only kernel buffer. Is this something that can be improved?</div><div><br></div><div><div>In my kernel there are many loads from a read-only data structure. When I use the __global specifier for the memory space I see a total of 33 send instructions and a runtime of 81ms. When I use the __constant specifier, I see 43 send instructions and a runtime of 40ms. I'm hoping that combining the loads could improve performance further.</div></div><div><br></div><div>thanks!</div><div>tony</div></blockquote></div>