<br><br>On Monday, August 24, 2020, Dave Airlie <<a href="mailto:airlied@gmail.com">airlied@gmail.com</a>> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
amdgpu is completely scalar,</blockquote><div><br></div><div>it is?? waah! that's new information to me.  does it even squash vec2/3/4, predication and swizzle?</div><div><br></div><div>what about the upstream amdgpu LLVM-IR?  that still preserves vector intrinsics, right?</div><div><br></div><div>i'm assuming that AMDVLK preserves vector intrinsics?</div><div><br></div><div>AMDVLK's associated LLVM port was what ended up upstream, is that right?</div><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
I think you will hit problems with vectorisation, because it's always<br>
been a problem for every effort in this area, but if the CPU design is<br>
such that everything can be vectorised and you never hit a scalar<br>
path, </blockquote><div><br></div><div>that's the plan.  every single scalar POWER9 opcode with very few exceptions (branch, trap) is vectorised.</div><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">and you workout how texture derivatives work early, it might be<br>
something prototype-able.</blockquote><div><br></div><div>good advice to plan on texture opcodes.  thank you.</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
thing, or bring up this architecture on an x86 chip and see it works<br>
at all.</blockquote><div><br></div><div>that's the plan.  phase I.  run on x86, IBM POWER9, etc. first [whilst still preserving vector intrinsics until as late as possible]</div><div><br></div><div>by the time phase I is complete we hope that Simon Moll and Robin Kruppe's LLVM-IR Vector Intrinsics will have landed, at which point we can do an experimental LLVM port which supports LibreSOC POWER9 vector augmentation, swizzle, transcendentals and texturisation opcodes etc.</div><div><br></div><div>l.</div><div><br></div><br><br>-- <br>---<br>crowd-funded eco-conscious hardware: <a href="https://www.crowdsupply.com/eoma68" target="_blank">https://www.crowdsupply.com/eoma68</a><br><br>