<div dir="ltr"><div class="gmail_quote"><div dir="ltr">On Fri, Nov 30, 2018 at 3:37 PM Bas Nieuwenhuizen <<a href="mailto:bas@basnieuwenhuizen.nl">bas@basnieuwenhuizen.nl</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">On Fri, Nov 30, 2018 at 10:29 PM Jason Ekstrand <<a href="mailto:jason@jlekstrand.net" target="_blank">jason@jlekstrand.net</a>> wrote:<br>
><br>
> On Fri, Nov 30, 2018 at 3:18 PM Ian Romanick <<a href="mailto:idr@freedesktop.org" target="_blank">idr@freedesktop.org</a>> wrote:<br>
>><br>
>> On 11/29/2018 07:47 AM, Connor Abbott wrote:<br>
>> > On Thu, Nov 29, 2018 at 4:22 PM Jason Ekstrand <<a href="mailto:jason@jlekstrand.net" target="_blank">jason@jlekstrand.net</a>> wrote:<br>
>> >><br>
>> >> Can you provide some context for this?  Those rules are already flagged "inexact" (that's what the ~ means) so they won't apply to anything that's "precise" or "invariant".<br>
>> ><br>
>> > I think the concern is that this isn't allowed in SPIR-V, even without<br>
>> > exact or invariant. We even go out of our way to do the correct thing<br>
>> > in the frontend by inserting an "&& a == a" or "|| a != a", but then<br>
>><br>
>> If you're that paranoid about it, why not just mark the operations are<br>
>> precise?  That's literally why it exists.<br>
>><br>
>> > opt_algebraic removes it with another rule and then this rule can flip<br>
>> > it from ordered to unordered. The spec says that operations don't have<br>
>> > to produce NaN, but it doesn't say anything on comparisons other than<br>
>> > the generic "everything must follow IEEE rules" and an entry in the<br>
>> > table that says "produces correct results." Then again, I can't find<br>
>> > anything in GLSL allowing these transforms either, so maybe we just<br>
>> > need to get rid of them.<br>
>><br>
>> What I hear you saying is, "The behavior isn't defined."  Unless you can<br>
>> point to a CTS test or an application that has incorrect behavior, I'm<br>
>> going to oppose removing this pretty strongly.  *Every* GLSL compiler<br>
>> does this.<br>
><br>
><br>
> The test case came from VKD3D which does D3D12 on Vulkan.  Someone (Samuel, maybe?) was going to ask around and see if we can figure out what D3D12's rules are.  It's possible that it requires IEEE or something close.  If that's the case, as I said to Samuel on IRC, we're probably looking at an extension.  I don't think we want a flag like this that's set per-API.<br>
<br>
What do you mean an extension? AFAIU the concern is that Vulkan SPIR-V<br>
is more restrictive than GLSL here, and disallows these optimization<br>
right? That makes a strong case that we should remove these rules for<br>
at least Vulkan. If that means writing a CTS test, maybe we should do<br>
just that?<br></blockquote><div><br></div><div>I know there were some discussions around this.  I don't remember what the outcome was.  It's possible that it really was "Vulkan is just more restrictive" but I don't remember.  I know there are CTS tests for these opcodes and, last I checked, we're passing the CTS so maybe those tests aren't mustpass?  I'd have to go digging.</div><div><br></div><div>--Jason<br></div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
><br>
>><br>
>> >> On Thu, Nov 29, 2018 at 9:18 AM Samuel Pitoiset <<a href="mailto:samuel.pitoiset@gmail.com" target="_blank">samuel.pitoiset@gmail.com</a>> wrote:<br>
>> >>><br>
>> >>> It's correct in GLSL because the behaviour is undefined in<br>
>> >>> presence of NaNs. But this seems incorrect in Vulkan.<br>
>> >>><br>
>> >>> Signed-off-by: Samuel Pitoiset <<a href="mailto:samuel.pitoiset@gmail.com" target="_blank">samuel.pitoiset@gmail.com</a>><br>
>> >>> ---<br>
>> >>>  src/compiler/nir/nir.h                | 6 ++++++<br>
>> >>>  src/compiler/nir/nir_opt_algebraic.py | 8 ++++----<br>
>> >>>  2 files changed, 10 insertions(+), 4 deletions(-)<br>
>> >>><br>
>> >>> diff --git a/src/compiler/nir/nir.h b/src/compiler/nir/nir.h<br>
>> >>> index db935c8496b..4107c293962 100644<br>
>> >>> --- a/src/compiler/nir/nir.h<br>
>> >>> +++ b/src/compiler/nir/nir.h<br>
>> >>> @@ -2188,6 +2188,12 @@ typedef struct nir_shader_compiler_options {<br>
>> >>>     /* Set if nir_lower_wpos_ytransform() should also invert gl_PointCoord. */<br>
>> >>>     bool lower_wpos_pntc;<br>
>> >>><br>
>> >>> +       /* If false, lower ~inot(flt(a,b)) -> fge(a,b) and variants.<br>
>> >>> +        * In presence of NaNs, this is correct in GLSL because the behaviour is<br>
>> >>> +        * undefined. In Vulkan, doing these transformations is incorrect.<br>
>> >>> +        */<br>
>> >>> +       bool exact_float_comparisons;<br>
>> >>> +<br>
>> >>>     /**<br>
>> >>>      * Should nir_lower_io() create load_interpolated_input intrinsics?<br>
>> >>>      *<br>
>> >>> diff --git a/src/compiler/nir/nir_opt_algebraic.py b/src/compiler/nir/nir_opt_algebraic.py<br>
>> >>> index f2a7be0c403..3750874407b 100644<br>
>> >>> --- a/src/compiler/nir/nir_opt_algebraic.py<br>
>> >>> +++ b/src/compiler/nir/nir_opt_algebraic.py<br>
>> >>> @@ -154,10 +154,10 @@ optimizations = [<br>
>> >>>     (('ishl', ('imul', a, '#b'), '#c'), ('imul', a, ('ishl', b, c))),<br>
>> >>><br>
>> >>>     # Comparison simplifications<br>
>> >>> -   (('~inot', ('flt', a, b)), ('fge', a, b)),<br>
>> >>> -   (('~inot', ('fge', a, b)), ('flt', a, b)),<br>
>> >>> -   (('~inot', ('feq', a, b)), ('fne', a, b)),<br>
>> >>> -   (('~inot', ('fne', a, b)), ('feq', a, b)),<br>
>> >>> +   (('~inot', ('flt', a, b)), ('fge', a, b), '!options->exact_float_comparisons'),<br>
>> >>> +   (('~inot', ('fge', a, b)), ('flt', a, b), '!options->exact_float_comparisons'),<br>
>> >>> +   (('~inot', ('feq', a, b)), ('fne', a, b), '!options->exact_float_comparisons'),<br>
>> >>> +   (('~inot', ('fne', a, b)), ('feq', a, b), '!options->exact_float_comparisons'),<br>
>> >><br>
>> >><br>
>> >> The feq/fne one is actually completely safe.  fne is defined to be !feq even when NaN is considered.<br>
>> >><br>
>> >> --Jasoan<br>
>> >><br>
>> >>><br>
>> >>>     (('inot', ('ilt', a, b)), ('ige', a, b)),<br>
>> >>>     (('inot', ('ult', a, b)), ('uge', a, b)),<br>
>> >>>     (('inot', ('ige', a, b)), ('ilt', a, b)),<br>
>> >>> --<br>
>> >>> 2.19.2<br>
>> >>><br>
>> >>> _______________________________________________<br>
>> >>> mesa-dev mailing list<br>
>> >>> <a href="mailto:mesa-dev@lists.freedesktop.org" target="_blank">mesa-dev@lists.freedesktop.org</a><br>
>> >>> <a href="https://lists.freedesktop.org/mailman/listinfo/mesa-dev" rel="noreferrer" target="_blank">https://lists.freedesktop.org/mailman/listinfo/mesa-dev</a><br>
>> >><br>
>> >> _______________________________________________<br>
>> >> mesa-dev mailing list<br>
>> >> <a href="mailto:mesa-dev@lists.freedesktop.org" target="_blank">mesa-dev@lists.freedesktop.org</a><br>
>> >> <a href="https://lists.freedesktop.org/mailman/listinfo/mesa-dev" rel="noreferrer" target="_blank">https://lists.freedesktop.org/mailman/listinfo/mesa-dev</a><br>
>> > _______________________________________________<br>
>> > mesa-dev mailing list<br>
>> > <a href="mailto:mesa-dev@lists.freedesktop.org" target="_blank">mesa-dev@lists.freedesktop.org</a><br>
>> > <a href="https://lists.freedesktop.org/mailman/listinfo/mesa-dev" rel="noreferrer" target="_blank">https://lists.freedesktop.org/mailman/listinfo/mesa-dev</a><br>
>> ><br>
>><br>
> _______________________________________________<br>
> mesa-dev mailing list<br>
> <a href="mailto:mesa-dev@lists.freedesktop.org" target="_blank">mesa-dev@lists.freedesktop.org</a><br>
> <a href="https://lists.freedesktop.org/mailman/listinfo/mesa-dev" rel="noreferrer" target="_blank">https://lists.freedesktop.org/mailman/listinfo/mesa-dev</a><br>
</blockquote></div></div>