<div dir="ltr"><br><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Mar 25, 2016 at 4:12 PM, Jason Ekstrand <span dir="ltr"><<a href="mailto:jason@jlekstrand.net" target="_blank">jason@jlekstrand.net</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">---<br>
 src/mesa/drivers/dri/i965/brw_fs_nir.cpp   | 32 ++++++++++++++++++++++++++++++<br>
 src/mesa/drivers/dri/i965/brw_vec4_nir.cpp | 32 ++++++++++++++++++++++++++++++<br>
 2 files changed, 64 insertions(+)<br>
<br>
diff --git a/src/mesa/drivers/dri/i965/brw_fs_nir.cpp b/src/mesa/drivers/dri/i965/brw_fs_nir.cpp<br>
index 14480fb..131f50e 100644<br>
--- a/src/mesa/drivers/dri/i965/brw_fs_nir.cpp<br>
+++ b/src/mesa/drivers/dri/i965/brw_fs_nir.cpp<br>
@@ -844,8 +844,40 @@ fs_visitor::nir_emit_alu(const fs_builder &bld, nir_alu_instr *instr)<br>
       unreachable("Should have been lowered by borrow_to_arith().");<br>
<br>
    case nir_op_umod:<br>
+   case nir_op_irem:<br>
+      /* According to the sign table for INT DIV in the Ivy Bridge PRM, it<br>
+       * appears that our hardware just does the right thing for signed<br>
+       * remainder.<br>
+       */<br>
+      bld.emit(SHADER_OPCODE_INT_REMAINDER, result, op[0], op[1]);<br>
+      break;<br>
+<br>
+   case nir_op_imod: {<br>
+      /* Get a regular C-style remainder.  If a % b == 0, set the predicate. */<br>
       bld.emit(SHADER_OPCODE_INT_REMAINDER, result, op[0], op[1]);<br>
+<br>
+      /* Math instructions don't support conditional mod */<br>
+      inst = bld.MOV(bld.null_reg_d(), result);<br>
+      inst->conditional_mod = BRW_CONDITIONAL_NZ;<br>
+<br>
+      /* Now, we need to determine if signs of the sources are different.<br>
+       * When we XOR the sources, the top bit is 0 if they are the same and 1<br>
+       * if they are different.  We can then use a conditional modifier to<br>
+       * turn that into a predicate.  This leads us to an XOR.l instruction.<br></blockquote><div><br></div><div>I've added the following to this comment in both versions:<br><br>* Technically, according to the PRM, you're not allowed to use .l on a<br>* XOR instruction.  However, emperical experiments and Curro's reading<br>* of the simulator source both indicate that it's safe.<br><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
+       */<br>
+      fs_reg tmp = bld.vgrf(BRW_REGISTER_TYPE_D);<br>
+      inst = bld.XOR(tmp, op[0], op[1]);<br>
+      inst->predicate = BRW_PREDICATE_NORMAL;<br>
+      inst->conditional_mod = BRW_CONDITIONAL_L;<br>
+<br>
+      /* If the result of the initial remainder operation is non-zero and the<br>
+       * two sources have different signs, add in a copy of op[1] to get the<br>
+       * final integer modulus value.<br>
+       */<br>
+      inst = bld.ADD(result, result, op[1]);<br>
+      inst->predicate = BRW_PREDICATE_NORMAL;<br>
       break;<br>
+   }<br>
<br>
    case nir_op_flt:<br>
    case nir_op_ilt:<br>
diff --git a/src/mesa/drivers/dri/i965/brw_vec4_nir.cpp b/src/mesa/drivers/dri/i965/brw_vec4_nir.cpp<br>
index 585674f..c18694f 100644<br>
--- a/src/mesa/drivers/dri/i965/brw_vec4_nir.cpp<br>
+++ b/src/mesa/drivers/dri/i965/brw_vec4_nir.cpp<br>
@@ -1109,9 +1109,41 @@ vec4_visitor::nir_emit_alu(nir_alu_instr *instr)<br>
       break;<br>
<br>
    case nir_op_umod:<br>
+   case nir_op_irem:<br>
+      /* According to the sign table for INT DIV in the Ivy Bridge PRM, it<br>
+       * appears that our hardware just does the right thing for signed<br>
+       * remainder.<br>
+       */<br>
       emit_math(SHADER_OPCODE_INT_REMAINDER, dst, op[0], op[1]);<br>
       break;<br>
<br>
+   case nir_op_imod: {<br>
+      /* Get a regular C-style remainder.  If a % b == 0, set the predicate. */<br>
+      inst = emit_math(SHADER_OPCODE_INT_REMAINDER, dst, op[0], op[1]);<br>
+<br>
+      /* Math instructions don't support conditional mod */<br>
+      inst = emit(MOV(dst_null_d(), src_reg(dst)));<br>
+      inst->conditional_mod = BRW_CONDITIONAL_NZ;<br>
+<br>
+      /* Now, we need to determine if signs of the sources are different.<br>
+       * When we XOR the sources, the top bit is 0 if they are the same and 1<br>
+       * if they are different.  We can then use a conditional modifier to<br>
+       * turn that into a predicate.  This leads us to an XOR.l instruction.<br>
+       */<br>
+      src_reg tmp = src_reg(this, glsl_type::ivec4_type);<br>
+      inst = emit(XOR(dst_reg(tmp), op[0], op[1]));<br>
+      inst->predicate = BRW_PREDICATE_NORMAL;<br>
+      inst->conditional_mod = BRW_CONDITIONAL_L;<br>
+<br>
+      /* If the result of the initial remainder operation is non-zero and the<br>
+       * two sources have different signs, add in a copy of op[1] to get the<br>
+       * final integer modulus value.<br>
+       */<br>
+      inst = emit(ADD(dst, src_reg(dst), op[1]));<br>
+      inst->predicate = BRW_PREDICATE_NORMAL;<br>
+      break;<br>
+   }<br>
+<br>
    case nir_op_ldexp:<br>
       unreachable("not reached: should be handled by ldexp_to_arith()");<br>
<span class=""><font color="#888888"><br>
--<br>
2.5.0.400.gff86faf<br>
<br>
</font></span></blockquote></div><br></div></div>