<div dir="ltr"><br><div class="gmail_extra">Hi,</div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jun 28, 2017 at 12:53 PM, Ilia Mirkin <span dir="ltr"><<a href="mailto:imirkin@alum.mit.edu" target="_blank">imirkin@alum.mit.edu</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">BTW, you can drop those explicit "depbar" ops. I think they're only<br>
needed when you're doing something weird with barriers. Blob doesn't<br>
use them (anymore)<br></blockquote><div>Gotcha. Should I remove them in the same patch or a different one? It seems like the depbar removal is different than what the commit message describes here, so maybe it could do with a separate commit. I could be wrong, though, as it's my first time contributing to nouveau.</div><div><br></div><div>Cheers,</div><div>Aaryaman</div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div class="m_2866378526680505499h5">
On Tue, Jun 27, 2017 at 11:16 AM, Aaryaman Vasishta<br>
<<a href="mailto:jem456.vasishta@gmail.com" target="_blank">jem456.vasishta@gmail.com</a>> wrote:<br>
> v4: Updated the wait dependancy bars based on tex component masks.<br>
><br>
> This patch adds proper delays to maxwell exa shaders. Tested with<br>
> rendercheck -f a8r8g8b8.<br>
><br>
> I am still wondering whether the rd's are required. We could<br>
> still wait on the write bars instead. eg. see<br>
> "sched (st 0xf wr 0x1 wt 0x2) (st 0xf wr 0x1 wt 0x2) (st 0xf)" in exacmnv110.fp<br>
><br>
> Trello:<br>
> <a href="https://trello.com/c/6LPB2EIS/174-update-maxwell-shaders-with-proper-delays" rel="noreferrer" target="_blank">https://trello.com/c/6LPB2EIS/<wbr>174-update-maxwell-shaders-wit<wbr>h-proper-delays</a><br>
><br>
> Signed-off-by: Aaryaman Vasishta <<a href="mailto:jem456.vasishta@gmail.com" target="_blank">jem456.vasishta@gmail.com</a>><br>
> ---<br>
>  src/shader/exac8nv110.fp  | 10 +++++-----<br>
>  src/shader/exac8nv110.fpc | 18 +++++++++---------<br>
>  src/shader/exacanv110.fp  | 10 +++++-----<br>
>  src/shader/exacanv110.fpc | 18 +++++++++---------<br>
>  src/shader/exacmnv110.fp  | 10 +++++-----<br>
>  src/shader/exacmnv110.fpc | 18 +++++++++---------<br>
>  src/shader/exas8nv110.fp  |  6 +++---<br>
>  src/shader/exas8nv110.fpc | 12 ++++++------<br>
>  src/shader/exasanv110.fp  | 10 +++++-----<br>
>  src/shader/exasanv110.fpc | 18 +++++++++---------<br>
>  src/shader/exascnv110.fp  |  6 +++---<br>
>  src/shader/exascnv110.fpc | 10 +++++-----<br>
>  src/shader/videonv110.fp  | 14 +++++++-------<br>
>  src/shader/videonv110.fpc | 26 +++++++++++++-------------<br>
>  14 files changed, 93 insertions(+), 93 deletions(-)<br>
><br>
> diff --git a/src/shader/exac8nv110.fp b/src/shader/exac8nv110.fp<br>
> index ce78036..101b67f 100644<br>
> --- a/src/shader/exac8nv110.fp<br>
> +++ b/src/shader/exac8nv110.fp<br>
> @@ -25,23 +25,23 @@ NV110FP_Composite_A8[] = {<br>
>  };<br>
>  #else<br>
><br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x0) (st 0xd wr 0x0 wt 0x1) (st 0xf wr 0x0 wt 0x1)<br>
>  ipa pass $r0 a[0x7c] 0x0 0x0 0x1<br>
>  mufu rcp $r0 $r0<br>
>  ipa $r3 a[0x94] $r0 0x0 0x1<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x1) (st 0xf wr 0x0 rd 0x1 wt 0x3) (st 0xf wr 0x1 wt 0x2)<br>
>  ipa $r2 a[0x90] $r0 0x0 0x1<br>
>  tex nodep $r1 $r2 0x0 0x1 t2d 0x8<br>
>  ipa $r3 a[0x84] $r0 0x0 0x1<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x2) (st 0xf wr 0x1 wt 0x6) (st 0xf)<br>
>  ipa $r2 a[0x80] $r0 0x0 0x1<br>
>  tex nodep $r0 $r2 0x0 0x0 t2d 0x8<br>
>  depbar le 0x5 0x0 0x0<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0x6 wt 0x3) (st 0x1) (st 0x1)<br>
>  fmul ftz $r3 $r0 $r1<br>
>  mov $r2 $r3 0xf<br>
>  mov $r1 $r3 0xf<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0x1) (st 0xf) (st 0x0)<br>
>  mov $r0 $r3 0xf<br>
>  exit<br>
>  #endif<br>
> diff --git a/src/shader/exac8nv110.fpc b/src/shader/exac8nv110.fpc<br>
> index 4aa1368..1f7d649 100644<br>
> --- a/src/shader/exac8nv110.fpc<br>
> +++ b/src/shader/exac8nv110.fpc<br>
> @@ -1,36 +1,36 @@<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe1a0070f,<br>
> +0x003c3c01,<br>
>  0xcff7ff00,<br>
>  0xe003ff87,<br>
>  0x00470000,<br>
>  0x50800000,<br>
>  0x4007ff03,<br>
>  0xe043ff89,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0x21e0072f,<br>
> +0x005cbc03,<br>
>  0x0007ff02,<br>
>  0xe043ff89,<br>
>  0x2ff70201,<br>
>  0xc03a0014,<br>
>  0x4007ff03,<br>
>  0xe043ff88,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe5e0074f,<br>
> +0x001fbc06,<br>
>  0x0007ff02,<br>
>  0xe043ff88,<br>
>  0x2ff70200,<br>
>  0xc03a0004,<br>
>  0x34070000,<br>
>  0xf0f00000,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xfc201fe6,<br>
> +0x001f8400,<br>
>  0x00170003,<br>
>  0x5c681000,<br>
>  0x00370002,<br>
>  0x5c980780,<br>
>  0x00370001,<br>
>  0x5c980780,<br>
> -0xfc0007e0,<br>
> +0xfde007e1,<br>
>  0x001f8000,<br>
>  0x00370000,<br>
>  0x5c980780,<br>
> diff --git a/src/shader/exacanv110.fp b/src/shader/exacanv110.fp<br>
> index a70d5c5..fe55fcd 100644<br>
> --- a/src/shader/exacanv110.fp<br>
> +++ b/src/shader/exacanv110.fp<br>
> @@ -25,23 +25,23 @@ NV110FP_CAComposite[] = {<br>
>  };<br>
>  #else<br>
><br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x0) (st 0xd wr 0x0 wt 0x1) (st 0xf wr 0x0 wt 0x1)<br>
>  ipa pass $r0 a[0x7c] 0x0 0x0 0x1<br>
>  mufu rcp $r0 $r0<br>
>  ipa $r3 a[0x94] $r0 0x0 0x1<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x1) (st 0xf wr 0x0 wt 0x3) (st 0xf wr 0x1)<br>
>  ipa $r2 a[0x90] $r0 0x0 0x1<br>
>  tex nodep $r4 $r2 0x0 0x1 t2d 0xf<br>
>  ipa $r1 a[0x84] $r0 0x0 0x1<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x1 wt 0x2) (st 0xf wr 0x1 wt 0x2) (st 0xf)<br>
>  ipa $r0 a[0x80] $r0 0x0 0x1<br>
>  tex nodep $r0 $r0 0x0 0x0 t2d 0xf<br>
>  depbar le 0x5 0x0 0x0<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0x1 wt 0x3) (st 0x1) (st 0x1)<br>
>  fmul ftz $r3 $r3 $r7<br>
>  fmul ftz $r2 $r2 $r6<br>
>  fmul ftz $r1 $r1 $r5<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0x1) (st 0xf) (st 0x0)<br>
>  fmul ftz $r0 $r0 $r4<br>
>  exit<br>
>  #endif<br>
> diff --git a/src/shader/exacanv110.fpc b/src/shader/exacanv110.fpc<br>
> index 7c0ca5e..7c8ebbd 100644<br>
> --- a/src/shader/exacanv110.fpc<br>
> +++ b/src/shader/exacanv110.fpc<br>
> @@ -1,36 +1,36 @@<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe1a0070f,<br>
> +0x003c3c01,<br>
>  0xcff7ff00,<br>
>  0xe003ff87,<br>
>  0x00470000,<br>
>  0x50800000,<br>
>  0x4007ff03,<br>
>  0xe043ff89,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe1e0072f,<br>
> +0x001cbc03,<br>
>  0x0007ff02,<br>
>  0xe043ff89,<br>
>  0xaff70204,<br>
>  0xc03a0017,<br>
>  0x4007ff01,<br>
>  0xe043ff88,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe5e0172f,<br>
> +0x001fbc02,<br>
>  0x0007ff00,<br>
>  0xe043ff88,<br>
>  0xaff70000,<br>
>  0xc03a0007,<br>
>  0x34070000,<br>
>  0xf0f00000,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xfc201fe1,<br>
> +0x001f8400,<br>
>  0x00770303,<br>
>  0x5c681000,<br>
>  0x00670202,<br>
>  0x5c681000,<br>
>  0x00570101,<br>
>  0x5c681000,<br>
> -0xfc0007e0,<br>
> +0xfde007e1,<br>
>  0x001f8000,<br>
>  0x00470000,<br>
>  0x5c681000,<br>
> diff --git a/src/shader/exacmnv110.fp b/src/shader/exacmnv110.fp<br>
> index fe5c294..7113ab3 100644<br>
> --- a/src/shader/exacmnv110.fp<br>
> +++ b/src/shader/exacmnv110.fp<br>
> @@ -25,23 +25,23 @@ NV110FP_Composite[] = {<br>
>  };<br>
>  #else<br>
><br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x0) (st 0xd wr 0x0 wt 0x1) (st 0xf wr 0x0 wt 0x1)<br>
>  ipa pass $r0 a[0x7c] 0x0 0x0 0x1<br>
>  mufu rcp $r0 $r0<br>
>  ipa $r3 a[0x94] $r0 0x0 0x1<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x1) (st 0xf wr 0x0 wt 0x3) (st 0xf wr 0x1)<br>
>  ipa $r2 a[0x90] $r0 0x0 0x1<br>
>  tex nodep $r4 $r2 0x0 0x1 t2d 0x8<br>
>  ipa $r1 a[0x84] $r0 0x0 0x1<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x1 wt 0x2) (st 0xf wr 0x1 wt 0x2) (st 0xf)<br>
>  ipa $r0 a[0x80] $r0 0x0 0x1<br>
>  tex nodep $r0 $r0 0x0 0x0 t2d 0xf<br>
>  depbar le 0x5 0x0 0x0<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0x1 wt 0x3) (st 0x1) (st 0x1)<br>
>  fmul ftz $r3 $r3 $r4<br>
>  fmul ftz $r2 $r2 $r4<br>
>  fmul ftz $r1 $r1 $r4<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0x1) (st 0xf) (st 0x0)<br>
>  fmul ftz $r0 $r0 $r4<br>
>  exit<br>
>  #endif<br>
> diff --git a/src/shader/exacmnv110.fpc b/src/shader/exacmnv110.fpc<br>
> index 9d62c1a..60352a8 100644<br>
> --- a/src/shader/exacmnv110.fpc<br>
> +++ b/src/shader/exacmnv110.fpc<br>
> @@ -1,36 +1,36 @@<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe1a0070f,<br>
> +0x003c3c01,<br>
>  0xcff7ff00,<br>
>  0xe003ff87,<br>
>  0x00470000,<br>
>  0x50800000,<br>
>  0x4007ff03,<br>
>  0xe043ff89,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe1e0072f,<br>
> +0x001cbc03,<br>
>  0x0007ff02,<br>
>  0xe043ff89,<br>
>  0x2ff70204,<br>
>  0xc03a0014,<br>
>  0x4007ff01,<br>
>  0xe043ff88,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe5e0172f,<br>
> +0x001fbc02,<br>
>  0x0007ff00,<br>
>  0xe043ff88,<br>
>  0xaff70000,<br>
>  0xc03a0007,<br>
>  0x34070000,<br>
>  0xf0f00000,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xfc201fe1,<br>
> +0x001f8400,<br>
>  0x00470303,<br>
>  0x5c681000,<br>
>  0x00470202,<br>
>  0x5c681000,<br>
>  0x00470101,<br>
>  0x5c681000,<br>
> -0xfc0007e0,<br>
> +0xfde007e1,<br>
>  0x001f8000,<br>
>  0x00470000,<br>
>  0x5c681000,<br>
> diff --git a/src/shader/exas8nv110.fp b/src/shader/exas8nv110.fp<br>
> index 4fe2e19..a555beb 100644<br>
> --- a/src/shader/exas8nv110.fp<br>
> +++ b/src/shader/exas8nv110.fp<br>
> @@ -25,15 +25,15 @@ NV110FP_Source_A8[] = {<br>
>  };<br>
>  #else<br>
><br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x0) (st 0xd wr 0x0 wt 0x1) (st 0xf wr 0x0 wt 0x1)<br>
>  ipa pass $r0 a[0x7c] 0x0 0x0 0x1<br>
>  mufu rcp $r0 $r0<br>
>  ipa $r1 a[0x84] $r0 0x0 0x1<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x1) (st 0xf wr 0x0 wt 0x3) (st 0xf)<br>
>  ipa $r0 a[0x80] $r0 0x0 0x1<br>
>  tex nodep $r0 $r0 0x0 0x0 t2d 0x8<br>
>  depbar le 0x5 0x0 0x0<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0x1 wt 0x1) (st 0x1) (st 0x1)<br>
>  mov $r3 $r0 0xf<br>
>  mov $r2 $r0 0xf<br>
>  mov $r1 $r0 0xf<br>
> diff --git a/src/shader/exas8nv110.fpc b/src/shader/exas8nv110.fpc<br>
> index 1181c41..e58d168 100644<br>
> --- a/src/shader/exas8nv110.fpc<br>
> +++ b/src/shader/exas8nv110.fpc<br>
> @@ -1,21 +1,21 @@<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe1a0070f,<br>
> +0x003c3c01,<br>
>  0xcff7ff00,<br>
>  0xe003ff87,<br>
>  0x00470000,<br>
>  0x50800000,<br>
>  0x4007ff01,<br>
>  0xe043ff88,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe1e0072f,<br>
> +0x001fbc03,<br>
>  0x0007ff00,<br>
>  0xe043ff88,<br>
>  0x2ff70000,<br>
>  0xc03a0004,<br>
>  0x34070000,<br>
>  0xf0f00000,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xfc200fe1,<br>
> +0x001f8400,<br>
>  0x00070003,<br>
>  0x5c980780,<br>
>  0x00070002,<br>
> diff --git a/src/shader/exasanv110.fp b/src/shader/exasanv110.fp<br>
> index 61374a6..ee818cd 100644<br>
> --- a/src/shader/exasanv110.fp<br>
> +++ b/src/shader/exasanv110.fp<br>
> @@ -25,23 +25,23 @@ NV110FP_CACompositeSrcAlpha[] = {<br>
>  };<br>
>  #else<br>
><br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x0) (st 0xd wr 0x0 wt 0x1) (st 0xf wr 0x0 wt 0x1)<br>
>  ipa pass $r0 a[0x7c] 0x0 0x0 0x1<br>
>  mufu rcp $r0 $r0<br>
>  ipa $r3 a[0x84] $r0 0x0 0x1<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x1) (st 0xf wr 0x0 wt 0x3) (st 0xf wr 0x1)<br>
>  ipa $r2 a[0x80] $r0 0x0 0x1<br>
>  tex nodep $r4 $r2 0x0 0x0 t2d 0x8<br>
>  ipa $r1 a[0x94] $r0 0x0 0x1<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x1 wt 0x2) (st 0xf wr 0x1 wt 0x2) (st 0xf)<br>
>  ipa $r0 a[0x90] $r0 0x0 0x1<br>
>  tex nodep $r0 $r0 0x0 0x1 t2d 0xf<br>
>  depbar le 0x5 0x0 0x0<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0x1 wt 0x3) (st 0x1) (st 0x1)<br>
>  fmul ftz $r3 $r3 $r4<br>
>  fmul ftz $r2 $r2 $r4<br>
>  fmul ftz $r1 $r1 $r4<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0x1) (st 0xf) (st 0x0)<br>
>  fmul ftz $r0 $r0 $r4<br>
>  exit<br>
>  #endif<br>
> diff --git a/src/shader/exasanv110.fpc b/src/shader/exasanv110.fpc<br>
> index 5516a03..604bf9a 100644<br>
> --- a/src/shader/exasanv110.fpc<br>
> +++ b/src/shader/exasanv110.fpc<br>
> @@ -1,36 +1,36 @@<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe1a0070f,<br>
> +0x003c3c01,<br>
>  0xcff7ff00,<br>
>  0xe003ff87,<br>
>  0x00470000,<br>
>  0x50800000,<br>
>  0x4007ff03,<br>
>  0xe043ff88,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe1e0072f,<br>
> +0x001cbc03,<br>
>  0x0007ff02,<br>
>  0xe043ff88,<br>
>  0x2ff70204,<br>
>  0xc03a0004,<br>
>  0x4007ff01,<br>
>  0xe043ff89,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe5e0172f,<br>
> +0x001fbc02,<br>
>  0x0007ff00,<br>
>  0xe043ff89,<br>
>  0xaff70000,<br>
>  0xc03a0017,<br>
>  0x34070000,<br>
>  0xf0f00000,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xfc201fe1,<br>
> +0x001f8400,<br>
>  0x00470303,<br>
>  0x5c681000,<br>
>  0x00470202,<br>
>  0x5c681000,<br>
>  0x00470101,<br>
>  0x5c681000,<br>
> -0xfc0007e0,<br>
> +0xfde007e1,<br>
>  0x001f8000,<br>
>  0x00470000,<br>
>  0x5c681000,<br>
> diff --git a/src/shader/exascnv110.fp b/src/shader/exascnv110.fp<br>
> index 90bbb55..86e14e8 100644<br>
> --- a/src/shader/exascnv110.fp<br>
> +++ b/src/shader/exascnv110.fp<br>
> @@ -25,14 +25,14 @@ NV110FP_Source[] = {<br>
>  };<br>
>  #else<br>
><br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x0) (st 0xd wr 0x0 wt 0x1) (st 0xf wr 0x0 wt 0x1)<br>
>  ipa pass $r0 a[0x7c] 0x0 0x0 0x1<br>
>  mufu rcp $r0 $r0<br>
>  ipa $r1 a[0x84] $r0 0x0 0x1<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x1) (st 0xf wt 0x3) (st 0xf)<br>
>  ipa $r0 a[0x80] $r0 0x0 0x1<br>
>  tex nodep $r0 $r0 0x0 0x0 t2d 0xf<br>
>  depbar le 0x5 0x0 0x0<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf) (st 0x0) (st 0x0)<br>
>  exit<br>
>  #endif<br>
> diff --git a/src/shader/exascnv110.fpc b/src/shader/exascnv110.fpc<br>
> index 2dba15d..1fef5d2 100644<br>
> --- a/src/shader/exascnv110.fpc<br>
> +++ b/src/shader/exascnv110.fpc<br>
> @@ -1,20 +1,20 @@<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe1a0070f,<br>
> +0x003c3c01,<br>
>  0xcff7ff00,<br>
>  0xe003ff87,<br>
>  0x00470000,<br>
>  0x50800000,<br>
>  0x4007ff01,<br>
>  0xe043ff88,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xfde0072f,<br>
> +0x001fbc03,<br>
>  0x0007ff00,<br>
>  0xe043ff88,<br>
>  0xaff70000,<br>
>  0xc03a0007,<br>
>  0x34070000,<br>
>  0xf0f00000,<br>
> -0xfc0007e0,<br>
> +0xfc0007ef,<br>
>  0x001f8000,<br>
>  0x0007000f,<br>
>  0xe3000000,<br>
> diff --git a/src/shader/videonv110.fp b/src/shader/videonv110.fp<br>
> index 2728311..773aad5 100644<br>
> --- a/src/shader/videonv110.fp<br>
> +++ b/src/shader/videonv110.fp<br>
> @@ -25,30 +25,30 @@ NV110FP_NV12[] = {<br>
>  };<br>
>  #else<br>
><br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x0) (st 0xd wr 0x0 wt 0x1) (st 0xf wr 0x0 wt 0x1)<br>
>  ipa pass $r2 a[0x7c] 0x0 0x0 0x1<br>
>  mufu rcp $r2 $r2<br>
>  ipa $r0 a[0x80] $r2 0x0 0x1<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf wr 0x1) (st 0xf wr 0x0 wt 0x3) (st 0xf wr 0x0 wt 0x1)<br>
>  ipa $r1 a[0x84] $r2 0x0 0x1<br>
>  tex nodep $r4 $r0 0x0 0x0 t2d 0x8<br>
>  tex nodep $r0 $r0 0x0 0x1 t2d 0xc<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf) (st 0x6) (st 0x1)<br>
>  depbar le 0x5 0x1 0x1<br>
>  fmul ftz $r5 $r4 c0[0x0]<br>
>  fadd ftz $r3 $r5 c0[0x4]<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0x6) (st 0x6) (st 0xf)<br>
>  fadd ftz $r4 $r5 c0[0x8]<br>
>  fadd ftz $r5 $r5 c0[0xc]<br>
>  depbar le 0x5 0x0 0x0<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0x6 wt 0x1) (st 0x1) (st 0x1)<br>
>  ffma ftz $r3 $r0 c0[0x10] $r3<br>
>  ffma ftz $r4 $r0 c0[0x14] $r4<br>
>  ffma ftz $r5 $r0 c0[0x18] $r5<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0x1) (st 0x1) (st 0x6)<br>
>  ffma ftz $r0 $r1 c0[0x1c] $r3<br>
>  ffma ftz $r2 $r1 c0[0x24] $r5<br>
>  ffma ftz $r1 $r1 c0[0x20] $r4<br>
> -sched (st 0x0) (st 0x0) (st 0x0)<br>
> +sched (st 0xf) (st 0x0) (st 0x0)<br>
>  exit<br>
>  #endif<br>
> diff --git a/src/shader/videonv110.fpc b/src/shader/videonv110.fpc<br>
> index 31d745a..8e7bedf 100644<br>
> --- a/src/shader/videonv110.fpc<br>
> +++ b/src/shader/videonv110.fpc<br>
> @@ -1,52 +1,52 @@<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe1a0070f,<br>
> +0x003c3c01,<br>
>  0xcff7ff02,<br>
>  0xe003ff87,<br>
>  0x00470202,<br>
>  0x50800000,<br>
>  0x0027ff00,<br>
>  0xe043ff88,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xe1e0072f,<br>
> +0x003c3c03,<br>
>  0x4027ff01,<br>
>  0xe043ff88,<br>
>  0x2ff70004,<br>
>  0xc03a0004,<br>
>  0x2ff70000,<br>
>  0xc03a0016,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xfcc007ef,<br>
> +0x001f8400,<br>
>  0x34170001,<br>
>  0xf0f00000,<br>
>  0x00070405,<br>
>  0x4c681000,<br>
>  0x00170503,<br>
>  0x4c581000,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xfcc007e6,<br>
> +0x001fbc00,<br>
>  0x00270504,<br>
>  0x4c581000,<br>
>  0x00370505,<br>
>  0x4c581000,<br>
>  0x34070000,<br>
>  0xf0f00000,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xfc200fe6,<br>
> +0x001f8400,<br>
>  0x00470003,<br>
>  0x49a00180,<br>
>  0x00570004,<br>
>  0x49a00200,<br>
>  0x00670005,<br>
>  0x49a00280,<br>
> -0xfc0007e0,<br>
> -0x001f8000,<br>
> +0xfc2007e1,<br>
> +0x001f9800,<br>
>  0x00770100,<br>
>  0x49a00180,<br>
>  0x00970102,<br>
>  0x49a00280,<br>
>  0x00870101,<br>
>  0x49a00200,<br>
> -0xfc0007e0,<br>
> +0xfc0007ef,<br>
>  0x001f8000,<br>
>  0x0007000f,<br>
>  0xe3000000,<br>
> --<br>
> 2.11.0<br>
><br>
</div></div>> ______________________________<wbr>_________________<br>
> Nouveau mailing list<br>
> <a href="mailto:Nouveau@lists.freedesktop.org" target="_blank">Nouveau@lists.freedesktop.org</a><br>
> <a href="https://lists.freedesktop.org/mailman/listinfo/nouveau" rel="noreferrer" target="_blank">https://lists.freedesktop.org/<wbr>mailman/listinfo/nouveau</a><br>
</blockquote></div><br></div></div>