<div dir="ltr"><div><div><div>Hi,<br><br></div>I think I've done about 10 reboots with the commit reverted and I never experienced the crash.  But with 4.2.0-rc6 I get the crash on about every other reboot.<br><br></div>Probably relevant: the computer on which the crash occurs has two GPUs (one Intel and one Nvidia).  The Intel one is actually being used, whereas I presume the Nvidia one is being automatically disabled shortly after boot, perhaps when the crash occurs...<br><br></div>Eric<br></div><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Aug 10, 2015 at 11:28 PM, Alexandre Courbot <span dir="ltr"><<a href="mailto:gnurou@gmail.com" target="_blank">gnurou@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Indeed, and I am actually surprised to see one here. I will<br>
double-check that patch.<br>
<br>
Eric, would you be able to give an estimate of the repro rate for this<br>
issue? More testing with and without the patch would be welcome, it'd<br>
be good to know whether it is actually the culprit or not.<br>
<div class="HOEnZb"><div class="h5"><br>
On Mon, Aug 10, 2015 at 2:28 AM, Ilia Mirkin <<a href="mailto:imirkin@alum.mit.edu">imirkin@alum.mit.edu</a>> wrote:<br>
> Alexandre, could you take a look? 0xbad* generally comes from bad mmio<br>
> reads.<br>
><br>
> On Aug 9, 2015 1:08 PM, "Eric Biggers" <<a href="mailto:ebiggers3@gmail.com">ebiggers3@gmail.com</a>> wrote:<br>
>><br>
>> Hi,<br>
>><br>
>> I am testing Linux v4.2-rc5 and I am sporadically getting crashes shortly<br>
>> after<br>
>> startup in gk104_fifo_intr_runlist().  What I've found is that the 'mask'<br>
>> value<br>
>> read from offset 0x2a00 comes back as '0xbad0da00'.  This causes the<br>
>> 'engn'<br>
>> variable to be assigned the value 9, which is invalid; then wake_up() is<br>
>> called<br>
>> on an uninitialized waitqueue which causes the crash.<br>
>><br>
>> Reverting commit 1addc12648521d ("drm/nouveau/fifo/gk104: kick channels<br>
>> when<br>
>> deactivating them") seemed to make the problem go away, although I can't<br>
>> be 100%<br>
>> sure because the problem is sporadic.<br>
>><br>
>> Attached an example of the kernel log up to the crash.<br>
>><br>
>> Eric<br>
>><br>
>> _______________________________________________<br>
>> Nouveau mailing list<br>
>> <a href="mailto:Nouveau@lists.freedesktop.org">Nouveau@lists.freedesktop.org</a><br>
>> <a href="http://lists.freedesktop.org/mailman/listinfo/nouveau" rel="noreferrer" target="_blank">http://lists.freedesktop.org/mailman/listinfo/nouveau</a><br>
>><br>
><br>
</div></div></blockquote></div><br></div>