<html>
    <head>
      <base href="https://bugs.freedesktop.org/">
    </head>
    <body>
      <p>
        <div>
            <b><a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - Crashes / Resets From AMDGPU / Radeon VII"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=110674#c67">Comment # 67</a>
              on <a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - Crashes / Resets From AMDGPU / Radeon VII"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=110674">bug 110674</a>
              from <span class="vcard"><a class="email" href="mailto:tom@r.je" title="Tom B <tom@r.je>"> <span class="fn">Tom B</span></a>
</span></b>
        <pre>I had a look around at similar bugs and came across this:

<a class="bz_bug_link 
          bz_status_REOPENED "
   title="REOPENED - [Bisected]Booting with kernel version 5.1.0 or higher on RX 580 hangs"
   href="show_bug.cgi?id=110822">https://bugs.freedesktop.org/show_bug.cgi?id=110822</a>

It's for a 580, not a VII but the problems started at 5.1 and gives a similar
powerplay related crash.

The suggested fix there is to revert ad51c46eec739c18be24178a30b47801b10e0357.

I just tried this and after 4 reboots I can report it has two effects:

1. I don't have any crashing at all and my card boosts GPU clocks, voltages and
wattages. I can run unigine-heaven for several minutes without the system
freezing.

2. The memory is forced to 351mhz, limiting performance.

If I run 

cat /sys/class/drm/card0/device/pp_dpm_mclk 

it shows:

0: 351Mhz *
1: 801Mhz 
2: 1001Mhz 


Which looks correct for idle, but it never, even under load, boosts to the next
memory clock. It also can't be set manually:


echo manual > /sys/class/drm/card0/device/power_dpm_force_performance_level
echo 2 >  /sys/class/drm/card0/device/pp_dpm_mclk
-bash: echo: write error: Invalid argument


While this isn't a proper fix it does give us some valuable insight. If anyone
wants to run at 351mhz memory with a stable card and 2 screens they can. It
would be nice if someone can verify my findings as my card seemed to behave
differently to others for some reason.

This bug may be related to <a class="bz_bug_link 
          bz_status_REOPENED "
   title="REOPENED - [Bisected]Booting with kernel version 5.1.0 or higher on RX 580 hangs"
   href="show_bug.cgi?id=110822">https://bugs.freedesktop.org/show_bug.cgi?id=110822</a>
alternatively, it's possible the crash occurs when the memory clock changes
(which might mean it's related to
<a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - Screen flickering under amdgpu-experimental [buggy auto power profile]"
   href="show_bug.cgi?id=102646">https://bugs.freedesktop.org/show_bug.cgi?id=102646</a> as there are issues with
memory clock changes there) There seem to be several powerplay related issues
which may have the same root cause.


I'm now going to:

1. Revert to the stock kernel and set the mclk to 1001 manually before starting
SDDM and see if the crash occurs.

2. See if I can manage to get stability and the mclk stuck at 1001mhz as this
would be an acceptable compromise, even if not ideal.</pre>
        </div>
      </p>


      <hr>
      <span>You are receiving this mail because:</span>

      <ul>
          <li>You are the assignee for the bug.</li>
      </ul>
    </body>
</html>