<div dir="ltr">Hi Monk,<div><br></div><div>It was more a general question. So you never need to do an electrical reboot when a gpu reset fails ?</div><div><br></div><div>Thx</div><div>Julien<br><div class="gmail_extra"><br><div class="gmail_quote">On 10 November 2017 at 07:51, Liu, Monk <span dir="ltr"><<a href="mailto:Monk.Liu@amd.com" target="_blank">Monk.Liu@amd.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">





<div lang="ZH-CN" link="blue" vlink="purple">
<div class="m_-1683366303938199314WordSection1">
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.5pt;font-family:等线">Please share the dmesg log, and what’s the chip are you using ?<u></u><u></u></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.5pt;font-family:等线"><u></u> <u></u></span></p>
<p class="MsoNormal"><b><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif">From:</span></b><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif"> Julien Isorce [mailto:<a href="mailto:julien.isorce@gmail.com" target="_blank">julien.isorce@gmail.<wbr>com</a>]
<br>
<b>Sent:</b> 2017</span><span style="font-size:11.0pt">年</span><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif">11</span><span style="font-size:11.0pt">月</span><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif">9</span><span style="font-size:11.0pt">日</span><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif">
 17:35<br>
<b>To:</b> Liu, Monk <<a href="mailto:Monk.Liu@amd.com" target="_blank">Monk.Liu@amd.com</a>><br>
<b>Cc:</b> <a href="mailto:amd-gfx@lists.freedesktop.org" target="_blank">amd-gfx@lists.freedesktop.org</a><br>
<b>Subject:</b> Re: [PATCH 0/7] *** GPU recover V3 ***<u></u><u></u></span></p><div><div class="h5">
<p class="MsoNormal"><span lang="EN-US"><u></u> <u></u></span></p>
<div>
<p class="MsoNormal"><span lang="EN-US">Hi Monk.<u></u><u></u></span></p>
<div>
<p class="MsoNormal"><span lang="EN-US"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US">I am interested on this. Currently when a "ring X stalled for more than N sec" happens it usually goes into the gpu reset routine.<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US">Does it always cause the vram to be lost ? Could you explain what happens if the vram remains lost ?<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US">I am asking this because I experienced some recurrent gpu reset that are marked succeeded from the log but fail in the "resume" step.<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US">I would not be interested in this if it would always leave a chance to the user to cleanly reboot the machine.<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US">The issue is that it can require a hard reboot without kernel panic and without keeping the keyboard responding to magic keys.<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US">Are those patches trying to address this issue ?<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US">Note that here "issue" is not referring to the root cause of a ring X stalled and it is also not referring to why "resume" step fails. <u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US">Thx a lot<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US">Julien<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US"><u></u> <u></u></span></p>
</div>
</div>
<div>
<p class="MsoNormal"><span lang="EN-US"><u></u> <u></u></span></p>
<div>
<p class="MsoNormal"><span lang="EN-US">On 30 October 2017 at 04:15, Monk Liu <<a href="mailto:Monk.Liu@amd.com" target="_blank">Monk.Liu@amd.com</a>> wrote:<u></u><u></u></span></p>
<blockquote style="border:none;border-left:solid #cccccc 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<p class="MsoNormal"><span lang="EN-US">*** job skipping logic in scheduler part is re-implemented  ***<br>
<br>
Monk Liu (7):<br>
  amd/scheduler:imple job skip feature(v3)<br>
  drm/amdgpu:implement new GPU recover(v3)<br>
  drm/amdgpu:cleanup in_sriov_reset and lock_reset<br>
  drm/amdgpu:cleanup ucode_init_bo<br>
  drm/amdgpu:block kms open during gpu_reset<br>
  drm/amdgpu/sriov:fix memory leak in psp_load_fw<br>
  drm/amdgpu:fix random missing of FLR NOTIFY<br>
<br>
 drivers/gpu/drm/amd/amdgpu/<wbr>amdgpu.h           |   9 +-<br>
 drivers/gpu/drm/amd/amdgpu/<wbr>amdgpu_device.c    | 311 ++++++++++++--------------<br>
 drivers/gpu/drm/amd/amdgpu/<wbr>amdgpu_fence.c     |  10 +-<br>
 drivers/gpu/drm/amd/amdgpu/<wbr>amdgpu_irq.c       |   2 +-<br>
 drivers/gpu/drm/amd/amdgpu/<wbr>amdgpu_job.c       |  18 +-<br>
 drivers/gpu/drm/amd/amdgpu/<wbr>amdgpu_kms.c       |   3 +<br>
 drivers/gpu/drm/amd/amdgpu/<wbr>amdgpu_psp.c       |  22 +-<br>
 drivers/gpu/drm/amd/amdgpu/<wbr>amdgpu_ucode.c     |   4 +-<br>
 drivers/gpu/drm/amd/amdgpu/<wbr>amdgpu_virt.c      |   2 -<br>
 drivers/gpu/drm/amd/amdgpu/<wbr>amdgpu_virt.h      |   2 -<br>
 drivers/gpu/drm/amd/amdgpu/<wbr>gfx_v8_0.c         |   6 +-<br>
 drivers/gpu/drm/amd/amdgpu/<wbr>gfx_v9_0.c         |   6 +-<br>
 drivers/gpu/drm/amd/amdgpu/<wbr>mxgpu_ai.c         |  16 +-<br>
 drivers/gpu/drm/amd/amdgpu/<wbr>mxgpu_vi.c         |   2 +-<br>
 drivers/gpu/drm/amd/<wbr>scheduler/gpu_scheduler.c |  39 ++--<br>
 15 files changed, 220 insertions(+), 232 deletions(-)<br>
<span style="color:#888888"><br>
<span class="m_-1683366303938199314hoenzb">--</span><br>
<span class="m_-1683366303938199314hoenzb">2.7.4</span><br>
<br>
<span class="m_-1683366303938199314hoenzb">______________________________<wbr>_________________</span><br>
<span class="m_-1683366303938199314hoenzb">amd-gfx mailing list</span><br>
<span class="m_-1683366303938199314hoenzb"><a href="mailto:amd-gfx@lists.freedesktop.org" target="_blank">amd-gfx@lists.freedesktop.org</a></span><br>
<span class="m_-1683366303938199314hoenzb"><a href="https://lists.freedesktop.org/mailman/listinfo/amd-gfx" target="_blank">https://lists.freedesktop.org/<wbr>mailman/listinfo/amd-gfx</a></span></span><u></u><u></u></span></p>
</blockquote>
</div>
<p class="MsoNormal"><span lang="EN-US"><u></u> <u></u></span></p>
</div>
</div></div></div>
</div>

</blockquote></div><br></div></div></div>