<!DOCTYPE html><html><head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
  </head>
  <body>
    <p><br>
    </p>
    <div class="moz-cite-prefix">On 2023-11-13 10:19, Yat Sin, David
      wrote:<br>
    </div>
    <blockquote type="cite" cite="mid:DM6PR12MB5021BC6217026CE5B39A17A395B3A@DM6PR12MB5021.namprd12.prod.outlook.com">
      
      <meta name="Generator" content="Microsoft Word 15 (filtered medium)">
      <style>@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}pre
        {mso-style-priority:99;
        mso-style-link:"HTML Preformatted Char";
        margin:0in;
        font-size:10.0pt;
        font-family:"Courier New";}span.HTMLPreformattedChar
        {mso-style-name:"HTML Preformatted Char";
        mso-style-priority:99;
        mso-style-link:"HTML Preformatted";
        font-family:"Consolas",serif;}span.EmailStyle21
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:windowtext;}.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;
        mso-ligatures:none;}div.WordSection1
        {page:WordSection1;}</style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
      <p style="font-family:Arial;font-size:10pt;color:#0000FF;margin:5pt;font-style:normal;font-weight:normal;text-decoration:none;" align="Left">
        [AMD Official Use Only - General]<br>
      </p>
      <br>
      <div>
        <div class="WordSection1">
          <p class="MsoNormal"><o:p> </o:p></p>
          <p class="MsoNormal"><o:p> </o:p></p>
          <div style="border:none;border-left:solid blue 1.5pt;padding:0in 0in 0in 4.0pt">
            <div>
              <div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0in 0in 0in">
                <p class="MsoNormal"><b>From:</b> Zhu, James
                  <a class="moz-txt-link-rfc2396E" href="mailto:James.Zhu@amd.com"><James.Zhu@amd.com></a> <br>
                  <b>Sent:</b> Monday, November 13, 2023 10:13 AM<br>
                  <b>To:</b> Yat Sin, David
                  <a class="moz-txt-link-rfc2396E" href="mailto:David.YatSin@amd.com"><David.YatSin@amd.com></a>; Zhu, James
                  <a class="moz-txt-link-rfc2396E" href="mailto:James.Zhu@amd.com"><James.Zhu@amd.com></a>;
                  <a class="moz-txt-link-abbreviated" href="mailto:amd-gfx@lists.freedesktop.org">amd-gfx@lists.freedesktop.org</a><br>
                  <b>Cc:</b> Kuehling, Felix
                  <a class="moz-txt-link-rfc2396E" href="mailto:Felix.Kuehling@amd.com"><Felix.Kuehling@amd.com></a>; Greathouse, Joseph
                  <a class="moz-txt-link-rfc2396E" href="mailto:Joseph.Greathouse@amd.com"><Joseph.Greathouse@amd.com></a><br>
                  <b>Subject:</b> Re: [PATCH 22/24] drm/amdkfd: add pc
                  sampling release when process release<o:p></o:p></p>
              </div>
            </div>
            <p class="MsoNormal"><o:p> </o:p></p>
            <p><o:p> </o:p></p>
            <div>
              <p class="MsoNormal">On 2023-11-10 14:08, Yat Sin, David
                wrote:<o:p></o:p></p>
            </div>
            <blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
              <pre>[AMD Official Use Only - General]<o:p></o:p></pre>
              <pre><o:p> </o:p></pre>
              <blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
                <pre>-----Original Message-----<o:p></o:p></pre>
                <pre>From: Zhu, James <a href="mailto:James.Zhu@amd.com" moz-do-not-send="true"><James.Zhu@amd.com></a><o:p></o:p></pre>
                <pre>Sent: Friday, November 3, 2023 9:12 AM<o:p></o:p></pre>
                <pre>To: <a href="mailto:amd-gfx@lists.freedesktop.org" moz-do-not-send="true" class="moz-txt-link-freetext">amd-gfx@lists.freedesktop.org</a><o:p></o:p></pre>
                <pre>Cc: Kuehling, Felix <a href="mailto:Felix.Kuehling@amd.com" moz-do-not-send="true"><Felix.Kuehling@amd.com></a>; Greathouse, Joseph<o:p></o:p></pre>
                <pre><a href="mailto:Joseph.Greathouse@amd.com" moz-do-not-send="true"><Joseph.Greathouse@amd.com></a>; Yat Sin, David <a href="mailto:David.YatSin@amd.com" moz-do-not-send="true"><David.YatSin@amd.com></a>; Zhu,<o:p></o:p></pre>
                <pre>James <a href="mailto:James.Zhu@amd.com" moz-do-not-send="true"><James.Zhu@amd.com></a><o:p></o:p></pre>
                <pre>Subject: [PATCH 22/24] drm/amdkfd: add pc sampling release when process<o:p></o:p></pre>
                <pre>release<o:p></o:p></pre>
                <pre><o:p> </o:p></pre>
                <pre>Add pc sampling release when process release, it will force to stop all activate<o:p></o:p></pre>
                <pre>sessions with this process.<o:p></o:p></pre>
                <pre><o:p> </o:p></pre>
                <pre>Signed-off-by: James Zhu <a href="mailto:James.Zhu@amd.com" moz-do-not-send="true"><James.Zhu@amd.com></a><o:p></o:p></pre>
                <pre>---<o:p></o:p></pre>
                <pre> drivers/gpu/drm/amd/amdkfd/kfd_pc_sampling.c | 26<o:p></o:p></pre>
                <pre>++++++++++++++++++++  drivers/gpu/drm/amd/amdkfd/kfd_pc_sampling.h |<o:p></o:p></pre>
                <pre>1 +<o:p></o:p></pre>
                <pre> drivers/gpu/drm/amd/amdkfd/kfd_process.c     |  3 +++<o:p></o:p></pre>
                <pre> 3 files changed, 30 insertions(+)<o:p></o:p></pre>
                <pre><o:p> </o:p></pre>
                <pre>diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_pc_sampling.c<o:p></o:p></pre>
                <pre>b/drivers/gpu/drm/amd/amdkfd/kfd_pc_sampling.c<o:p></o:p></pre>
                <pre>index 66670cdb813a..00d8d3f400a9 100644<o:p></o:p></pre>
                <pre>--- a/drivers/gpu/drm/amd/amdkfd/kfd_pc_sampling.c<o:p></o:p></pre>
                <pre>+++ b/drivers/gpu/drm/amd/amdkfd/kfd_pc_sampling.c<o:p></o:p></pre>
                <pre>@@ -274,6 +274,32 @@ static int kfd_pc_sample_destroy(struct<o:p></o:p></pre>
                <pre>kfd_process_device *pdd, uint32_t trace_<o:p></o:p></pre>
                <pre>      return 0;<o:p></o:p></pre>
                <pre> }<o:p></o:p></pre>
                <pre><o:p> </o:p></pre>
                <pre>+void kfd_pc_sample_release(struct kfd_process_device *pdd) {<o:p></o:p></pre>
                <pre>+     struct pc_sampling_entry *pcs_entry;<o:p></o:p></pre>
                <pre>+     struct idr *idp;<o:p></o:p></pre>
                <pre>+     uint32_t id;<o:p></o:p></pre>
                <pre>+<o:p></o:p></pre>
                <pre>+     if (sched_policy == KFD_SCHED_POLICY_NO_HWS) {<o:p></o:p></pre>
                <pre>+             pr_err("PC Sampling does not support sched_policy %i",<o:p></o:p></pre>
                <pre>sched_policy);<o:p></o:p></pre>
                <pre>+             return;<o:p></o:p></pre>
                <pre>+     }<o:p></o:p></pre>
              </blockquote>
              <pre>You do not need to check the sched_policy here, already checked in kfd_ioctl_pc_sample(..) , so cannot have a hosttrap session if policy is NO_HWS.<o:p></o:p></pre>
            </blockquote>
            <p class="MsoNormal">  [JZ]kfd_pc_sample_release is not
              called from kfd_ioctl_pc_sample. It is in process quit
              process.
              <o:p></o:p></p>
            <p class="MsoNormal" style="margin-left:5.25pt">[David] I
              know. But you cannot have a PC sampling session during
              process clean-up when policy=NO_HWS because the session
              creation would have been blocked on session-create.</p>
          </div>
        </div>
      </div>
    </blockquote>
    [JZ] good point.<br>
    <blockquote type="cite" cite="mid:DM6PR12MB5021BC6217026CE5B39A17A395B3A@DM6PR12MB5021.namprd12.prod.outlook.com">
      <div>
        <div class="WordSection1">
          <div style="border:none;border-left:solid blue 1.5pt;padding:0in 0in 0in 4.0pt">
            <p class="MsoNormal" style="margin-left:5.25pt"><o:p></o:p></p>
            <blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
              <blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
                <pre>+<o:p></o:p></pre>
                <pre>+     /* force to release all PC sampling task for this process */<o:p></o:p></pre>
                <pre>+     idp = &pdd->dev->pcs_data.hosttrap_entry.base.pc_sampling_idr;<o:p></o:p></pre>
                <pre>+     mutex_lock(&pdd->dev->pcs_data.mutex);<o:p></o:p></pre>
                <pre>+     idr_for_each_entry(idp, pcs_entry, id) {<o:p></o:p></pre>
                <pre>+             if (pcs_entry->pdd != pdd)<o:p></o:p></pre>
                <pre>+                     continue;<o:p></o:p></pre>
                <pre>+             mutex_unlock(&pdd->dev->pcs_data.mutex);<o:p></o:p></pre>
              </blockquote>
              <pre>Can we not release the mutex here and just tell the worker thread to exit by setting the stop_enable bit.<o:p></o:p></pre>
              <pre>I find we have a lot of places where we are acquiring/releasing the mutex within loops and this results in a<o:p></o:p></pre>
              <pre>lot of extra states that we have to account for during the start/stop/destroy calls.<o:p></o:p></pre>
              <blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
                <pre>+             if (pcs_entry->enabled)<o:p></o:p></pre>
                <pre>+                     kfd_pc_sample_stop(pdd, pcs_entry);<o:p></o:p></pre>
                <pre>+             kfd_pc_sample_destroy(pdd, id, pcs_entry);<o:p></o:p></pre>
                <pre>+             mutex_lock(&pdd->dev->pcs_data.mutex);<o:p></o:p></pre>
                <pre>+     }<o:p></o:p></pre>
                <pre>+     mutex_unlock(&pdd->dev->pcs_data.mutex);<o:p></o:p></pre>
                <pre>+}<o:p></o:p></pre>
                <pre>+<o:p></o:p></pre>
                <pre> int kfd_pc_sample(struct kfd_process_device *pdd,<o:p></o:p></pre>
                <pre>                                      struct kfd_ioctl_pc_sample_args __user<o:p></o:p></pre>
                <pre>*args)  { diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_pc_sampling.h<o:p></o:p></pre>
                <pre>b/drivers/gpu/drm/amd/amdkfd/kfd_pc_sampling.h<o:p></o:p></pre>
                <pre>index cb93909e6bd3..4ea064fdaa98 100644<o:p></o:p></pre>
                <pre>--- a/drivers/gpu/drm/amd/amdkfd/kfd_pc_sampling.h<o:p></o:p></pre>
                <pre>+++ b/drivers/gpu/drm/amd/amdkfd/kfd_pc_sampling.h<o:p></o:p></pre>
                <pre>@@ -30,6 +30,7 @@<o:p></o:p></pre>
                <pre><o:p> </o:p></pre>
                <pre> int kfd_pc_sample(struct kfd_process_device *pdd,<o:p></o:p></pre>
                <pre>                                      struct kfd_ioctl_pc_sample_args __user<o:p></o:p></pre>
                <pre>*args);<o:p></o:p></pre>
                <pre>+void kfd_pc_sample_release(struct kfd_process_device *pdd);<o:p></o:p></pre>
                <pre> void kfd_pc_sample_handler(struct work_struct *work);<o:p></o:p></pre>
                <pre><o:p> </o:p></pre>
                <pre> #endif /* KFD_PC_SAMPLING_H_ */<o:p></o:p></pre>
                <pre>diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_process.c<o:p></o:p></pre>
                <pre>b/drivers/gpu/drm/amd/amdkfd/kfd_process.c<o:p></o:p></pre>
                <pre>index d22d804f180d..54f3db7eaae2 100644<o:p></o:p></pre>
                <pre>--- a/drivers/gpu/drm/amd/amdkfd/kfd_process.c<o:p></o:p></pre>
                <pre>+++ b/drivers/gpu/drm/amd/amdkfd/kfd_process.c<o:p></o:p></pre>
                <pre>@@ -43,6 +43,7 @@ struct mm_struct;<o:p></o:p></pre>
                <pre> #include "kfd_svm.h"<o:p></o:p></pre>
                <pre> #include "kfd_smi_events.h"<o:p></o:p></pre>
                <pre> #include "kfd_debug.h"<o:p></o:p></pre>
                <pre>+#include "kfd_pc_sampling.h"<o:p></o:p></pre>
                <pre><o:p> </o:p></pre>
                <pre> /*<o:p></o:p></pre>
                <pre>  * List of struct kfd_process (field kfd_process).<o:p></o:p></pre>
                <pre>@@ -1020,6 +1021,8 @@ static void kfd_process_destroy_pdds(struct<o:p></o:p></pre>
                <pre>kfd_process *p)<o:p></o:p></pre>
                <pre>              pr_debug("Releasing pdd (topology id %d) for process (pasid<o:p></o:p></pre>
                <pre>0x%x)\n",<o:p></o:p></pre>
                <pre>                              pdd->dev->id, p->pasid);<o:p></o:p></pre>
                <pre><o:p> </o:p></pre>
                <pre>+             kfd_pc_sample_release(pdd);<o:p></o:p></pre>
                <pre>+<o:p></o:p></pre>
                <pre>              kfd_process_device_destroy_cwsr_dgpu(pdd);<o:p></o:p></pre>
                <pre>              kfd_process_device_destroy_ib_mem(pdd);<o:p></o:p></pre>
                <pre><o:p> </o:p></pre>
                <pre>--<o:p></o:p></pre>
                <pre>2.25.1<o:p></o:p></pre>
              </blockquote>
              <pre><o:p> </o:p></pre>
            </blockquote>
          </div>
        </div>
      </div>
    </blockquote>
  </body>
</html>