<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style type="text/css" style="display:none;"> P {margin-top:0;margin-bottom:0;} </style>
</head>
<body dir="ltr">
<p style="font-family:Arial;font-size:11pt;color:#0078D7;margin:5pt;" align="Left">
[AMD Official Use Only - Internal Distribution Only]<br>
</p>
<br>
<div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
thanks <a id="OWAAM892348" class="_1OtrSZdhKXVv3UhaivrdJ4 mention ms-bgc-nlr ms-fcl-b" href="mailto:Felix.Kuehling@amd.com">
@Kuehling, Felix</a>,</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
I have also noticed this problem, in the multi-GPU environment, there is no working well.</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<br>
</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
Best Regards,</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
Kevin<br>
</div>
<hr tabindex="-1" style="display:inline-block; width:98%">
<div id="divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" color="#000000" style="font-size:11pt"><b>From:</b> Kuehling, Felix <Felix.Kuehling@amd.com><br>
<b>Sent:</b> Friday, May 14, 2021 12:01 AM<br>
<b>To:</b> Wang, Kevin(Yang) <Kevin1.Wang@amd.com>; amd-gfx@lists.freedesktop.org <amd-gfx@lists.freedesktop.org><br>
<b>Cc:</b> Zhang, Hawking <Hawking.Zhang@amd.com>; Min, Frank <Frank.Min@amd.com><br>
<b>Subject:</b> Re: [PATCH v2] drm/amdkfd: disable kfd debugfs node of hang_hws on vf mode</font>
<div> </div>
</div>
<div class="BodyFragment"><font size="2"><span style="font-size:11pt">
<div class="PlainText">This won't work. the kfd_debugfs directory is system-wide. So you cannot<br>
have a per-GPU criteria for creating it. You may have one GPU that<br>
probes successfully, another that fails. You still need the debugfs. If<br>
you have multiple GPUs probing successfully, you only want to create the<br>
debugfs node once.<br>
<br>
The hang_hws file requires writing a GPU-ID to it. So if a card doesn't<br>
probe it won't have a GPU ID, so you won't be able to hang that card<br>
through the hang_hws interface. So there is no need to hide the file<br>
altogether.<br>
<br>
Can you explain why hang_hws should be disabled for VFs?<br>
<br>
Thanks,<br>
  Felix<br>
<br>
Am 2021-05-13 um 4:08 a.m. schrieb Kevin Wang:<br>
<br>
> v1:<br>
> the kfd debugfs node is rely on kgd2kfd probe success,<br>
> if not, the kfd_debugfs should not be created,<br>
> and the node of "hang_hws" should be disabled on vf mode.<br>
><br>
> v2:<br>
> also move kfd_debugfs_fini() into kgd2kfd_device_exit() function.<br>
><br>
> 1. move kfd_debugfs_init() function into kgd2kfd_probe() function.<br>
> 2. disable "hang_hws" debugfs node on vf mode.<br>
><br>
> Signed-off-by: Kevin Wang <kevin1.wang@amd.com><br>
> ---<br>
>  drivers/gpu/drm/amd/amdkfd/kfd_debugfs.c | 7 ++++---<br>
>  drivers/gpu/drm/amd/amdkfd/kfd_device.c  | 3 +++<br>
>  drivers/gpu/drm/amd/amdkfd/kfd_module.c  | 3 ---<br>
>  drivers/gpu/drm/amd/amdkfd/kfd_priv.h    | 4 ++--<br>
>  4 files changed, 9 insertions(+), 8 deletions(-)<br>
><br>
> diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_debugfs.c b/drivers/gpu/drm/amd/amdkfd/kfd_debugfs.c<br>
> index 673d5e34f213..f9a81f34d09e 100644<br>
> --- a/drivers/gpu/drm/amd/amdkfd/kfd_debugfs.c<br>
> +++ b/drivers/gpu/drm/amd/amdkfd/kfd_debugfs.c<br>
> @@ -88,7 +88,7 @@ static const struct file_operations kfd_debugfs_hang_hws_fops = {<br>
>        .release = single_release,<br>
>  };<br>
>  <br>
> -void kfd_debugfs_init(void)<br>
> +void kfd_debugfs_init(bool is_vf)<br>
>  {<br>
>        debugfs_root = debugfs_create_dir("kfd", NULL);<br>
>  <br>
> @@ -98,8 +98,9 @@ void kfd_debugfs_init(void)<br>
>                            kfd_debugfs_hqds_by_device, &kfd_debugfs_fops);<br>
>        debugfs_create_file("rls", S_IFREG | 0444, debugfs_root,<br>
>                            kfd_debugfs_rls_by_device, &kfd_debugfs_fops);<br>
> -     debugfs_create_file("hang_hws", S_IFREG | 0200, debugfs_root,<br>
> -                         kfd_debugfs_hang_hws_read, &kfd_debugfs_hang_hws_fops);<br>
> +     if (!is_vf)<br>
> +             debugfs_create_file("hang_hws", S_IFREG | 0200, debugfs_root,<br>
> +                                 kfd_debugfs_hang_hws_read, &kfd_debugfs_hang_hws_fops);<br>
>  }<br>
>  <br>
>  void kfd_debugfs_fini(void)<br>
> diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_device.c b/drivers/gpu/drm/amd/amdkfd/kfd_device.c<br>
> index dedb8e33b953..aa9154a8410f 100644<br>
> --- a/drivers/gpu/drm/amd/amdkfd/kfd_device.c<br>
> +++ b/drivers/gpu/drm/amd/amdkfd/kfd_device.c<br>
> @@ -649,6 +649,8 @@ struct kfd_dev *kgd2kfd_probe(struct kgd_dev *kgd,<br>
>  <br>
>        ida_init(&kfd->doorbell_ida);<br>
>  <br>
> +     kfd_debugfs_init(vf);<br>
> +<br>
>        return kfd;<br>
>  }<br>
>  <br>
> @@ -884,6 +886,7 @@ void kgd2kfd_device_exit(struct kfd_dev *kfd)<br>
>                        amdgpu_amdkfd_free_gws(kfd->kgd, kfd->gws);<br>
>        }<br>
>  <br>
> +     kfd_debugfs_fini();<br>
>        kfree(kfd);<br>
>  }<br>
>  <br>
> diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_module.c b/drivers/gpu/drm/amd/amdkfd/kfd_module.c<br>
> index 5e90fe642192..6b9f735c55ea 100644<br>
> --- a/drivers/gpu/drm/amd/amdkfd/kfd_module.c<br>
> +++ b/drivers/gpu/drm/amd/amdkfd/kfd_module.c<br>
> @@ -61,8 +61,6 @@ static int kfd_init(void)<br>
>         */<br>
>        kfd_procfs_init();<br>
>  <br>
> -     kfd_debugfs_init();<br>
> -<br>
>        return 0;<br>
>  <br>
>  err_create_wq:<br>
> @@ -76,7 +74,6 @@ static int kfd_init(void)<br>
>  <br>
>  static void kfd_exit(void)<br>
>  {<br>
> -     kfd_debugfs_fini();<br>
>        kfd_process_destroy_wq();<br>
>        kfd_procfs_shutdown();<br>
>        kfd_topology_shutdown();<br>
> diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_priv.h b/drivers/gpu/drm/amd/amdkfd/kfd_priv.h<br>
> index daa9d47514c6..f3ddd8c5b11e 100644<br>
> --- a/drivers/gpu/drm/amd/amdkfd/kfd_priv.h<br>
> +++ b/drivers/gpu/drm/amd/amdkfd/kfd_priv.h<br>
> @@ -1174,7 +1174,7 @@ static inline int kfd_devcgroup_check_permission(struct kfd_dev *kfd)<br>
>  /* Debugfs */<br>
>  #if defined(CONFIG_DEBUG_FS)<br>
>  <br>
> -void kfd_debugfs_init(void);<br>
> +void kfd_debugfs_init(bool is_vf);<br>
>  void kfd_debugfs_fini(void);<br>
>  int kfd_debugfs_mqds_by_process(struct seq_file *m, void *data);<br>
>  int pqm_debugfs_mqds(struct seq_file *m, void *data);<br>
> @@ -1189,7 +1189,7 @@ int dqm_debugfs_execute_queues(struct device_queue_manager *dqm);<br>
>  <br>
>  #else<br>
>  <br>
> -static inline void kfd_debugfs_init(void) {}<br>
> +static inline void kfd_debugfs_init(bool is_vf) {}<br>
>  static inline void kfd_debugfs_fini(void) {}<br>
>  <br>
>  #endif<br>
</div>
</span></font></div>
</div>
</body>
</html>