<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Aptos;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        font-size:12.0pt;
        font-family:"Aptos",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
p.MsoPlainText, li.MsoPlainText, div.MsoPlainText
        {mso-style-priority:99;
        mso-style-link:"Plain Text Char";
        mso-margin-top-alt:auto;
        margin-right:0in;
        mso-margin-bottom-alt:auto;
        margin-left:0in;
        font-size:12.0pt;
        font-family:"Aptos",sans-serif;}
span.PlainTextChar
        {mso-style-name:"Plain Text Char";
        mso-style-priority:99;
        mso-style-link:"Plain Text";
        font-family:Consolas;}
span.EmailStyle22
        {mso-style-type:personal-compose;
        font-family:"Aptos",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;
        mso-ligatures:none;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style>
</head>
<body lang="EN-US" link="blue" vlink="purple" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt;color:black"> </span><span style="font-size:11.0pt"><o:p></o:p></span></p>
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">From:</span></b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"> Chen, Xiaogang <Xiaogang.Chen@amd.com>
<br>
<b>Sent:</b> Wednesday, August 28, 2024 4:38 PM<br>
<b>To:</b> Kuehling, Felix <Felix.Kuehling@amd.com>; Errabolu, Ramesh <Ramesh.Errabolu@amd.com>; amd-gfx@lists.freedesktop.org<br>
<b>Subject:</b> Re: [PATCH v2] drm/amdgpu: Surface svm_attr_gobm, a RW module parameter<o:p></o:p></span></p>
</div>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<p><o:p> </o:p></p>
<div>
<p class="MsoNormal">On 8/28/2024 4:05 PM, Felix Kuehling wrote:<o:p></o:p></p>
</div>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<p class="MsoNormal"><br>
On 2024-08-28 16:34, Chen, Xiaogang wrote: <br>
<br>
<o:p></o:p></p>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<p class="MsoNormal"><br>
<br>
On 8/28/2024 3:26 PM, Errabolu, Ramesh wrote: <br>
<br>
<o:p></o:p></p>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<p class="MsoNormal" style="margin-bottom:12.0pt"><br>
Responses inline <br>
<br>
Regards, <br>
<br>
Ramesh <br>
<br>
*From:*Chen, Xiaogang <a href="mailto:Xiaogang.Chen@amd.com"><Xiaogang.Chen@amd.com></a>
<br>
*Sent:* Wednesday, August 28, 2024 3:01 PM <br>
*To:* Errabolu, Ramesh <a href="mailto:Ramesh.Errabolu@amd.com"><Ramesh.Errabolu@amd.com></a>;
<a href="mailto:amd-gfx@lists.freedesktop.org">amd-gfx@lists.freedesktop.org</a> <br>
*Subject:* Re: [PATCH v2] drm/amdgpu: Surface svm_attr_gobm, a RW module parameter
<br>
<br>
On 8/28/2024 2:52 PM, Errabolu, Ramesh wrote: <br>
<br>
    Response inline <br>
<br>
    Regards, <br>
<br>
    Ramesh <br>
<br>
      <br>
    -----Original Message----- <br>
<br>
    From: Chen, Xiaogang<a href="mailto:Xiaogang.Chen@amd.com"><Xiaogang.Chen@amd.com></a> 
<a href="mailto:Xiaogang.Chen@amd.com"><mailto:Xiaogang.Chen@amd.com></a>  <br>
    Sent: Wednesday, August 28, 2024 2:43 PM <br>
<br>
    To: Errabolu, Ramesh<a href="mailto:Ramesh.Errabolu@amd.com"><Ramesh.Errabolu@amd.com></a> 
<a href="mailto:Ramesh.Errabolu@amd.com"><mailto:Ramesh.Errabolu@amd.com></a>;amd-gfx@lists.freedesktop.org
<br>
<br>
    Subject: Re: [PATCH v2] drm/amdgpu: Surface svm_attr_gobm, a RW module parameter
<br>
<br>
    Why need this driver parameter? kfd has KFD_IOCTL_SVM_ATTR_GRANULARITY api that allows user space to set migration granularity per prange. If both got set which will take precedence?
<br>
<br>
    Ramesh: Use of Kfd Ioctl is available to users of registered memory. It allows users to control GOBM per buffer level, including overwriting default value. For ranges that do not specify GOBM, the default value will be found.
<br>
<br>
If user space use KFD_IOCTL_SVM_ATTR_GRANULARITY it will overwrite this parameter value for a prange, then how to know which granularity take effect? That is decided when user set this parameter and when the api got used.
<br>
<br>
Ramesh: The value bound by Kfd ioctl will take effect. In the life cycle of a prange it can go from the default value to one that is set by user via set_attr() call. However, it is generally understood that that users of set_attr() will not call it directly
 i.e. the rely on higher level apis from ROCr or HIP. <o:p></o:p></p>
</blockquote>
<p class="MsoNormal" style="margin-bottom:12.0pt">driver parameter can be set at run time, not only at boot time. It is not predictable  when user set this driver parameter and when the api got called.
<o:p></o:p></p>
</blockquote>
<p class="MsoNormal">I don't think this is a problem. The module parameter determines the granularity if the application doesn't set the virtual address range attribute. The default is captured in the per-process svms structure. So all mappings of the same
 process will use the same default, even if the module parameter is changed after the process is started. The get_attr ioctl will always return the actual granularity, no matter whether it comes from the default or was overridden by user mode for the virtual
 address range. <o:p></o:p></p>
</blockquote>
<p class="MsoPlainText">My concern is there are two ways to set pragne's granularity, both can be used at run time. It can make confusion to know which one take effect as user can use driver parameter and api to change granularity with any timing.<o:p></o:p></p>
<p class="MsoPlainText"><span style="font-size:11.0pt">Ramesh: Users of this capability are expected to understand as to how this parameter works. Having said a brief documentation of how this param works could be written and attached to documentation. Hopefully
 users will find this additional  documentation helpful<o:p></o:p></span></p>
<p class="MsoPlainText">Regards <o:p></o:p></p>
<p class="MsoPlainText">Xiaogang<o:p></o:p></p>
<p class="MsoPlainText"> <o:p></o:p></p>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<p class="MsoNormal"><br>
Regards, <br>
  Felix <br>
<br>
<br>
<br>
<o:p></o:p></p>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<p class="MsoNormal">Regards <br>
<br>
Xiaogang <br>
<br>
<br>
<o:p></o:p></p>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<p class="MsoNormal" style="margin-bottom:12.0pt">Regards <br>
<br>
Xiaogang <br>
<br>
    Regards <br>
<br>
    Xiaogang <br>
<br>
    On 8/26/2024 2:34 PM, Ramesh Errabolu wrote: <br>
<br>
        Caution: This message originated from an External Source. Use proper caution when opening attachments, clicking links, or responding.
<br>
<br>
        Enables users to update the default size of buffer used in migration <br>
<br>
        either from Sysmem to VRAM or vice versa. <br>
<br>
        The param GOBM refers to granularity of buffer migration, and is <br>
<br>
        specified in terms of log(numPages(buffer)). It facilitates users of <br>
<br>
        unregistered memory to control GOBM, albeit at a coarse level <br>
<br>
        Signed-off-by: Ramesh Errabolu<a href="mailto:Ramesh.Errabolu@amd.com"><Ramesh.Errabolu@amd.com></a> 
<a href="mailto:Ramesh.Errabolu@amd.com"><mailto:Ramesh.Errabolu@amd.com></a> <br>
<br>
        --- <br>
<br>
           drivers/gpu/drm/amd/amdgpu/amdgpu.h     |  4 ++++ <br>
<br>
           drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c | 18 +++++++++++++++++ <br>
<br>
           drivers/gpu/drm/amd/amdkfd/kfd_priv.h   | 12 ++++++++++++ <br>
<br>
           drivers/gpu/drm/amd/amdkfd/kfd_svm.c    | 26 ++++++++++++++++---------
<br>
<br>
           4 files changed, 51 insertions(+), 9 deletions(-) <br>
<br>
        diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu.h <br>
<br>
        b/drivers/gpu/drm/amd/amdgpu/amdgpu.h <br>
<br>
        index e8c284aea1f2..73dd816b01f2 100644 <br>
<br>
        --- a/drivers/gpu/drm/amd/amdgpu/amdgpu.h <br>
<br>
        +++ b/drivers/gpu/drm/amd/amdgpu/amdgpu.h <br>
<br>
        @@ -237,6 +237,7 @@ extern int sched_policy; <br>
<br>
           extern bool debug_evictions; <br>
<br>
           extern bool no_system_mem_limit; <br>
<br>
           extern int halt_if_hws_hang; <br>
<br>
        +extern uint amdgpu_svm_attr_gobm; <br>
<br>
           #else <br>
<br>
           static const int __maybe_unused sched_policy = KFD_SCHED_POLICY_HWS; <br>
<br>
           static const bool __maybe_unused debug_evictions; /* = false */ @@ <br>
<br>
        -313,6 +314,9 @@ extern int amdgpu_wbrf; <br>
<br>
           /* Extra time delay(in ms) to eliminate the influence of temperature momentary fluctuation */
<br>
<br>
           #define AMDGPU_SWCTF_EXTRA_DELAY               50 <br>
<br>
        +/* Default size of buffer to use in migrating buffer */ <br>
<br>
        +#define AMDGPU_SVM_ATTR_GOBM       9 <br>
<br>
        + <br>
<br>
           struct amdgpu_xcp_mgr; <br>
<br>
           struct amdgpu_device; <br>
<br>
           struct amdgpu_irq_src; <br>
<br>
        diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c <br>
<br>
        b/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c <br>
<br>
        index b9529948f2b2..09c501753a3b 100644 <br>
<br>
        --- a/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c <br>
<br>
        +++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c <br>
<br>
        @@ -169,6 +169,17 @@ uint amdgpu_sdma_phase_quantum = 32; <br>
<br>
           char *amdgpu_disable_cu; <br>
<br>
           char *amdgpu_virtual_display; <br>
<br>
           bool enforce_isolation; <br>
<br>
        + <br>
<br>
        +/* Specifies the default size of buffer to use in <br>
<br>
        + * migrating buffer from Sysmem to VRAM and vice <br>
<br>
        + * versa <br>
<br>
        + * <br>
<br>
        + * GOBM - Granularity of Buffer Migration <br>
<br>
        + * <br>
<br>
        + * Defined as log2(sizeof(buffer)/PAGE_SIZE)  */ uint <br>
<br>
        +amdgpu_svm_attr_gobm = AMDGPU_SVM_ATTR_GOBM; <br>
<br>
        + <br>
<br>
           /* <br>
<br>
            * OverDrive(bit 14) disabled by default <br>
<br>
            * GFX DCS(bit 19) disabled by default @@ -320,6 +331,13 @@ <br>
<br>
        module_param_named(pcie_gen2, amdgpu_pcie_gen2, int, 0444); <br>
<br>
           MODULE_PARM_DESC(msi, "MSI support (1 = enable, 0 = disable, -1 = auto)");
<br>
<br>
           module_param_named(msi, amdgpu_msi, int, 0444); <br>
<br>
        +/** <br>
<br>
        + * DOC: svm_attr_gobm (uint) <br>
<br>
        + * Size of buffer to use in migrating buffer from Sysmem to VRAM and <br>
<br>
        +vice versa  */ MODULE_PARM_DESC(svm_attr_gobm, "Defined as <br>
<br>
        +log2(sizeof(buffer)/PAGE_SIZE), e.g. 9 for 2 MiB"); <br>
<br>
        +module_param_named(svm_attr_gobm, amdgpu_svm_attr_gobm, uint, 0644); <br>
<br>
        + <br>
<br>
           /** <br>
<br>
            * DOC: lockup_timeout (string) <br>
<br>
            * Set GPU scheduler timeout value in ms. <br>
<br>
        diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_priv.h <br>
<br>
        b/drivers/gpu/drm/amd/amdkfd/kfd_priv.h <br>
<br>
        index 9ae9abc6eb43..c2e54b18c167 100644 <br>
<br>
        --- a/drivers/gpu/drm/amd/amdkfd/kfd_priv.h <br>
<br>
        +++ b/drivers/gpu/drm/amd/amdkfd/kfd_priv.h <br>
<br>
        @@ -868,6 +868,18 @@ struct svm_range_list { <br>
<br>
                  struct task_struct              *faulting_task; <br>
<br>
                  /* check point ts decides if page fault recovery need be dropped */
<br>
<br>
                  uint64_t                        checkpoint_ts[MAX_GPU_INSTANCE];
<br>
<br>
        + <br>
<br>
        +       /* Indicates the default size to use in migrating <br>
<br>
        +        * buffers of a process from Sysmem to VRAM and vice <br>
<br>
        +        * versa. The max legal value cannot be greater than <br>
<br>
        +        * 0x3F <br>
<br>
        +        * <br>
<br>
        +        * @note: A side effect of this symbol being part of <br>
<br>
        +        * struct svm_range_list is that it forces all buffers <br>
<br>
        +        * of the process of unregistered kind to use the same <br>
<br>
        +        * size in buffer migration <br>
<br>
        +        */ <br>
<br>
        +       uint8_t attr_gobm; <br>
<br>
           }; <br>
<br>
           /* Process data */ <br>
<br>
        diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_svm.c <br>
<br>
        b/drivers/gpu/drm/amd/amdkfd/kfd_svm.c <br>
<br>
        index b44dec90969f..78c78baddb1f 100644 <br>
<br>
        --- a/drivers/gpu/drm/amd/amdkfd/kfd_svm.c <br>
<br>
        +++ b/drivers/gpu/drm/amd/amdkfd/kfd_svm.c <br>
<br>
        @@ -309,12 +309,11 @@ static void svm_range_free(struct svm_range *prange, bool do_unmap)
<br>
<br>
           } <br>
<br>
           static void <br>
<br>
        -svm_range_set_default_attributes(int32_t *location, int32_t *prefetch_loc,
<br>
<br>
        -                                uint8_t *granularity, uint32_t *flags) <br>
<br>
        +svm_range_set_default_attributes(int32_t *location, <br>
<br>
        +                       int32_t *prefetch_loc, uint32_t *flags) <br>
<br>
           { <br>
<br>
                  *location = KFD_IOCTL_SVM_LOCATION_UNDEFINED; <br>
<br>
                  *prefetch_loc = KFD_IOCTL_SVM_LOCATION_UNDEFINED; <br>
<br>
        -       *granularity = 9; <br>
<br>
                  *flags = <br>
<br>
                          KFD_IOCTL_SVM_FLAG_HOST_ACCESS | KFD_IOCTL_SVM_FLAG_COHERENT;
<br>
<br>
           } <br>
<br>
        @@ -358,9 +357,9 @@ svm_range *svm_range_new(struct svm_range_list *svms, uint64_t start,
<br>
<br>
                          bitmap_copy(prange->bitmap_access, svms->bitmap_supported,
<br>
<br>
                                      MAX_GPU_INSTANCE); <br>
<br>
        +       prange->granularity = svms->attr_gobm; <br>
<br>
                  svm_range_set_default_attributes(&prange->preferred_loc, <br>
<br>
        -                                        &prange->prefetch_loc, <br>
<br>
        -                                        &prange->granularity, &prange->flags);
<br>
<br>
        +                               &prange->prefetch_loc, <br>
<br>
        + &prange->flags); <br>
<br>
                  pr_debug("svms 0x%p [0x%llx 0x%llx]\n", svms, start, last); <br>
<br>
        @@ -2693,10 +2692,12 @@ svm_range_get_range_boundaries(struct <br>
<br>
        kfd_process *p, int64_t addr, <br>
<br>
                  *is_heap_stack = vma_is_initial_heap(vma) || <br>
<br>
        vma_is_initial_stack(vma); <br>
<br>
        +       /* Determine the starting and ending page of prange */ <br>
<br>
                  start_limit = max(vma->vm_start >> PAGE_SHIFT, <br>
<br>
        -                     (unsigned long)ALIGN_DOWN(addr, 2UL << 8)); <br>
<br>
        +                     (unsigned long)ALIGN_DOWN(addr, 1 << <br>
<br>
        + p->svms.attr_gobm)); <br>
<br>
                  end_limit = min(vma->vm_end >> PAGE_SHIFT, <br>
<br>
        -                   (unsigned long)ALIGN(addr + 1, 2UL << 8)); <br>
<br>
        +                   (unsigned long)ALIGN(addr + 1, 1 << <br>
<br>
        + p->svms.attr_gobm)); <br>
<br>
        + <br>
<br>
                  /* First range that starts after the fault address */ <br>
<br>
                  node = interval_tree_iter_first(&p->svms.objects, addr + 1, ULONG_MAX);
<br>
<br>
                  if (node) { <br>
<br>
        @@ -3240,6 +3241,12 @@ int svm_range_list_init(struct kfd_process *p) <br>
<br>
                          if (KFD_IS_SVM_API_SUPPORTED(p->pdds[i]->dev->adev)) <br>
<br>
                                  bitmap_set(svms->bitmap_supported, i, 1); <br>
<br>
        +       /* Bind granularity of buffer migration, either <br>
<br>
        +        * the default size or one specified by the user <br>
<br>
        +        */ <br>
<br>
        +       svms->attr_gobm = min_t(u8, amdgpu_svm_attr_gobm, 0x3F); <br>
<br>
        +       pr_debug("Granularity Of Buffer Migration: %d\n", <br>
<br>
        + svms->attr_gobm); <br>
<br>
        + <br>
<br>
                  return 0; <br>
<br>
           } <br>
<br>
        @@ -3767,8 +3774,9 @@ svm_range_get_attr(struct kfd_process *p, struct mm_struct *mm,
<br>
<br>
                  node = interval_tree_iter_first(&svms->objects, start, last); <br>
<br>
                  if (!node) { <br>
<br>
                          pr_debug("range attrs not found return default values\n");
<br>
<br>
        -               svm_range_set_default_attributes(&location, &prefetch_loc,
<br>
<br>
        -                                                &granularity, &flags_and);
<br>
<br>
        +               granularity = svms->attr_gobm; <br>
<br>
        +               svm_range_set_default_attributes(&location, <br>
<br>
        +                                       &prefetch_loc, &flags_and); <br>
<br>
                          flags_or = flags_and; <br>
<br>
                          if (p->xnack_enabled) <br>
<br>
                                  bitmap_copy(bitmap_access, <br>
<br>
        svms->bitmap_supported, <br>
<br>
        -- <br>
<br>
        2.34.1 <o:p></o:p></p>
</blockquote>
</blockquote>
</blockquote>
</div>
</body>
</html>