<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<style type="text/css" style="display:none;"> P {margin-top:0;margin-bottom:0;} </style>
</head>
<body dir="ltr">
<p style="font-family:Arial;font-size:10pt;color:#0000FF;margin:5pt;" align="Left">
[AMD Official Use Only]<br>
</p>
<br>
<div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
I will experiment to see if it is not needed. Will update patch based on the results.</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<br>
</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
Regards,
<div>Ramesh</div>
</div>
<div id="appendonsend"></div>
<hr style="display:inline-block;width:98%" tabindex="-1">
<div id="divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" style="font-size:11pt" color="#000000"><b>From:</b> Yu, Lang <Lang.Yu@amd.com><br>
<b>Sent:</b> Tuesday, November 9, 2021 12:44 AM<br>
<b>To:</b> Errabolu, Ramesh <Ramesh.Errabolu@amd.com><br>
<b>Cc:</b> amd-gfx@lists.freedesktop.org <amd-gfx@lists.freedesktop.org><br>
<b>Subject:</b> Re: [PATCH] drm/amdgpu: Pin MMIO/DOORBELL BO's in GTT domain</font>
<div> </div>
</div>
<div class="BodyFragment"><font size="2"><span style="font-size:11pt;">
<div class="PlainText">On Tue, Nov 09, 2021 at 02:12:00PM +0800, Errabolu, Ramesh wrote:<br>
> [AMD Official Use Only]<br>
> <br>
> Responses in line<br>
> <br>
> -----Original Message-----<br>
> From: Yu, Lang <Lang.Yu@amd.com> <br>
> Sent: Monday, November 8, 2021 11:27 PM<br>
> To: Errabolu, Ramesh <Ramesh.Errabolu@amd.com><br>
> Cc: amd-gfx@lists.freedesktop.org<br>
> Subject: Re: [PATCH] drm/amdgpu: Pin MMIO/DOORBELL BO's in GTT domain<br>
> <br>
> On Mon, Nov 08, 2021 at 07:37:44PM -0600, Ramesh Errabolu wrote:<br>
> > MMIO/DOORBELL BOs encode control data and should be pinned in GTT <br>
> > domain before enabling PCIe connected peer devices in accessing it<br>
> > <br>
> > Signed-off-by: Ramesh Errabolu <Ramesh.Errabolu@amd.com><br>
> > ---<br>
> >  drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.h    | 25 +++++++++<br>
> >  .../gpu/drm/amd/amdgpu/amdgpu_amdkfd_gpuvm.c  | 55 <br>
> > +++++++++++++++++++<br>
> >  2 files changed, 80 insertions(+)<br>
> > <br>
> > diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.h <br>
> > b/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.h<br>
> > index 4c1d6536a7a5..d9a1cfd7876f 100644<br>
> > --- a/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.h<br>
> > +++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.h<br>
> > @@ -300,6 +300,31 @@ int amdgpu_amdkfd_gpuvm_import_dmabuf(struct amdgpu_device *adev,<br>
> >                                    uint64_t va, void *drm_priv,<br>
> >                                    struct kgd_mem **mem, uint64_t *size,<br>
> >                                    uint64_t *mmap_offset);<br>
> > +<br>
> > +/**<br>
> > + * amdgpu_amdkfd_gpuvm_pin_bo() - Pins a BO using following criteria<br>
> > + * @bo: Handle of buffer object being pinned<br>
> > + * @domain: Domain into which BO should be pinned<br>
> > + *<br>
> > + *   - USERPTR BOs are UNPINNABLE and will return error<br>
> > + *   - All other BO types (GTT, VRAM, MMIO and DOORBELL) will have their<br>
> > + *     PIN count incremented. It is valid to PIN a BO multiple times<br>
> > + *<br>
> > + * Return: ZERO if successful in pinning, Non-Zero in case of error.<br>
> > + * Will return -EINVAL if input BO parameter is a USERPTR type.<br>
> > + */<br>
> > +int amdgpu_amdkfd_gpuvm_pin_bo(struct amdgpu_bo *bo, u32 domain);<br>
> > +<br>
> > +/**<br>
> > + * amdgpu_amdkfd_gpuvm_unpin_bo() - Unpins BO using following <br>
> > +criteria<br>
> > + * @bo: Handle of buffer object being unpinned<br>
> > + *<br>
> > + *   - Is a illegal request for USERPTR BOs and is ignored<br>
> > + *   - All other BO types (GTT, VRAM, MMIO and DOORBELL) will have their<br>
> > + *     PIN count decremented. Calls to UNPIN must balance calls to PIN<br>
> > + */<br>
> > +void amdgpu_amdkfd_gpuvm_unpin_bo(struct amdgpu_bo *bo);<br>
> > +<br>
> >  int amdgpu_amdkfd_get_tile_config(struct amdgpu_device *adev,<br>
> >                              struct tile_config *config);<br>
> >  void amdgpu_amdkfd_ras_poison_consumption_handler(struct <br>
> > amdgpu_device *adev); diff --git <br>
> > a/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gpuvm.c <br>
> > b/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gpuvm.c<br>
> > index 4fa814358552..f4ffc41873dd 100644<br>
> > --- a/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gpuvm.c<br>
> > +++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gpuvm.c<br>
> > @@ -1299,6 +1299,36 @@ static int init_kfd_vm(struct amdgpu_vm *vm, void **process_info,<br>
> >      return ret;<br>
> >  }<br>
> >  <br>
> > +int amdgpu_amdkfd_gpuvm_pin_bo(struct amdgpu_bo *bo, u32 domain) {<br>
> > +   int ret = 0;<br>
> > +<br>
> > +   ret = amdgpu_bo_reserve(bo, false);<br>
> > +   if (unlikely(ret))<br>
> > +           return ret;<br>
> > +<br>
> > +   ret = amdgpu_bo_pin_restricted(bo, domain, 0, 0);<br>
> > +   if (ret)<br>
> > +           pr_err("Error in Pinning BO to domain: %d\n", domain);<br>
> > +<br>
> > +   amdgpu_bo_sync_wait(bo, AMDGPU_FENCE_OWNER_KFD, false);<br>
> > +   amdgpu_bo_unreserve(bo);<br>
> > +<br>
> > +   return ret;<br>
> > +}<br>
> > +<br>
> > +void amdgpu_amdkfd_gpuvm_unpin_bo(struct amdgpu_bo *bo) {<br>
> > +   int ret = 0;<br>
> > +<br>
> > +   ret = amdgpu_bo_reserve(bo, false);<br>
> > +   if (unlikely(ret))<br>
> > +           return;<br>
> > +<br>
> > +   amdgpu_bo_unpin(bo);<br>
> > +   amdgpu_bo_unreserve(bo);<br>
> > +}<br>
> > +<br>
> >  int amdgpu_amdkfd_gpuvm_acquire_process_vm(struct amdgpu_device *adev,<br>
> >                                         struct file *filp, u32 pasid,<br>
> >                                         void **process_info,<br>
> > @@ -1525,6 +1555,23 @@ int amdgpu_amdkfd_gpuvm_alloc_memory_of_gpu(<br>
> >      if (offset)<br>
> >              *offset = amdgpu_bo_mmap_offset(bo);<br>
> >  <br>
> > +   if (flags & (KFD_IOC_ALLOC_MEM_FLAGS_DOORBELL |<br>
> > +                   KFD_IOC_ALLOC_MEM_FLAGS_MMIO_REMAP)) {<br>
> > +           ret = amdgpu_amdkfd_bo_validate(bo, AMDGPU_GEM_DOMAIN_GTT, false);<br>
> > +           if (ret) {<br>
> > +                   pr_err("Validating MMIO/DOORBELL BO during ALLOC FAILED\n");<br>
> > +                   goto err_node_allow;<br>
> > +           }<br>
> <br>
> amdgpu_amdkfd_gpuvm_pin_bo() will do ttm_bo_validate(),<br>
> amdgpu_amdkfd_bo_validate() seems redundant here.<br>
> <br>
> Ramesh: In my experiments I recall seeing an issue if BO was not validated in GTT domain prior to pinning. If my memory serves me correctly, the call to PIN will fail<br>
<br>
>From amdgpu_bo_pin_restricted() we can see, pin operation will<br>
<br>
If not pinned, <br>
1, validate the BO with requested domain<br>
2, increase pin count and update stats<br>
<br>
If already pinned,<br>
1, increase pin count<br>
<br>
So seems not necessarily to validate it twice.<br>
<br>
Regards,<br>
Lang<br>
 <br>
> > +<br>
> > +           ret = amdgpu_amdkfd_gpuvm_pin_bo(bo, AMDGPU_GEM_DOMAIN_GTT);<br>
> > +           if (ret) {<br>
> > +                   pr_err("Pinning MMIO/DOORBELL BO during ALLOC FAILED\n");<br>
> > +                   goto err_node_allow;<br>
> > +           }<br>
> > +           bo->allowed_domains = AMDGPU_GEM_DOMAIN_GTT;<br>
> > +           bo->preferred_domains = AMDGPU_GEM_DOMAIN_GTT;<br>
> > +   }<br>
> > +<br>
> >      return 0;<br>
> >  <br>
> >  allocate_init_user_pages_failed:<br>
> > @@ -1561,6 +1608,14 @@ int amdgpu_amdkfd_gpuvm_free_memory_of_gpu(<br>
> >      bool is_imported = false;<br>
> >  <br>
> >      mutex_lock(&mem->lock);<br>
> > +<br>
> > +   /* Unpin MMIO/DOORBELL BO's that were pinnned during allocation */<br>
> > +   if (mem->alloc_flags &<br>
> > +       (KFD_IOC_ALLOC_MEM_FLAGS_DOORBELL |<br>
> > +        KFD_IOC_ALLOC_MEM_FLAGS_MMIO_REMAP)) {<br>
> > +           amdgpu_amdkfd_gpuvm_unpin_bo(mem->bo);<br>
> > +   }<br>
> > +<br>
> >      mapped_to_gpu_memory = mem->mapped_to_gpu_memory;<br>
> >      is_imported = mem->is_imported;<br>
> >      mutex_unlock(&mem->lock);<br>
> > --<br>
> > 2.31.1<br>
> > <br>
</div>
</span></font></div>
</div>
</body>
</html>