<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<style type="text/css" style="display:none;"> P {margin-top:0;margin-bottom:0;} </style>
</head>
<body dir="ltr">
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
Hi Felix,</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<br>
</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
The <span style="color: rgb(32, 31, 30); font-family: "Segoe UI", "Segoe UI Web (West European)", "Segoe UI", -apple-system, BlinkMacSystemFont, Roboto, "Helvetica Neue", sans-serif; font-size: 14.6667px; background-color: rgb(255, 255, 255); display: inline !important">PAGE_SHIFT
 was not deleted but merged into the <span style="font-family: "Segoe UI", "Segoe UI Web (West European)", "Segoe UI", -apple-system, BlinkMacSystemFont, Roboto, "Helvetica Neue", sans-serif; background-color: rgb(255, 255, 255); display: inline !important">KFD_*_SHIFT
 in kfd_priv.h. Because of that, this change is actually transparent to the thunk, and it only straightens up the bit shift operations in most cases.</span></span></div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<span style="color: rgb(32, 31, 30); font-family: "Segoe UI", "Segoe UI Web (West European)", "Segoe UI", -apple-system, BlinkMacSystemFont, Roboto, "Helvetica Neue", sans-serif; font-size: 14.6667px; background-color: rgb(255, 255, 255); display: inline !important"><span style="font-family: "Segoe UI", "Segoe UI Web (West European)", "Segoe UI", -apple-system, BlinkMacSystemFont, Roboto, "Helvetica Neue", sans-serif; background-color: rgb(255, 255, 255); display: inline !important"><br>
</span></span></div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<span style="color: rgb(32, 31, 30); font-family: "Segoe UI", "Segoe UI Web (West European)", "Segoe UI", -apple-system, BlinkMacSystemFont, Roboto, "Helvetica Neue", sans-serif; font-size: 14.6667px; background-color: rgb(255, 255, 255); display: inline !important"><span style="font-family: "Segoe UI", "Segoe UI Web (West European)", "Segoe UI", -apple-system, BlinkMacSystemFont, Roboto, "Helvetica Neue", sans-serif; background-color: rgb(255, 255, 255); display: inline !important">Regards,</span></span></div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<span style="color: rgb(32, 31, 30); font-family: "Segoe UI", "Segoe UI Web (West European)", "Segoe UI", -apple-system, BlinkMacSystemFont, Roboto, "Helvetica Neue", sans-serif; font-size: 14.6667px; background-color: rgb(255, 255, 255); display: inline !important"><span style="font-family: "Segoe UI", "Segoe UI Web (West European)", "Segoe UI", -apple-system, BlinkMacSystemFont, Roboto, "Helvetica Neue", sans-serif; background-color: rgb(255, 255, 255); display: inline !important">Yong</span></span></div>
<div id="appendonsend"></div>
<hr style="display:inline-block;width:98%" tabindex="-1">
<div id="divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" style="font-size:11pt" color="#000000"><b>From:</b> Kuehling, Felix <Felix.Kuehling@amd.com><br>
<b>Sent:</b> Friday, November 1, 2019 5:13 PM<br>
<b>To:</b> amd-gfx@lists.freedesktop.org <amd-gfx@lists.freedesktop.org>; Zhao, Yong <Yong.Zhao@amd.com><br>
<b>Subject:</b> Re: [PATCH] drm/amdkfd: Simplify the mmap offset related bit operations</font>
<div> </div>
</div>
<div class="BodyFragment"><font size="2"><span style="font-size:11pt;">
<div class="PlainText">NAK. This won't work for several reasons.<br>
<br>
The mmap_offset is used as offset parameter in the mmap system call. If <br>
you check the man page of mmap, you'll see that "offset must be a <br>
multiple of the page size". Therefore the PAGE_SHIFT is necessary.<br>
<br>
In the case of doorbell offsets, the offset is parsed and processed by <br>
the Thunk in user mode. On GFX9 GPUs the lower bits are used for the <br>
offset of the doorbell within the doorbell page. On GFX8 the queue ID <br>
was used, but on GFX9 we had to decoupled the doorbell ID from the queue <br>
ID. If you remove the PAGE_SHIFT, you'll need to put those bits <br>
somewhere else. But that change in the encoding would break the ABI with <br>
the Thunk.<br>
<br>
Regards,<br>
   Felix<br>
<br>
On 2019-11-01 4:48 p.m., Zhao, Yong wrote:<br>
> The new code is much cleaner and results in better readability.<br>
><br>
> Change-Id: I0c1f7cca7e24ddb7b4ffe1cb0fa71943828ae373<br>
> Signed-off-by: Yong Zhao <Yong.Zhao@amd.com><br>
> ---<br>
>   drivers/gpu/drm/amd/amdkfd/kfd_chardev.c | 13 +++++++------<br>
>   drivers/gpu/drm/amd/amdkfd/kfd_events.c  |  1 -<br>
>   drivers/gpu/drm/amd/amdkfd/kfd_priv.h    |  9 +++------<br>
>   drivers/gpu/drm/amd/amdkfd/kfd_process.c |  3 +--<br>
>   4 files changed, 11 insertions(+), 15 deletions(-)<br>
><br>
> diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_chardev.c b/drivers/gpu/drm/amd/amdkfd/kfd_chardev.c<br>
> index b91993753b82..590138727ca9 100644<br>
> --- a/drivers/gpu/drm/amd/amdkfd/kfd_chardev.c<br>
> +++ b/drivers/gpu/drm/amd/amdkfd/kfd_chardev.c<br>
> @@ -298,7 +298,6 @@ static int kfd_ioctl_create_queue(struct file *filep, struct kfd_process *p,<br>
>        /* Return gpu_id as doorbell offset for mmap usage */<br>
>        args->doorbell_offset = KFD_MMAP_TYPE_DOORBELL;<br>
>        args->doorbell_offset |= KFD_MMAP_GPU_ID(args->gpu_id);<br>
> -     args->doorbell_offset <<= PAGE_SHIFT;<br>
>        if (KFD_IS_SOC15(dev->device_info->asic_family))<br>
>                /* On SOC15 ASICs, include the doorbell offset within the<br>
>                 * process doorbell frame, which could be 1 page or 2 pages.<br>
> @@ -1938,20 +1937,22 @@ static int kfd_mmap(struct file *filp, struct vm_area_struct *vma)<br>
>   {<br>
>        struct kfd_process *process;<br>
>        struct kfd_dev *dev = NULL;<br>
> -     unsigned long vm_pgoff;<br>
> +     unsigned long mmap_offset;<br>
>        unsigned int gpu_id;<br>
>   <br>
>        process = kfd_get_process(current);<br>
>        if (IS_ERR(process))<br>
>                return PTR_ERR(process);<br>
>   <br>
> -     vm_pgoff = vma->vm_pgoff;<br>
> -     vma->vm_pgoff = KFD_MMAP_OFFSET_VALUE_GET(vm_pgoff);<br>
> -     gpu_id = KFD_MMAP_GPU_ID_GET(vm_pgoff);<br>
> +     mmap_offset = vma->vm_pgoff << PAGE_SHIFT;<br>
> +     gpu_id = KFD_MMAP_GET_GPU_ID(mmap_offset);<br>
>        if (gpu_id)<br>
>                dev = kfd_device_by_id(gpu_id);<br>
>   <br>
> -     switch (vm_pgoff & KFD_MMAP_TYPE_MASK) {<br>
> +     /* only leave the offset segment */<br>
> +     vma->vm_pgoff &= (1ULL << (KFD_MMAP_GPU_ID_SHIFT - PAGE_SHIFT)) - 1;<br>
> +<br>
> +     switch (mmap_offset & KFD_MMAP_TYPE_MASK) {<br>
>        case KFD_MMAP_TYPE_DOORBELL:<br>
>                if (!dev)<br>
>                        return -ENODEV;<br>
> diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_events.c b/drivers/gpu/drm/amd/amdkfd/kfd_events.c<br>
> index 908081c85de1..1f8365575b12 100644<br>
> --- a/drivers/gpu/drm/amd/amdkfd/kfd_events.c<br>
> +++ b/drivers/gpu/drm/amd/amdkfd/kfd_events.c<br>
> @@ -346,7 +346,6 @@ int kfd_event_create(struct file *devkfd, struct kfd_process *p,<br>
>                ret = create_signal_event(devkfd, p, ev);<br>
>                if (!ret) {<br>
>                        *event_page_offset = KFD_MMAP_TYPE_EVENTS;<br>
> -                     *event_page_offset <<= PAGE_SHIFT;<br>
>                        *event_slot_index = ev->event_id;<br>
>                }<br>
>                break;<br>
> diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_priv.h b/drivers/gpu/drm/amd/amdkfd/kfd_priv.h<br>
> index 66bae8f2dad1..8eecd2cd1fd2 100644<br>
> --- a/drivers/gpu/drm/amd/amdkfd/kfd_priv.h<br>
> +++ b/drivers/gpu/drm/amd/amdkfd/kfd_priv.h<br>
> @@ -59,24 +59,21 @@<br>
>    * NOTE: struct vm_area_struct.vm_pgoff uses offset in pages. Hence, these<br>
>    *  defines are w.r.t to PAGE_SIZE<br>
>    */<br>
> -#define KFD_MMAP_TYPE_SHIFT  (62 - PAGE_SHIFT)<br>
> +#define KFD_MMAP_TYPE_SHIFT  (62)<br>
>   #define KFD_MMAP_TYPE_MASK  (0x3ULL << KFD_MMAP_TYPE_SHIFT)<br>
>   #define KFD_MMAP_TYPE_DOORBELL      (0x3ULL << KFD_MMAP_TYPE_SHIFT)<br>
>   #define KFD_MMAP_TYPE_EVENTS        (0x2ULL << KFD_MMAP_TYPE_SHIFT)<br>
>   #define KFD_MMAP_TYPE_RESERVED_MEM  (0x1ULL << KFD_MMAP_TYPE_SHIFT)<br>
>   #define KFD_MMAP_TYPE_MMIO  (0x0ULL << KFD_MMAP_TYPE_SHIFT)<br>
>   <br>
> -#define KFD_MMAP_GPU_ID_SHIFT (46 - PAGE_SHIFT)<br>
> +#define KFD_MMAP_GPU_ID_SHIFT (46)<br>
>   #define KFD_MMAP_GPU_ID_MASK (((1ULL << KFD_GPU_ID_HASH_WIDTH) - 1) \<br>
>                                << KFD_MMAP_GPU_ID_SHIFT)<br>
>   #define KFD_MMAP_GPU_ID(gpu_id) ((((uint64_t)gpu_id) << KFD_MMAP_GPU_ID_SHIFT)\<br>
>                                & KFD_MMAP_GPU_ID_MASK)<br>
> -#define KFD_MMAP_GPU_ID_GET(offset)    ((offset & KFD_MMAP_GPU_ID_MASK) \<br>
> +#define KFD_MMAP_GET_GPU_ID(offset)    ((offset & KFD_MMAP_GPU_ID_MASK) \<br>
>                                >> KFD_MMAP_GPU_ID_SHIFT)<br>
>   <br>
> -#define KFD_MMAP_OFFSET_VALUE_MASK   (0x3FFFFFFFFFFFULL >> PAGE_SHIFT)<br>
> -#define KFD_MMAP_OFFSET_VALUE_GET(offset) (offset & KFD_MMAP_OFFSET_VALUE_MASK)<br>
> -<br>
>   /*<br>
>    * When working with cp scheduler we should assign the HIQ manually or via<br>
>    * the amdgpu driver to a fixed hqd slot, here are the fixed HIQ hqd slot<br>
> diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_process.c b/drivers/gpu/drm/amd/amdkfd/kfd_process.c<br>
> index 6abfb77ae540..39dc49b8fd85 100644<br>
> --- a/drivers/gpu/drm/amd/amdkfd/kfd_process.c<br>
> +++ b/drivers/gpu/drm/amd/amdkfd/kfd_process.c<br>
> @@ -554,8 +554,7 @@ static int kfd_process_init_cwsr_apu(struct kfd_process *p, struct file *filep)<br>
>                if (!dev->cwsr_enabled || qpd->cwsr_kaddr || qpd->cwsr_base)<br>
>                        continue;<br>
>   <br>
> -             offset = (KFD_MMAP_TYPE_RESERVED_MEM | KFD_MMAP_GPU_ID(dev->id))<br>
> -                     << PAGE_SHIFT;<br>
> +             offset = KFD_MMAP_TYPE_RESERVED_MEM | KFD_MMAP_GPU_ID(dev->id);<br>
>                qpd->tba_addr = (int64_t)vm_mmap(filep, 0,<br>
>                        KFD_CWSR_TBA_TMA_SIZE, PROT_READ | PROT_EXEC,<br>
>                        MAP_SHARED, offset);<br>
</div>
</span></font></div>
</body>
</html>