[Intel-xe] [PATCH v2 07/30] drm/xe: Move GGTT from GT to tile
Lucas De Marchi
lucas.demarchi at intel.com
Thu May 25 23:29:35 UTC 2023
On Fri, May 19, 2023 at 04:18:04PM -0700, Matt Roper wrote:
>The GGTT exists at the tile level. When a tile contains multiple GTs,
>they share the same GGTT.
>
>Signed-off-by: Matt Roper <matthew.d.roper at intel.com>
>---
> drivers/gpu/drm/xe/xe_bo.c | 6 ++--
> drivers/gpu/drm/xe/xe_bo_evict.c | 8 +++--
> drivers/gpu/drm/xe/xe_device_types.h | 8 +++++
> drivers/gpu/drm/xe/xe_ggtt.c | 30 ++++++++--------
> drivers/gpu/drm/xe/xe_ggtt.h | 6 ++--
> drivers/gpu/drm/xe/xe_ggtt_types.h | 2 +-
> drivers/gpu/drm/xe/xe_gt.c | 10 +-----
> drivers/gpu/drm/xe/xe_gt_debugfs.c | 2 +-
> drivers/gpu/drm/xe/xe_gt_types.h | 3 --
> drivers/gpu/drm/xe/xe_tile.c | 52 ++++++++++++++++++++++++++++
> drivers/gpu/drm/xe/xe_tile.h | 14 ++++++++
> 11 files changed, 104 insertions(+), 37 deletions(-)
> create mode 100644 drivers/gpu/drm/xe/xe_tile.c
> create mode 100644 drivers/gpu/drm/xe/xe_tile.h
>
>diff --git a/drivers/gpu/drm/xe/xe_bo.c b/drivers/gpu/drm/xe/xe_bo.c
>index c82e995df779..ecc82fefdf4c 100644
>--- a/drivers/gpu/drm/xe/xe_bo.c
>+++ b/drivers/gpu/drm/xe/xe_bo.c
>@@ -958,7 +958,7 @@ static void xe_ttm_bo_destroy(struct ttm_buffer_object *ttm_bo)
> WARN_ON(!list_empty(&bo->vmas));
>
> if (bo->ggtt_node.size)
>- xe_ggtt_remove_bo(bo->gt->mem.ggtt, bo);
>+ xe_ggtt_remove_bo(gt_to_tile(bo->gt)->mem.ggtt, bo);
>
> if (bo->vm && xe_bo_is_user(bo))
> xe_vm_put(bo->vm);
>@@ -1235,10 +1235,10 @@ xe_bo_create_locked_range(struct xe_device *xe,
> XE_BUG_ON(!gt);
>
> if (flags & XE_BO_FIXED_PLACEMENT_BIT) {
>- err = xe_ggtt_insert_bo_at(gt->mem.ggtt, bo,
>+ err = xe_ggtt_insert_bo_at(gt_to_tile(gt)->mem.ggtt, bo,
> start + bo->size, U64_MAX);
> } else {
>- err = xe_ggtt_insert_bo(gt->mem.ggtt, bo);
>+ err = xe_ggtt_insert_bo(gt_to_tile(gt)->mem.ggtt, bo);
> }
> if (err)
> goto err_unlock_put_bo;
>diff --git a/drivers/gpu/drm/xe/xe_bo_evict.c b/drivers/gpu/drm/xe/xe_bo_evict.c
>index 6642c5f52009..a72963c54bf3 100644
>--- a/drivers/gpu/drm/xe/xe_bo_evict.c
>+++ b/drivers/gpu/drm/xe/xe_bo_evict.c
>@@ -149,9 +149,11 @@ int xe_bo_restore_kernel(struct xe_device *xe)
> }
>
> if (bo->flags & XE_BO_CREATE_GGTT_BIT) {
>- mutex_lock(&bo->gt->mem.ggtt->lock);
>- xe_ggtt_map_bo(bo->gt->mem.ggtt, bo);
>- mutex_unlock(&bo->gt->mem.ggtt->lock);
>+ struct xe_tile *tile = gt_to_tile(bo->gt);
>+
>+ mutex_lock(&tile->mem.ggtt->lock);
>+ xe_ggtt_map_bo(tile->mem.ggtt, bo);
>+ mutex_unlock(&tile->mem.ggtt->lock);
> }
>
> /*
>diff --git a/drivers/gpu/drm/xe/xe_device_types.h b/drivers/gpu/drm/xe/xe_device_types.h
>index ea7143c04db9..cb4d0c2ea184 100644
>--- a/drivers/gpu/drm/xe/xe_device_types.h
>+++ b/drivers/gpu/drm/xe/xe_device_types.h
>@@ -54,6 +54,8 @@
> const struct xe_tile *: (const struct xe_device *)((tile__)->xe), \
> struct xe_tile *: (tile__)->xe)
>
>+struct xe_ggtt;
I think all fwd declarations should be at the top.
>+
> /**
> * struct xe_tile - hardware tile structure
> *
>@@ -97,6 +99,12 @@ struct xe_tile {
> /** @regs: pointer to tile's MMIO space (starting with registers) */
> void *regs;
> } mmio;
>+
>+ /** @mem: memory management info for tile */
>+ struct {
>+ /** @ggtt: Global graphics translation table */
>+ struct xe_ggtt *ggtt;
>+ } mem;
> };
>
> /**
>diff --git a/drivers/gpu/drm/xe/xe_ggtt.c b/drivers/gpu/drm/xe/xe_ggtt.c
>index 200976da3dc1..52d293d61cc0 100644
>--- a/drivers/gpu/drm/xe/xe_ggtt.c
>+++ b/drivers/gpu/drm/xe/xe_ggtt.c
>@@ -90,24 +90,19 @@ static void ggtt_fini_noalloc(struct drm_device *drm, void *arg)
> xe_bo_unpin_map_no_vm(ggtt->scratch);
> }
>
>-int xe_ggtt_init_noalloc(struct xe_gt *gt, struct xe_ggtt *ggtt)
>+int xe_ggtt_init_noalloc(struct xe_ggtt *ggtt)
> {
>- struct xe_device *xe = gt_to_xe(gt);
>- struct xe_tile *tile = gt_to_tile(gt);
>+ struct xe_device *xe = tile_to_xe(ggtt->tile);
> struct pci_dev *pdev = to_pci_dev(xe->drm.dev);
> unsigned int gsm_size;
>
>- XE_BUG_ON(xe_gt_is_media_type(gt));
>-
>- ggtt->gt = gt;
>-
> gsm_size = probe_gsm_size(pdev);
> if (gsm_size == 0) {
> drm_err(&xe->drm, "Hardware reported no preallocated GSM\n");
> return -ENOMEM;
> }
>
>- ggtt->gsm = tile->mmio.regs + SZ_8M;
>+ ggtt->gsm = ggtt->tile->mmio.regs + SZ_8M;
> ggtt->size = (gsm_size / 8) * (u64) XE_PAGE_SIZE;
>
> if (IS_DGFX(xe) && xe->info.vram_flags & XE_VRAM_FLAGS_NEED64K)
>@@ -147,13 +142,14 @@ static void xe_ggtt_initial_clear(struct xe_ggtt *ggtt)
> drm_mm_for_each_hole(hole, &ggtt->mm, start, end)
> xe_ggtt_clear(ggtt, start, end - start);
>
>- xe_ggtt_invalidate(ggtt->gt);
>+ xe_ggtt_invalidate(ggtt);
> mutex_unlock(&ggtt->lock);
> }
>
>-int xe_ggtt_init(struct xe_gt *gt, struct xe_ggtt *ggtt)
>+int xe_ggtt_init(struct xe_ggtt *ggtt)
> {
>- struct xe_device *xe = gt_to_xe(gt);
>+ struct xe_device *xe = tile_to_xe(ggtt->tile);
>+ struct xe_gt *gt = &ggtt->tile->primary_gt;
> unsigned int flags;
> int err;
>
>@@ -193,8 +189,14 @@ int xe_ggtt_init(struct xe_gt *gt, struct xe_ggtt *ggtt)
> #define PVC_GUC_TLB_INV_DESC1 XE_REG(0xcf80)
> #define PVC_GUC_TLB_INV_DESC1_INVALIDATE REG_BIT(6)
>
>-void xe_ggtt_invalidate(struct xe_gt *gt)
>+void xe_ggtt_invalidate(struct xe_ggtt *ggtt)
> {
>+ /*
>+ * TODO: Loop over each GT in tile once media GT support is
>+ * re-added
>+ */
>+ struct xe_gt *gt = &ggtt->tile->primary_gt;
>+
> /* TODO: vfunc for GuC vs. non-GuC */
>
> if (gt->uc.guc.submission_state.enabled) {
>@@ -267,7 +269,7 @@ void xe_ggtt_map_bo(struct xe_ggtt *ggtt, struct xe_bo *bo)
> xe_ggtt_set_pte(ggtt, start + offset, pte);
> }
>
>- xe_ggtt_invalidate(ggtt->gt);
>+ xe_ggtt_invalidate(ggtt);
> }
>
> static int __xe_ggtt_insert_bo_at(struct xe_ggtt *ggtt, struct xe_bo *bo,
>@@ -318,7 +320,7 @@ void xe_ggtt_remove_node(struct xe_ggtt *ggtt, struct drm_mm_node *node)
> drm_mm_remove_node(node);
> node->size = 0;
>
>- xe_ggtt_invalidate(ggtt->gt);
>+ xe_ggtt_invalidate(ggtt);
>
> mutex_unlock(&ggtt->lock);
> }
>diff --git a/drivers/gpu/drm/xe/xe_ggtt.h b/drivers/gpu/drm/xe/xe_ggtt.h
>index 333947100504..205a6d058bbd 100644
>--- a/drivers/gpu/drm/xe/xe_ggtt.h
>+++ b/drivers/gpu/drm/xe/xe_ggtt.h
>@@ -12,9 +12,9 @@ struct drm_printer;
>
> u64 xe_ggtt_pte_encode(struct xe_bo *bo, u64 bo_offset);
> void xe_ggtt_set_pte(struct xe_ggtt *ggtt, u64 addr, u64 pte);
>-void xe_ggtt_invalidate(struct xe_gt *gt);
>-int xe_ggtt_init_noalloc(struct xe_gt *gt, struct xe_ggtt *ggtt);
>-int xe_ggtt_init(struct xe_gt *gt, struct xe_ggtt *ggtt);
>+void xe_ggtt_invalidate(struct xe_ggtt *ggtt);
>+int xe_ggtt_init_noalloc(struct xe_ggtt *ggtt);
>+int xe_ggtt_init(struct xe_ggtt *ggtt);
> void xe_ggtt_printk(struct xe_ggtt *ggtt, const char *prefix);
>
> int xe_ggtt_insert_special_node(struct xe_ggtt *ggtt, struct drm_mm_node *node,
>diff --git a/drivers/gpu/drm/xe/xe_ggtt_types.h b/drivers/gpu/drm/xe/xe_ggtt_types.h
>index ea70aaef4b31..d34b3e733945 100644
>--- a/drivers/gpu/drm/xe/xe_ggtt_types.h
>+++ b/drivers/gpu/drm/xe/xe_ggtt_types.h
>@@ -12,7 +12,7 @@ struct xe_bo;
> struct xe_gt;
>
> struct xe_ggtt {
>- struct xe_gt *gt;
>+ struct xe_tile *tile;
>
> u64 size;
>
>diff --git a/drivers/gpu/drm/xe/xe_gt.c b/drivers/gpu/drm/xe/xe_gt.c
>index 80d42c7c7cfa..1c58a9aff2cb 100644
>--- a/drivers/gpu/drm/xe/xe_gt.c
>+++ b/drivers/gpu/drm/xe/xe_gt.c
>@@ -67,11 +67,6 @@ int xe_gt_alloc(struct xe_device *xe, struct xe_gt *gt)
> XE_BUG_ON(gt->info.type == XE_GT_TYPE_UNINITIALIZED);
>
> if (!xe_gt_is_media_type(gt)) {
>- gt->mem.ggtt = drmm_kzalloc(drm, sizeof(*gt->mem.ggtt),
>- GFP_KERNEL);
>- if (!gt->mem.ggtt)
>- return -ENOMEM;
>-
> gt->mem.vram_mgr = drmm_kzalloc(drm, sizeof(*gt->mem.vram_mgr),
> GFP_KERNEL);
> if (!gt->mem.vram_mgr)
>@@ -80,7 +75,6 @@ int xe_gt_alloc(struct xe_device *xe, struct xe_gt *gt)
> } else {
> struct xe_gt *full_gt = xe_find_full_gt(gt);
>
>- gt->mem.ggtt = full_gt->mem.ggtt;
> gt->mem.vram_mgr = full_gt->mem.vram_mgr;
> }
>
>@@ -348,8 +342,6 @@ int xe_gt_init_noalloc(struct xe_gt *gt)
> if (err)
> goto err_force_wake;
>
>- err = xe_ggtt_init_noalloc(gt, gt->mem.ggtt);
>-
> err_force_wake:
> err2 = xe_force_wake_put(gt_to_fw(gt), XE_FW_GT);
> XE_WARN_ON(err2);
>@@ -370,7 +362,7 @@ static int gt_fw_domain_init(struct xe_gt *gt)
> xe_pat_init(gt);
>
> if (!xe_gt_is_media_type(gt)) {
>- err = xe_ggtt_init(gt, gt->mem.ggtt);
>+ err = xe_ggtt_init(gt_to_tile(gt)->mem.ggtt);
> if (err)
> goto err_force_wake;
> }
>diff --git a/drivers/gpu/drm/xe/xe_gt_debugfs.c b/drivers/gpu/drm/xe/xe_gt_debugfs.c
>index 8bf441e850a0..a0f633109124 100644
>--- a/drivers/gpu/drm/xe/xe_gt_debugfs.c
>+++ b/drivers/gpu/drm/xe/xe_gt_debugfs.c
>@@ -97,7 +97,7 @@ static int ggtt(struct seq_file *m, void *data)
> struct xe_gt *gt = node_to_gt(m->private);
> struct drm_printer p = drm_seq_file_printer(m);
>
>- return xe_ggtt_dump(gt->mem.ggtt, &p);
>+ return xe_ggtt_dump(gt_to_tile(gt)->mem.ggtt, &p);
> }
>
> static int register_save_restore(struct seq_file *m, void *data)
>diff --git a/drivers/gpu/drm/xe/xe_gt_types.h b/drivers/gpu/drm/xe/xe_gt_types.h
>index 6f4243443d04..e910ec1b8dd3 100644
>--- a/drivers/gpu/drm/xe/xe_gt_types.h
>+++ b/drivers/gpu/drm/xe/xe_gt_types.h
>@@ -14,7 +14,6 @@
> #include "xe_uc_types.h"
>
> struct xe_engine_ops;
>-struct xe_ggtt;
> struct xe_migrate;
> struct xe_ring_ops;
> struct xe_ttm_gtt_mgr;
>@@ -174,8 +173,6 @@ struct xe_gt {
> } vram;
> /** @vram_mgr: VRAM TTM manager */
> struct xe_ttm_vram_mgr *vram_mgr;
>- /** @ggtt: Global graphics translation table */
>- struct xe_ggtt *ggtt;
> } mem;
>
> /** @reset: state for GT resets */
>diff --git a/drivers/gpu/drm/xe/xe_tile.c b/drivers/gpu/drm/xe/xe_tile.c
>new file mode 100644
>index 000000000000..7ef594f301ca
>--- /dev/null
>+++ b/drivers/gpu/drm/xe/xe_tile.c
>@@ -0,0 +1,52 @@
>+// SPDX-License-Identifier: MIT
>+/*
>+ * Copyright © 2023 Intel Corporation
>+ */
>+
>+#include <drm/drm_managed.h>
>+
>+#include "xe_device.h"
>+#include "xe_ggtt.h"
>+#include "xe_tile.h"
>+#include "xe_ttm_vram_mgr.h"
>+
>+/**
>+ * xe_tile_alloc - Perform per-tile memory allocation
>+ * @tile: Tile to perform allocations for
>+ *
>+ * Allocates various per-tile data structures using DRM-managed allocations.
>+ * Does not touch the hardware.
>+ *
>+ * Returns -ENOMEM if allocations fail, otherwise 0.
>+ */
>+int xe_tile_alloc(struct xe_tile *tile)
>+{
>+ struct drm_device *drm = &tile_to_xe(tile)->drm;
>+
>+ tile->mem.ggtt = drmm_kzalloc(drm, sizeof(*tile->mem.ggtt),
>+ GFP_KERNEL);
>+ if (!tile->mem.ggtt)
>+ return -ENOMEM;
>+ tile->mem.ggtt->tile = tile;
>+
>+ return 0;
>+}
>+
>+/**
>+ * xe_tile_init_noalloc - Init tile up to the point where allocations can happen.
>+ * @tile: The tile to initialize.
>+ *
>+ * This function prepares the tile to allow memory allocations to VRAM, but is
>+ * not allowed to allocate memory itself. This state is useful for display
>+ * readout, because the inherited display framebuffer will otherwise be
>+ * overwritten as it is usually put at the start of VRAM.
>+ *
>+ * Note that since this is tile initialization, it should not perform any
>+ * GT-specific operations, and thus does not need to hold GT forcewake.
>+ *
>+ * Returns: 0 on success, negative error code on error.
>+ */
>+int xe_tile_init_noalloc(struct xe_tile *tile)
>+{
>+ return xe_ggtt_init_noalloc(tile->mem.ggtt);
>+}
>diff --git a/drivers/gpu/drm/xe/xe_tile.h b/drivers/gpu/drm/xe/xe_tile.h
>new file mode 100644
>index 000000000000..49b64d83ce91
>--- /dev/null
>+++ b/drivers/gpu/drm/xe/xe_tile.h
>@@ -0,0 +1,14 @@
>+/* SPDX-License-Identifier: MIT */
>+/*
>+ * Copyright © 2023 Intel Corporation
>+ */
>+
>+#ifndef __XE_TILE_H__
>+#define __XE_TILE_H__
we use 1 _ only
jus cosmetic issues, otherwise LGTM
Reviewed-by: Lucas De Marchi <lucas.demarchi at intel.com>
Lucas De Marchi
>+
>+struct xe_tile;
>+
>+int xe_tile_alloc(struct xe_tile *tile);
>+int xe_tile_init_noalloc(struct xe_tile *tile);
>+
>+#endif
>--
>2.40.0
>
More information about the Intel-xe
mailing list