[Intel-xe] [PATCH v2 07/30] drm/xe: Move GGTT from GT to tile

Lucas De Marchi lucas.demarchi at intel.com
Thu May 25 23:29:35 UTC 2023


On Fri, May 19, 2023 at 04:18:04PM -0700, Matt Roper wrote:
>The GGTT exists at the tile level.  When a tile contains multiple GTs,
>they share the same GGTT.
>
>Signed-off-by: Matt Roper <matthew.d.roper at intel.com>
>---
> drivers/gpu/drm/xe/xe_bo.c           |  6 ++--
> drivers/gpu/drm/xe/xe_bo_evict.c     |  8 +++--
> drivers/gpu/drm/xe/xe_device_types.h |  8 +++++
> drivers/gpu/drm/xe/xe_ggtt.c         | 30 ++++++++--------
> drivers/gpu/drm/xe/xe_ggtt.h         |  6 ++--
> drivers/gpu/drm/xe/xe_ggtt_types.h   |  2 +-
> drivers/gpu/drm/xe/xe_gt.c           | 10 +-----
> drivers/gpu/drm/xe/xe_gt_debugfs.c   |  2 +-
> drivers/gpu/drm/xe/xe_gt_types.h     |  3 --
> drivers/gpu/drm/xe/xe_tile.c         | 52 ++++++++++++++++++++++++++++
> drivers/gpu/drm/xe/xe_tile.h         | 14 ++++++++
> 11 files changed, 104 insertions(+), 37 deletions(-)
> create mode 100644 drivers/gpu/drm/xe/xe_tile.c
> create mode 100644 drivers/gpu/drm/xe/xe_tile.h
>
>diff --git a/drivers/gpu/drm/xe/xe_bo.c b/drivers/gpu/drm/xe/xe_bo.c
>index c82e995df779..ecc82fefdf4c 100644
>--- a/drivers/gpu/drm/xe/xe_bo.c
>+++ b/drivers/gpu/drm/xe/xe_bo.c
>@@ -958,7 +958,7 @@ static void xe_ttm_bo_destroy(struct ttm_buffer_object *ttm_bo)
> 	WARN_ON(!list_empty(&bo->vmas));
>
> 	if (bo->ggtt_node.size)
>-		xe_ggtt_remove_bo(bo->gt->mem.ggtt, bo);
>+		xe_ggtt_remove_bo(gt_to_tile(bo->gt)->mem.ggtt, bo);
>
> 	if (bo->vm && xe_bo_is_user(bo))
> 		xe_vm_put(bo->vm);
>@@ -1235,10 +1235,10 @@ xe_bo_create_locked_range(struct xe_device *xe,
> 		XE_BUG_ON(!gt);
>
> 		if (flags & XE_BO_FIXED_PLACEMENT_BIT) {
>-			err = xe_ggtt_insert_bo_at(gt->mem.ggtt, bo,
>+			err = xe_ggtt_insert_bo_at(gt_to_tile(gt)->mem.ggtt, bo,
> 						   start + bo->size, U64_MAX);
> 		} else {
>-			err = xe_ggtt_insert_bo(gt->mem.ggtt, bo);
>+			err = xe_ggtt_insert_bo(gt_to_tile(gt)->mem.ggtt, bo);
> 		}
> 		if (err)
> 			goto err_unlock_put_bo;
>diff --git a/drivers/gpu/drm/xe/xe_bo_evict.c b/drivers/gpu/drm/xe/xe_bo_evict.c
>index 6642c5f52009..a72963c54bf3 100644
>--- a/drivers/gpu/drm/xe/xe_bo_evict.c
>+++ b/drivers/gpu/drm/xe/xe_bo_evict.c
>@@ -149,9 +149,11 @@ int xe_bo_restore_kernel(struct xe_device *xe)
> 		}
>
> 		if (bo->flags & XE_BO_CREATE_GGTT_BIT) {
>-			mutex_lock(&bo->gt->mem.ggtt->lock);
>-			xe_ggtt_map_bo(bo->gt->mem.ggtt, bo);
>-			mutex_unlock(&bo->gt->mem.ggtt->lock);
>+			struct xe_tile *tile = gt_to_tile(bo->gt);
>+
>+			mutex_lock(&tile->mem.ggtt->lock);
>+			xe_ggtt_map_bo(tile->mem.ggtt, bo);
>+			mutex_unlock(&tile->mem.ggtt->lock);
> 		}
>
> 		/*
>diff --git a/drivers/gpu/drm/xe/xe_device_types.h b/drivers/gpu/drm/xe/xe_device_types.h
>index ea7143c04db9..cb4d0c2ea184 100644
>--- a/drivers/gpu/drm/xe/xe_device_types.h
>+++ b/drivers/gpu/drm/xe/xe_device_types.h
>@@ -54,6 +54,8 @@
> 		 const struct xe_tile *: (const struct xe_device *)((tile__)->xe),	\
> 		 struct xe_tile *: (tile__)->xe)
>
>+struct xe_ggtt;

I think all fwd declarations should be at the top.

>+
> /**
>  * struct xe_tile - hardware tile structure
>  *
>@@ -97,6 +99,12 @@ struct xe_tile {
> 		/** @regs: pointer to tile's MMIO space (starting with registers) */
> 		void *regs;
> 	} mmio;
>+
>+	/** @mem: memory management info for tile */
>+	struct {
>+		/** @ggtt: Global graphics translation table */
>+		struct xe_ggtt *ggtt;
>+	} mem;
> };
>
> /**
>diff --git a/drivers/gpu/drm/xe/xe_ggtt.c b/drivers/gpu/drm/xe/xe_ggtt.c
>index 200976da3dc1..52d293d61cc0 100644
>--- a/drivers/gpu/drm/xe/xe_ggtt.c
>+++ b/drivers/gpu/drm/xe/xe_ggtt.c
>@@ -90,24 +90,19 @@ static void ggtt_fini_noalloc(struct drm_device *drm, void *arg)
> 	xe_bo_unpin_map_no_vm(ggtt->scratch);
> }
>
>-int xe_ggtt_init_noalloc(struct xe_gt *gt, struct xe_ggtt *ggtt)
>+int xe_ggtt_init_noalloc(struct xe_ggtt *ggtt)
> {
>-	struct xe_device *xe = gt_to_xe(gt);
>-	struct xe_tile *tile = gt_to_tile(gt);
>+	struct xe_device *xe = tile_to_xe(ggtt->tile);
> 	struct pci_dev *pdev = to_pci_dev(xe->drm.dev);
> 	unsigned int gsm_size;
>
>-	XE_BUG_ON(xe_gt_is_media_type(gt));
>-
>-	ggtt->gt = gt;
>-
> 	gsm_size = probe_gsm_size(pdev);
> 	if (gsm_size == 0) {
> 		drm_err(&xe->drm, "Hardware reported no preallocated GSM\n");
> 		return -ENOMEM;
> 	}
>
>-	ggtt->gsm = tile->mmio.regs + SZ_8M;
>+	ggtt->gsm = ggtt->tile->mmio.regs + SZ_8M;
> 	ggtt->size = (gsm_size / 8) * (u64) XE_PAGE_SIZE;
>
> 	if (IS_DGFX(xe) && xe->info.vram_flags & XE_VRAM_FLAGS_NEED64K)
>@@ -147,13 +142,14 @@ static void xe_ggtt_initial_clear(struct xe_ggtt *ggtt)
> 	drm_mm_for_each_hole(hole, &ggtt->mm, start, end)
> 		xe_ggtt_clear(ggtt, start, end - start);
>
>-	xe_ggtt_invalidate(ggtt->gt);
>+	xe_ggtt_invalidate(ggtt);
> 	mutex_unlock(&ggtt->lock);
> }
>
>-int xe_ggtt_init(struct xe_gt *gt, struct xe_ggtt *ggtt)
>+int xe_ggtt_init(struct xe_ggtt *ggtt)
> {
>-	struct xe_device *xe = gt_to_xe(gt);
>+	struct xe_device *xe = tile_to_xe(ggtt->tile);
>+	struct xe_gt *gt = &ggtt->tile->primary_gt;
> 	unsigned int flags;
> 	int err;
>
>@@ -193,8 +189,14 @@ int xe_ggtt_init(struct xe_gt *gt, struct xe_ggtt *ggtt)
> #define PVC_GUC_TLB_INV_DESC1			XE_REG(0xcf80)
> #define   PVC_GUC_TLB_INV_DESC1_INVALIDATE	REG_BIT(6)
>
>-void xe_ggtt_invalidate(struct xe_gt *gt)
>+void xe_ggtt_invalidate(struct xe_ggtt *ggtt)
> {
>+	/*
>+	 * TODO: Loop over each GT in tile once media GT support is
>+	 * re-added
>+	 */
>+	struct xe_gt *gt = &ggtt->tile->primary_gt;
>+
> 	/* TODO: vfunc for GuC vs. non-GuC */
>
> 	if (gt->uc.guc.submission_state.enabled) {
>@@ -267,7 +269,7 @@ void xe_ggtt_map_bo(struct xe_ggtt *ggtt, struct xe_bo *bo)
> 		xe_ggtt_set_pte(ggtt, start + offset, pte);
> 	}
>
>-	xe_ggtt_invalidate(ggtt->gt);
>+	xe_ggtt_invalidate(ggtt);
> }
>
> static int __xe_ggtt_insert_bo_at(struct xe_ggtt *ggtt, struct xe_bo *bo,
>@@ -318,7 +320,7 @@ void xe_ggtt_remove_node(struct xe_ggtt *ggtt, struct drm_mm_node *node)
> 	drm_mm_remove_node(node);
> 	node->size = 0;
>
>-	xe_ggtt_invalidate(ggtt->gt);
>+	xe_ggtt_invalidate(ggtt);
>
> 	mutex_unlock(&ggtt->lock);
> }
>diff --git a/drivers/gpu/drm/xe/xe_ggtt.h b/drivers/gpu/drm/xe/xe_ggtt.h
>index 333947100504..205a6d058bbd 100644
>--- a/drivers/gpu/drm/xe/xe_ggtt.h
>+++ b/drivers/gpu/drm/xe/xe_ggtt.h
>@@ -12,9 +12,9 @@ struct drm_printer;
>
> u64 xe_ggtt_pte_encode(struct xe_bo *bo, u64 bo_offset);
> void xe_ggtt_set_pte(struct xe_ggtt *ggtt, u64 addr, u64 pte);
>-void xe_ggtt_invalidate(struct xe_gt *gt);
>-int xe_ggtt_init_noalloc(struct xe_gt *gt, struct xe_ggtt *ggtt);
>-int xe_ggtt_init(struct xe_gt *gt, struct xe_ggtt *ggtt);
>+void xe_ggtt_invalidate(struct xe_ggtt *ggtt);
>+int xe_ggtt_init_noalloc(struct xe_ggtt *ggtt);
>+int xe_ggtt_init(struct xe_ggtt *ggtt);
> void xe_ggtt_printk(struct xe_ggtt *ggtt, const char *prefix);
>
> int xe_ggtt_insert_special_node(struct xe_ggtt *ggtt, struct drm_mm_node *node,
>diff --git a/drivers/gpu/drm/xe/xe_ggtt_types.h b/drivers/gpu/drm/xe/xe_ggtt_types.h
>index ea70aaef4b31..d34b3e733945 100644
>--- a/drivers/gpu/drm/xe/xe_ggtt_types.h
>+++ b/drivers/gpu/drm/xe/xe_ggtt_types.h
>@@ -12,7 +12,7 @@ struct xe_bo;
> struct xe_gt;
>
> struct xe_ggtt {
>-	struct xe_gt *gt;
>+	struct xe_tile *tile;
>
> 	u64 size;
>
>diff --git a/drivers/gpu/drm/xe/xe_gt.c b/drivers/gpu/drm/xe/xe_gt.c
>index 80d42c7c7cfa..1c58a9aff2cb 100644
>--- a/drivers/gpu/drm/xe/xe_gt.c
>+++ b/drivers/gpu/drm/xe/xe_gt.c
>@@ -67,11 +67,6 @@ int xe_gt_alloc(struct xe_device *xe, struct xe_gt *gt)
> 	XE_BUG_ON(gt->info.type == XE_GT_TYPE_UNINITIALIZED);
>
> 	if (!xe_gt_is_media_type(gt)) {
>-		gt->mem.ggtt = drmm_kzalloc(drm, sizeof(*gt->mem.ggtt),
>-					    GFP_KERNEL);
>-		if (!gt->mem.ggtt)
>-			return -ENOMEM;
>-
> 		gt->mem.vram_mgr = drmm_kzalloc(drm, sizeof(*gt->mem.vram_mgr),
> 						GFP_KERNEL);
> 		if (!gt->mem.vram_mgr)
>@@ -80,7 +75,6 @@ int xe_gt_alloc(struct xe_device *xe, struct xe_gt *gt)
> 	} else {
> 		struct xe_gt *full_gt = xe_find_full_gt(gt);
>
>-		gt->mem.ggtt = full_gt->mem.ggtt;
> 		gt->mem.vram_mgr = full_gt->mem.vram_mgr;
> 	}
>
>@@ -348,8 +342,6 @@ int xe_gt_init_noalloc(struct xe_gt *gt)
> 	if (err)
> 		goto err_force_wake;
>
>-	err = xe_ggtt_init_noalloc(gt, gt->mem.ggtt);
>-
> err_force_wake:
> 	err2 = xe_force_wake_put(gt_to_fw(gt), XE_FW_GT);
> 	XE_WARN_ON(err2);
>@@ -370,7 +362,7 @@ static int gt_fw_domain_init(struct xe_gt *gt)
> 	xe_pat_init(gt);
>
> 	if (!xe_gt_is_media_type(gt)) {
>-		err = xe_ggtt_init(gt, gt->mem.ggtt);
>+		err = xe_ggtt_init(gt_to_tile(gt)->mem.ggtt);
> 		if (err)
> 			goto err_force_wake;
> 	}
>diff --git a/drivers/gpu/drm/xe/xe_gt_debugfs.c b/drivers/gpu/drm/xe/xe_gt_debugfs.c
>index 8bf441e850a0..a0f633109124 100644
>--- a/drivers/gpu/drm/xe/xe_gt_debugfs.c
>+++ b/drivers/gpu/drm/xe/xe_gt_debugfs.c
>@@ -97,7 +97,7 @@ static int ggtt(struct seq_file *m, void *data)
> 	struct xe_gt *gt = node_to_gt(m->private);
> 	struct drm_printer p = drm_seq_file_printer(m);
>
>-	return xe_ggtt_dump(gt->mem.ggtt, &p);
>+	return xe_ggtt_dump(gt_to_tile(gt)->mem.ggtt, &p);
> }
>
> static int register_save_restore(struct seq_file *m, void *data)
>diff --git a/drivers/gpu/drm/xe/xe_gt_types.h b/drivers/gpu/drm/xe/xe_gt_types.h
>index 6f4243443d04..e910ec1b8dd3 100644
>--- a/drivers/gpu/drm/xe/xe_gt_types.h
>+++ b/drivers/gpu/drm/xe/xe_gt_types.h
>@@ -14,7 +14,6 @@
> #include "xe_uc_types.h"
>
> struct xe_engine_ops;
>-struct xe_ggtt;
> struct xe_migrate;
> struct xe_ring_ops;
> struct xe_ttm_gtt_mgr;
>@@ -174,8 +173,6 @@ struct xe_gt {
> 		} vram;
> 		/** @vram_mgr: VRAM TTM manager */
> 		struct xe_ttm_vram_mgr *vram_mgr;
>-		/** @ggtt: Global graphics translation table */
>-		struct xe_ggtt *ggtt;
> 	} mem;
>
> 	/** @reset: state for GT resets */
>diff --git a/drivers/gpu/drm/xe/xe_tile.c b/drivers/gpu/drm/xe/xe_tile.c
>new file mode 100644
>index 000000000000..7ef594f301ca
>--- /dev/null
>+++ b/drivers/gpu/drm/xe/xe_tile.c
>@@ -0,0 +1,52 @@
>+// SPDX-License-Identifier: MIT
>+/*
>+ * Copyright © 2023 Intel Corporation
>+ */
>+
>+#include <drm/drm_managed.h>
>+
>+#include "xe_device.h"
>+#include "xe_ggtt.h"
>+#include "xe_tile.h"
>+#include "xe_ttm_vram_mgr.h"
>+
>+/**
>+ * xe_tile_alloc - Perform per-tile memory allocation
>+ * @tile: Tile to perform allocations for
>+ *
>+ * Allocates various per-tile data structures using DRM-managed allocations.
>+ * Does not touch the hardware.
>+ *
>+ * Returns -ENOMEM if allocations fail, otherwise 0.
>+ */
>+int xe_tile_alloc(struct xe_tile *tile)
>+{
>+	struct drm_device *drm = &tile_to_xe(tile)->drm;
>+
>+	tile->mem.ggtt = drmm_kzalloc(drm, sizeof(*tile->mem.ggtt),
>+				      GFP_KERNEL);
>+	if (!tile->mem.ggtt)
>+		return -ENOMEM;
>+	tile->mem.ggtt->tile = tile;
>+
>+	return 0;
>+}
>+
>+/**
>+ * xe_tile_init_noalloc - Init tile up to the point where allocations can happen.
>+ * @tile: The tile to initialize.
>+ *
>+ * This function prepares the tile to allow memory allocations to VRAM, but is
>+ * not allowed to allocate memory itself. This state is useful for display
>+ * readout, because the inherited display framebuffer will otherwise be
>+ * overwritten as it is usually put at the start of VRAM.
>+ *
>+ * Note that since this is tile initialization, it should not perform any
>+ * GT-specific operations, and thus does not need to hold GT forcewake.
>+ *
>+ * Returns: 0 on success, negative error code on error.
>+ */
>+int xe_tile_init_noalloc(struct xe_tile *tile)
>+{
>+	return xe_ggtt_init_noalloc(tile->mem.ggtt);
>+}
>diff --git a/drivers/gpu/drm/xe/xe_tile.h b/drivers/gpu/drm/xe/xe_tile.h
>new file mode 100644
>index 000000000000..49b64d83ce91
>--- /dev/null
>+++ b/drivers/gpu/drm/xe/xe_tile.h
>@@ -0,0 +1,14 @@
>+/* SPDX-License-Identifier: MIT */
>+/*
>+ * Copyright © 2023 Intel Corporation
>+ */
>+
>+#ifndef __XE_TILE_H__
>+#define __XE_TILE_H__

we use 1 _ only

jus cosmetic issues, otherwise LGTM

Reviewed-by: Lucas De Marchi <lucas.demarchi at intel.com>

Lucas De Marchi

>+
>+struct xe_tile;
>+
>+int xe_tile_alloc(struct xe_tile *tile);
>+int xe_tile_init_noalloc(struct xe_tile *tile);
>+
>+#endif
>-- 
>2.40.0
>


More information about the Intel-xe mailing list