[PATCH 10/44] drm/amdgpu/vcn: move more instanced data to vcn_instance

Wed Feb 5 03:06:43 UTC 2025

On 2025-01-31 11:57, Alex Deucher wrote:
> Move more per instance data into the per instance structure.
>
> v2: index instances directly on vcn1.0 and 2.0 to make
> it clear that they only support a single instance (Lijo)
>
> Signed-off-by: Alex Deucher <alexander.deucher at amd.com>
> ---
>   drivers/gpu/drm/amd/amdgpu/amdgpu_kms.c |   2 +-
>   drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.c | 196 ++++++++++++------------
>   drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.h |  17 +-
>   drivers/gpu/drm/amd/amdgpu/jpeg_v1_0.c  |   4 +-
>   drivers/gpu/drm/amd/amdgpu/vcn_v1_0.c   |  42 ++---
>   drivers/gpu/drm/amd/amdgpu/vcn_v2_0.c   |  92 +++++------
>   drivers/gpu/drm/amd/amdgpu/vcn_v2_5.c   |  51 +++---
>   drivers/gpu/drm/amd/amdgpu/vcn_v3_0.c   |  67 ++++----
>   drivers/gpu/drm/amd/amdgpu/vcn_v4_0.c   |  19 ++-
>   drivers/gpu/drm/amd/amdgpu/vcn_v4_0_3.c |  14 +-
>   drivers/gpu/drm/amd/amdgpu/vcn_v4_0_5.c |  18 ++-
>   drivers/gpu/drm/amd/amdgpu/vcn_v5_0_0.c |  16 +-
>   drivers/gpu/drm/amd/amdgpu/vcn_v5_0_1.c |   8 +-
>   13 files changed, 279 insertions(+), 267 deletions(-)
>
> diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_kms.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_kms.c
> index 2c76bc5e25d92..5ee2ae66ed36b 100644
> --- a/drivers/gpu/drm/amd/amdgpu/amdgpu_kms.c
> +++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_kms.c
> @@ -480,7 +480,7 @@ static int amdgpu_hw_ip_info(struct amdgpu_device *adev,
>   			if (adev->vcn.harvest_config & (1 << i))
>   				continue;
>   
> -			for (j = 0; j < adev->vcn.num_enc_rings; j++)
> +			for (j = 0; j < adev->vcn.inst[i].num_enc_rings; j++)
>   				if (adev->vcn.inst[i].ring_enc[j].sched.ready)
>   					++num_rings;
>   		}
> diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.c
> index 0c3081a198d9e..9901b8e17f305 100644
> --- a/drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.c
> +++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.c
> @@ -127,93 +127,88 @@ int amdgpu_vcn_sw_init(struct amdgpu_device *adev)
>   	unsigned int fw_shared_size, log_offset;
>   	int i, r;
>   
> -	mutex_init(&adev->vcn.vcn1_jpeg1_workaround);
>   	for (i = 0; i < adev->vcn.num_vcn_inst; i++) {
> +		mutex_init(&adev->vcn.inst[i].vcn1_jpeg1_workaround);
>   		mutex_init(&adev->vcn.inst[i].vcn_pg_lock);
>   		atomic_set(&adev->vcn.inst[i].total_submission_cnt, 0);
>   		INIT_DELAYED_WORK(&adev->vcn.inst[i].idle_work, amdgpu_vcn_idle_work_handler);
>   		atomic_set(&adev->vcn.inst[i].dpg_enc_submission_cnt, 0);
> -	}
> -
> -	if ((adev->firmware.load_type == AMDGPU_FW_LOAD_PSP) &&
> -	    (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG))
> -		adev->vcn.indirect_sram = true;
> -
> -	/*
> -	 * Some Steam Deck's BIOS versions are incompatible with the
> -	 * indirect SRAM mode, leading to amdgpu being unable to get
> -	 * properly probed (and even potentially crashing the kernel).
> -	 * Hence, check for these versions here - notice this is
> -	 * restricted to Vangogh (Deck's APU).
> -	 */
> -	if (amdgpu_ip_version(adev, UVD_HWIP, 0) == IP_VERSION(3, 0, 2)) {
> -		const char *bios_ver = dmi_get_system_info(DMI_BIOS_VERSION);
> -
> -		if (bios_ver && (!strncmp("F7A0113", bios_ver, 7) ||
> -		     !strncmp("F7A0114", bios_ver, 7))) {
> -			adev->vcn.indirect_sram = false;
> -			dev_info(adev->dev,
> -				"Steam Deck quirk: indirect SRAM disabled on BIOS %s\n", bios_ver);
> +		if ((adev->firmware.load_type == AMDGPU_FW_LOAD_PSP) &&
> +		    (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG))
> +			adev->vcn.inst[i].indirect_sram = true;
> +
> +		/*
> +		 * Some Steam Deck's BIOS versions are incompatible with the
> +		 * indirect SRAM mode, leading to amdgpu being unable to get
> +		 * properly probed (and even potentially crashing the kernel).
> +		 * Hence, check for these versions here - notice this is
> +		 * restricted to Vangogh (Deck's APU).
> +		 */
> +		if (amdgpu_ip_version(adev, UVD_HWIP, 0) == IP_VERSION(3, 0, 2)) {
> +			const char *bios_ver = dmi_get_system_info(DMI_BIOS_VERSION);
> +
> +			if (bios_ver && (!strncmp("F7A0113", bios_ver, 7) ||
> +					 !strncmp("F7A0114", bios_ver, 7))) {
> +				adev->vcn.inst[i].indirect_sram = false;
> +				dev_info(adev->dev,
> +					 "Steam Deck quirk: indirect SRAM disabled on BIOS %s\n", bios_ver);
> +			}
>   		}
> -	}
>   
> -	/* from vcn4 and above, only unified queue is used */
> -	adev->vcn.using_unified_queue =
> -		amdgpu_ip_version(adev, UVD_HWIP, 0) >= IP_VERSION(4, 0, 0);
> -
> -	hdr = (const struct common_firmware_header *)adev->vcn.inst[0].fw->data;
> -	adev->vcn.fw_version = le32_to_cpu(hdr->ucode_version);
> -
> -	/* Bit 20-23, it is encode major and non-zero for new naming convention.
> -	 * This field is part of version minor and DRM_DISABLED_FLAG in old naming
> -	 * convention. Since the l:wq!atest version minor is 0x5B and DRM_DISABLED_FLAG
> -	 * is zero in old naming convention, this field is always zero so far.
> -	 * These four bits are used to tell which naming convention is present.
> -	 */
> -	fw_check = (le32_to_cpu(hdr->ucode_version) >> 20) & 0xf;
> -	if (fw_check) {
> -		unsigned int dec_ver, enc_major, enc_minor, vep, fw_rev;
> -
> -		fw_rev = le32_to_cpu(hdr->ucode_version) & 0xfff;
> -		enc_minor = (le32_to_cpu(hdr->ucode_version) >> 12) & 0xff;
> -		enc_major = fw_check;
> -		dec_ver = (le32_to_cpu(hdr->ucode_version) >> 24) & 0xf;
> -		vep = (le32_to_cpu(hdr->ucode_version) >> 28) & 0xf;
> -		DRM_INFO("Found VCN firmware Version ENC: %u.%u DEC: %u VEP: %u Revision: %u\n",
> -			enc_major, enc_minor, dec_ver, vep, fw_rev);
> -	} else {
> -		unsigned int version_major, version_minor, family_id;
> +		/* from vcn4 and above, only unified queue is used */
> +		adev->vcn.inst[i].using_unified_queue =
> +			amdgpu_ip_version(adev, UVD_HWIP, 0) >= IP_VERSION(4, 0, 0);
> +
> +		hdr = (const struct common_firmware_header *)adev->vcn.inst[i].fw->data;
> +		adev->vcn.inst[i].fw_version = le32_to_cpu(hdr->ucode_version);
> +		adev->vcn.fw_version = le32_to_cpu(hdr->ucode_version);
> +
> +		/* Bit 20-23, it is encode major and non-zero for new naming convention.
> +		 * This field is part of version minor and DRM_DISABLED_FLAG in old naming
> +		 * convention. Since the l:wq!atest version minor is 0x5B and DRM_DISABLED_FLAG
> +		 * is zero in old naming convention, this field is always zero so far.
> +		 * These four bits are used to tell which naming convention is present.
> +		 */
> +		fw_check = (le32_to_cpu(hdr->ucode_version) >> 20) & 0xf;
> +		if (fw_check) {
> +			unsigned int dec_ver, enc_major, enc_minor, vep, fw_rev;
> +
> +			fw_rev = le32_to_cpu(hdr->ucode_version) & 0xfff;
> +			enc_minor = (le32_to_cpu(hdr->ucode_version) >> 12) & 0xff;
> +			enc_major = fw_check;
> +			dec_ver = (le32_to_cpu(hdr->ucode_version) >> 24) & 0xf;
> +			vep = (le32_to_cpu(hdr->ucode_version) >> 28) & 0xf;
> +			DRM_INFO("Found VCN firmware Version ENC: %u.%u DEC: %u VEP: %u Revision: %u\n",
> +				 enc_major, enc_minor, dec_ver, vep, fw_rev);
> +		} else {
> +			unsigned int version_major, version_minor, family_id;
>   
> -		family_id = le32_to_cpu(hdr->ucode_version) & 0xff;
> -		version_major = (le32_to_cpu(hdr->ucode_version) >> 24) & 0xff;
> -		version_minor = (le32_to_cpu(hdr->ucode_version) >> 8) & 0xff;
> -		DRM_INFO("Found VCN firmware Version: %u.%u Family ID: %u\n",
> -			version_major, version_minor, family_id);
> -	}
> +			family_id = le32_to_cpu(hdr->ucode_version) & 0xff;
> +			version_major = (le32_to_cpu(hdr->ucode_version) >> 24) & 0xff;
> +			version_minor = (le32_to_cpu(hdr->ucode_version) >> 8) & 0xff;
> +			DRM_INFO("Found VCN firmware Version: %u.%u Family ID: %u\n",
> +				 version_major, version_minor, family_id);
> +		}
>   
> -	bo_size = AMDGPU_VCN_STACK_SIZE + AMDGPU_VCN_CONTEXT_SIZE;
> -	if (adev->firmware.load_type != AMDGPU_FW_LOAD_PSP)
> -		bo_size += AMDGPU_GPU_PAGE_ALIGN(le32_to_cpu(hdr->ucode_size_bytes) + 8);
> +		bo_size = AMDGPU_VCN_STACK_SIZE + AMDGPU_VCN_CONTEXT_SIZE;
> +		if (adev->firmware.load_type != AMDGPU_FW_LOAD_PSP)
> +			bo_size += AMDGPU_GPU_PAGE_ALIGN(le32_to_cpu(hdr->ucode_size_bytes) + 8);
>   
> -	if (amdgpu_ip_version(adev, UVD_HWIP, 0) >= IP_VERSION(5, 0, 0)) {
> -		fw_shared_size = AMDGPU_GPU_PAGE_ALIGN(sizeof(struct amdgpu_vcn5_fw_shared));
> -		log_offset = offsetof(struct amdgpu_vcn5_fw_shared, fw_log);
> -	} else if (amdgpu_ip_version(adev, UVD_HWIP, 0) >= IP_VERSION(4, 0, 0)) {
> -		fw_shared_size = AMDGPU_GPU_PAGE_ALIGN(sizeof(struct amdgpu_vcn4_fw_shared));
> -		log_offset = offsetof(struct amdgpu_vcn4_fw_shared, fw_log);
> -	} else {
> -		fw_shared_size = AMDGPU_GPU_PAGE_ALIGN(sizeof(struct amdgpu_fw_shared));
> -		log_offset = offsetof(struct amdgpu_fw_shared, fw_log);
> -	}
> -
> -	bo_size += fw_shared_size;
> +		if (amdgpu_ip_version(adev, UVD_HWIP, 0) >= IP_VERSION(5, 0, 0)) {
> +			fw_shared_size = AMDGPU_GPU_PAGE_ALIGN(sizeof(struct amdgpu_vcn5_fw_shared));
> +			log_offset = offsetof(struct amdgpu_vcn5_fw_shared, fw_log);
> +		} else if (amdgpu_ip_version(adev, UVD_HWIP, 0) >= IP_VERSION(4, 0, 0)) {
> +			fw_shared_size = AMDGPU_GPU_PAGE_ALIGN(sizeof(struct amdgpu_vcn4_fw_shared));
> +			log_offset = offsetof(struct amdgpu_vcn4_fw_shared, fw_log);
> +		} else {
> +			fw_shared_size = AMDGPU_GPU_PAGE_ALIGN(sizeof(struct amdgpu_fw_shared));
> +			log_offset = offsetof(struct amdgpu_fw_shared, fw_log);
> +		}
>   
> -	if (amdgpu_vcnfw_log)
> -		bo_size += AMDGPU_VCNFW_LOG_SIZE;
> +		bo_size += fw_shared_size;
>   
> -	for (i = 0; i < adev->vcn.num_vcn_inst; i++) {
> -		if (adev->vcn.harvest_config & (1 << i))
> -			continue;
> +		if (amdgpu_vcnfw_log)
> +			bo_size += AMDGPU_VCNFW_LOG_SIZE;
>   
>   		r = amdgpu_bo_create_kernel(adev, bo_size, PAGE_SIZE,
>   					    AMDGPU_GEM_DOMAIN_VRAM |
> @@ -239,7 +234,7 @@ int amdgpu_vcn_sw_init(struct amdgpu_device *adev)
>   			adev->vcn.inst[i].fw_shared.log_offset = log_offset;
>   		}
>   
> -		if (adev->vcn.indirect_sram) {
> +		if (adev->vcn.inst[i].indirect_sram) {
>   			r = amdgpu_bo_create_kernel(adev, 64 * 2 * 4, PAGE_SIZE,
>   					AMDGPU_GEM_DOMAIN_VRAM |
>   					AMDGPU_GEM_DOMAIN_GTT,
> @@ -277,15 +272,14 @@ int amdgpu_vcn_sw_fini(struct amdgpu_device *adev)
>   
>   		amdgpu_ring_fini(&adev->vcn.inst[j].ring_dec);
>   
> -		for (i = 0; i < adev->vcn.num_enc_rings; ++i)
> +		for (i = 0; i < adev->vcn.inst[j].num_enc_rings; ++i)
>   			amdgpu_ring_fini(&adev->vcn.inst[j].ring_enc[i]);
>   
>   		amdgpu_ucode_release(&adev->vcn.inst[j].fw);
>   		mutex_destroy(&adev->vcn.inst[j].vcn_pg_lock);
> +		mutex_destroy(&adev->vcn.inst[j].vcn1_jpeg1_workaround);
>   	}
>   
> -	mutex_destroy(&adev->vcn.vcn1_jpeg1_workaround);
> -
>   	return 0;
>   }
>   
> @@ -404,12 +398,12 @@ static void amdgpu_vcn_idle_work_handler(struct work_struct *work)
>   	if (adev->vcn.harvest_config & (1 << i))
>   		return;
>   
> -	for (j = 0; j < adev->vcn.num_enc_rings; ++j)
> +	for (j = 0; j < adev->vcn.inst[i].num_enc_rings; ++j)
>   		fence[i] += amdgpu_fence_count_emitted(&vcn_inst->ring_enc[j]);
>   
>   	/* Only set DPG pause for VCN3 or below, VCN4 and above will be handled by FW */
>   	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG &&
> -	    !adev->vcn.using_unified_queue) {
> +	    !adev->vcn.inst[i].using_unified_queue) {
>   		struct dpg_pause_state new_state;
>   
>   		if (fence[i] ||
> @@ -418,7 +412,7 @@ static void amdgpu_vcn_idle_work_handler(struct work_struct *work)
>   		else
>   			new_state.fw_based = VCN_DPG_STATE__UNPAUSE;
>   
> -		adev->vcn.pause_dpg_mode(adev, i, &new_state);
> +		adev->vcn.inst[i].pause_dpg_mode(adev, i, &new_state);
>   	}
>   
>   	fence[i] += amdgpu_fence_count_emitted(&vcn_inst->ring_dec);
> @@ -456,7 +450,7 @@ void amdgpu_vcn_ring_begin_use(struct amdgpu_ring *ring)
>   
>   	/* Only set DPG pause for VCN3 or below, VCN4 and above will be handled by FW */
>   	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG &&
> -	    !adev->vcn.using_unified_queue) {
> +	    !adev->vcn.inst[ring->me].using_unified_queue) {
>   		struct dpg_pause_state new_state;
>   
>   		if (ring->funcs->type == AMDGPU_RING_TYPE_VCN_ENC) {
> @@ -466,7 +460,7 @@ void amdgpu_vcn_ring_begin_use(struct amdgpu_ring *ring)
>   			unsigned int fences = 0;
>   			unsigned int i;
>   
> -			for (i = 0; i < adev->vcn.num_enc_rings; ++i)
> +			for (i = 0; i < adev->vcn.inst[ring->me].num_enc_rings; ++i)
>   				fences += amdgpu_fence_count_emitted(&adev->vcn.inst[ring->me].ring_enc[i]);
>   
>   			if (fences || atomic_read(&adev->vcn.inst[ring->me].dpg_enc_submission_cnt))
> @@ -475,7 +469,7 @@ void amdgpu_vcn_ring_begin_use(struct amdgpu_ring *ring)
>   				new_state.fw_based = VCN_DPG_STATE__UNPAUSE;
>   		}
>   
> -		adev->vcn.pause_dpg_mode(adev, ring->me, &new_state);
> +		adev->vcn.inst[ring->me].pause_dpg_mode(adev, ring->me, &new_state);
>   	}
>   	mutex_unlock(&adev->vcn.inst[ring->me].vcn_pg_lock);
>   }
> @@ -487,7 +481,7 @@ void amdgpu_vcn_ring_end_use(struct amdgpu_ring *ring)
>   	/* Only set DPG pause for VCN3 or below, VCN4 and above will be handled by FW */
>   	if (ring->adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG &&
>   	    ring->funcs->type == AMDGPU_RING_TYPE_VCN_ENC &&
> -	    !adev->vcn.using_unified_queue)
> +	    !adev->vcn.inst[ring->me].using_unified_queue)
>   		atomic_dec(&ring->adev->vcn.inst[ring->me].dpg_enc_submission_cnt);
>   
>   	atomic_dec(&ring->adev->vcn.inst[ring->me].total_submission_cnt);
> @@ -511,7 +505,7 @@ int amdgpu_vcn_dec_ring_test_ring(struct amdgpu_ring *ring)
>   	r = amdgpu_ring_alloc(ring, 3);
>   	if (r)
>   		return r;
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.scratch9, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.scratch9, 0));
>   	amdgpu_ring_write(ring, 0xDEADBEEF);
>   	amdgpu_ring_commit(ring);
>   	for (i = 0; i < adev->usec_timeout; i++) {
> @@ -576,14 +570,14 @@ static int amdgpu_vcn_dec_send_msg(struct amdgpu_ring *ring,
>   		goto err;
>   
>   	ib = &job->ibs[0];
> -	ib->ptr[0] = PACKET0(adev->vcn.internal.data0, 0);
> +	ib->ptr[0] = PACKET0(adev->vcn.inst[ring->me].internal.data0, 0);
>   	ib->ptr[1] = addr;
> -	ib->ptr[2] = PACKET0(adev->vcn.internal.data1, 0);
> +	ib->ptr[2] = PACKET0(adev->vcn.inst[ring->me].internal.data1, 0);
>   	ib->ptr[3] = addr >> 32;
> -	ib->ptr[4] = PACKET0(adev->vcn.internal.cmd, 0);
> +	ib->ptr[4] = PACKET0(adev->vcn.inst[ring->me].internal.cmd, 0);
>   	ib->ptr[5] = 0;
>   	for (i = 6; i < 16; i += 2) {
> -		ib->ptr[i] = PACKET0(adev->vcn.internal.nop, 0);
> +		ib->ptr[i] = PACKET0(adev->vcn.inst[ring->me].internal.nop, 0);
>   		ib->ptr[i+1] = 0;
>   	}
>   	ib->length_dw = 16;
> @@ -746,7 +740,7 @@ static int amdgpu_vcn_dec_sw_send_msg(struct amdgpu_ring *ring,
>   	uint32_t ib_pack_in_dw;
>   	int i, r;
>   
> -	if (adev->vcn.using_unified_queue)
> +	if (adev->vcn.inst[ring->me].using_unified_queue)
>   		ib_size_dw += 8;
>   
>   	r = amdgpu_job_alloc_with_ib(ring->adev, NULL, NULL,
> @@ -759,7 +753,7 @@ static int amdgpu_vcn_dec_sw_send_msg(struct amdgpu_ring *ring,
>   	ib->length_dw = 0;
>   
>   	/* single queue headers */
> -	if (adev->vcn.using_unified_queue) {
> +	if (adev->vcn.inst[ring->me].using_unified_queue) {
>   		ib_pack_in_dw = sizeof(struct amdgpu_vcn_decode_buffer) / sizeof(uint32_t)
>   						+ 4 + 2; /* engine info + decoding ib in dw */
>   		ib_checksum = amdgpu_vcn_unified_ring_ib_header(ib, ib_pack_in_dw, false);
> @@ -778,7 +772,7 @@ static int amdgpu_vcn_dec_sw_send_msg(struct amdgpu_ring *ring,
>   	for (i = ib->length_dw; i < ib_size_dw; ++i)
>   		ib->ptr[i] = 0x0;
>   
> -	if (adev->vcn.using_unified_queue)
> +	if (adev->vcn.inst[ring->me].using_unified_queue)
>   		amdgpu_vcn_unified_ring_ib_checksum(&ib_checksum, ib_pack_in_dw);
>   
>   	r = amdgpu_job_submit_direct(job, ring, &f);
> @@ -876,7 +870,7 @@ static int amdgpu_vcn_enc_get_create_msg(struct amdgpu_ring *ring, uint32_t hand
>   	uint64_t addr;
>   	int i, r;
>   
> -	if (adev->vcn.using_unified_queue)
> +	if (adev->vcn.inst[ring->me].using_unified_queue)
>   		ib_size_dw += 8;
>   
>   	r = amdgpu_job_alloc_with_ib(ring->adev, NULL, NULL,
> @@ -890,7 +884,7 @@ static int amdgpu_vcn_enc_get_create_msg(struct amdgpu_ring *ring, uint32_t hand
>   
>   	ib->length_dw = 0;
>   
> -	if (adev->vcn.using_unified_queue)
> +	if (adev->vcn.inst[ring->me].using_unified_queue)
>   		ib_checksum = amdgpu_vcn_unified_ring_ib_header(ib, 0x11, true);
>   
>   	ib->ptr[ib->length_dw++] = 0x00000018;
> @@ -912,7 +906,7 @@ static int amdgpu_vcn_enc_get_create_msg(struct amdgpu_ring *ring, uint32_t hand
>   	for (i = ib->length_dw; i < ib_size_dw; ++i)
>   		ib->ptr[i] = 0x0;
>   
> -	if (adev->vcn.using_unified_queue)
> +	if (adev->vcn.inst[ring->me].using_unified_queue)
>   		amdgpu_vcn_unified_ring_ib_checksum(&ib_checksum, 0x11);
>   
>   	r = amdgpu_job_submit_direct(job, ring, &f);
> @@ -943,7 +937,7 @@ static int amdgpu_vcn_enc_get_destroy_msg(struct amdgpu_ring *ring, uint32_t han
>   	uint64_t addr;
>   	int i, r;
>   
> -	if (adev->vcn.using_unified_queue)
> +	if (adev->vcn.inst[ring->me].using_unified_queue)
>   		ib_size_dw += 8;
>   
>   	r = amdgpu_job_alloc_with_ib(ring->adev, NULL, NULL,
> @@ -957,7 +951,7 @@ static int amdgpu_vcn_enc_get_destroy_msg(struct amdgpu_ring *ring, uint32_t han
>   
>   	ib->length_dw = 0;
>   
> -	if (adev->vcn.using_unified_queue)
> +	if (adev->vcn.inst[ring->me].using_unified_queue)
>   		ib_checksum = amdgpu_vcn_unified_ring_ib_header(ib, 0x11, true);
>   
>   	ib->ptr[ib->length_dw++] = 0x00000018;
> @@ -979,7 +973,7 @@ static int amdgpu_vcn_enc_get_destroy_msg(struct amdgpu_ring *ring, uint32_t han
>   	for (i = ib->length_dw; i < ib_size_dw; ++i)
>   		ib->ptr[i] = 0x0;
>   
> -	if (adev->vcn.using_unified_queue)
> +	if (adev->vcn.inst[ring->me].using_unified_queue)
>   		amdgpu_vcn_unified_ring_ib_checksum(&ib_checksum, 0x11);
>   
>   	r = amdgpu_job_submit_direct(job, ring, &f);
> @@ -1396,7 +1390,7 @@ void amdgpu_debugfs_vcn_sched_mask_init(struct amdgpu_device *adev)
>   	struct dentry *root = minor->debugfs_root;
>   	char name[32];
>   
> -	if (adev->vcn.num_vcn_inst <= 1 || !adev->vcn.using_unified_queue)
> +	if (adev->vcn.num_vcn_inst <= 1 || !adev->vcn.inst[0].using_unified_queue)
>   		return;
>   	sprintf(name, "amdgpu_vcn_sched_mask");
>   	debugfs_create_file(name, 0600, root, adev,
> diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.h b/drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.h
> index 0bcf4d1c7175d..3b059f51894b9 100644
> --- a/drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.h
> +++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_vcn.h
> @@ -322,6 +322,15 @@ struct amdgpu_vcn_inst {
>   	struct mutex		vcn_pg_lock;
>   	enum amd_powergating_state cur_state;
>   	struct delayed_work	idle_work;
> +	unsigned		fw_version;
> +	unsigned		num_enc_rings;
> +	bool			indirect_sram;
> +	struct amdgpu_vcn_reg	 internal;
> +	struct mutex		vcn1_jpeg1_workaround;
> +	int (*pause_dpg_mode)(struct amdgpu_device *adev,
> +			      int inst_idx,
> +			      struct dpg_pause_state *new_state);
> +	bool using_unified_queue;
>   };
>   
>   struct amdgpu_vcn_ras {
> @@ -330,24 +339,16 @@ struct amdgpu_vcn_ras {
>   
>   struct amdgpu_vcn {
>   	unsigned		fw_version;
> -	unsigned		num_enc_rings;
> -	bool			indirect_sram;
> -
>   	uint8_t	num_vcn_inst;
>   	struct amdgpu_vcn_inst	 inst[AMDGPU_MAX_VCN_INSTANCES];
> -	struct amdgpu_vcn_reg	 internal;
> -	struct mutex		vcn1_jpeg1_workaround;
>   
>   	unsigned	harvest_config;
> -	int (*pause_dpg_mode)(struct amdgpu_device *adev,
> -		int inst_idx, struct dpg_pause_state *new_state);
>   
>   	struct ras_common_if    *ras_if;
>   	struct amdgpu_vcn_ras   *ras;
>   
>   	uint16_t inst_mask;
>   	uint8_t	num_inst_per_aid;
> -	bool using_unified_queue;

unified_queue feature is determined by VCN IP version, so the "bool 
using_unified_queue" should be a generic value for all instances. Should 
we still need to separate it for each instance?

Boyuan

>   
>   	/* IP reg dump */
>   	uint32_t		*ip_dump;
> diff --git a/drivers/gpu/drm/amd/amdgpu/jpeg_v1_0.c b/drivers/gpu/drm/amd/amdgpu/jpeg_v1_0.c
> index 8031406e20ff9..9e428e669ada6 100644
> --- a/drivers/gpu/drm/amd/amdgpu/jpeg_v1_0.c
> +++ b/drivers/gpu/drm/amd/amdgpu/jpeg_v1_0.c
> @@ -607,12 +607,12 @@ static void jpeg_v1_0_ring_begin_use(struct amdgpu_ring *ring)
>   	bool	set_clocks = !cancel_delayed_work_sync(&adev->vcn.inst[0].idle_work);
>   	int		cnt = 0;
>   
> -	mutex_lock(&adev->vcn.vcn1_jpeg1_workaround);
> +	mutex_lock(&adev->vcn.inst[0].vcn1_jpeg1_workaround);
>   
>   	if (amdgpu_fence_wait_empty(&adev->vcn.inst->ring_dec))
>   		DRM_ERROR("JPEG dec: vcn dec ring may not be empty\n");
>   
> -	for (cnt = 0; cnt < adev->vcn.num_enc_rings; cnt++) {
> +	for (cnt = 0; cnt < adev->vcn.inst[0].num_enc_rings; cnt++) {
>   		if (amdgpu_fence_wait_empty(&adev->vcn.inst->ring_enc[cnt]))
>   			DRM_ERROR("JPEG dec: vcn enc ring[%d] may not be empty\n", cnt);
>   	}
> diff --git a/drivers/gpu/drm/amd/amdgpu/vcn_v1_0.c b/drivers/gpu/drm/amd/amdgpu/vcn_v1_0.c
> index 757cacf11a817..c870d9ba64c69 100644
> --- a/drivers/gpu/drm/amd/amdgpu/vcn_v1_0.c
> +++ b/drivers/gpu/drm/amd/amdgpu/vcn_v1_0.c
> @@ -105,7 +105,7 @@ static int vcn_v1_0_early_init(struct amdgpu_ip_block *ip_block)
>   {
>   	struct amdgpu_device *adev = ip_block->adev;
>   
> -	adev->vcn.num_enc_rings = 2;
> +	adev->vcn.inst[0].num_enc_rings = 2;
>   
>   	vcn_v1_0_set_dec_ring_funcs(adev);
>   	vcn_v1_0_set_enc_ring_funcs(adev);
> @@ -138,7 +138,7 @@ static int vcn_v1_0_sw_init(struct amdgpu_ip_block *ip_block)
>   		return r;
>   
>   	/* VCN ENC TRAP */
> -	for (i = 0; i < adev->vcn.num_enc_rings; ++i) {
> +	for (i = 0; i < adev->vcn.inst[0].num_enc_rings; ++i) {
>   		r = amdgpu_irq_add_id(adev, SOC15_IH_CLIENTID_VCN, i + VCN_1_0__SRCID__UVD_ENC_GENERAL_PURPOSE,
>   					&adev->vcn.inst->irq);
>   		if (r)
> @@ -166,18 +166,18 @@ static int vcn_v1_0_sw_init(struct amdgpu_ip_block *ip_block)
>   	if (r)
>   		return r;
>   
> -	adev->vcn.internal.scratch9 = adev->vcn.inst->external.scratch9 =
> +	adev->vcn.inst[0].internal.scratch9 = adev->vcn.inst->external.scratch9 =
>   		SOC15_REG_OFFSET(UVD, 0, mmUVD_SCRATCH9);
> -	adev->vcn.internal.data0 = adev->vcn.inst->external.data0 =
> +	adev->vcn.inst[0].internal.data0 = adev->vcn.inst->external.data0 =
>   		SOC15_REG_OFFSET(UVD, 0, mmUVD_GPCOM_VCPU_DATA0);
> -	adev->vcn.internal.data1 = adev->vcn.inst->external.data1 =
> +	adev->vcn.inst[0].internal.data1 = adev->vcn.inst->external.data1 =
>   		SOC15_REG_OFFSET(UVD, 0, mmUVD_GPCOM_VCPU_DATA1);
> -	adev->vcn.internal.cmd = adev->vcn.inst->external.cmd =
> +	adev->vcn.inst[0].internal.cmd = adev->vcn.inst->external.cmd =
>   		SOC15_REG_OFFSET(UVD, 0, mmUVD_GPCOM_VCPU_CMD);
> -	adev->vcn.internal.nop = adev->vcn.inst->external.nop =
> +	adev->vcn.inst[0].internal.nop = adev->vcn.inst->external.nop =
>   		SOC15_REG_OFFSET(UVD, 0, mmUVD_NO_OP);
>   
> -	for (i = 0; i < adev->vcn.num_enc_rings; ++i) {
> +	for (i = 0; i < adev->vcn.inst[0].num_enc_rings; ++i) {
>   		enum amdgpu_ring_priority_level hw_prio = amdgpu_vcn_get_enc_ring_prio(i);
>   
>   		ring = &adev->vcn.inst->ring_enc[i];
> @@ -189,7 +189,7 @@ static int vcn_v1_0_sw_init(struct amdgpu_ip_block *ip_block)
>   			return r;
>   	}
>   
> -	adev->vcn.pause_dpg_mode = vcn_v1_0_pause_dpg_mode;
> +	adev->vcn.inst[0].pause_dpg_mode = vcn_v1_0_pause_dpg_mode;
>   
>   	if (amdgpu_vcnfw_log) {
>   		volatile struct amdgpu_fw_shared *fw_shared = adev->vcn.inst->fw_shared.cpu_addr;
> @@ -253,7 +253,7 @@ static int vcn_v1_0_hw_init(struct amdgpu_ip_block *ip_block)
>   	if (r)
>   		return r;
>   
> -	for (i = 0; i < adev->vcn.num_enc_rings; ++i) {
> +	for (i = 0; i < adev->vcn.inst[0].num_enc_rings; ++i) {
>   		ring = &adev->vcn.inst->ring_enc[i];
>   		r = amdgpu_ring_test_helper(ring);
>   		if (r)
> @@ -1833,7 +1833,7 @@ static void vcn_v1_0_idle_work_handler(struct work_struct *work)
>   	struct amdgpu_device *adev = vcn_inst->adev;
>   	unsigned int fences = 0, i;
>   
> -	for (i = 0; i < adev->vcn.num_enc_rings; ++i)
> +	for (i = 0; i < adev->vcn.inst[0].num_enc_rings; ++i)
>   		fences += amdgpu_fence_count_emitted(&adev->vcn.inst->ring_enc[i]);
>   
>   	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG) {
> @@ -1849,7 +1849,7 @@ static void vcn_v1_0_idle_work_handler(struct work_struct *work)
>   		else
>   			new_state.jpeg = VCN_DPG_STATE__UNPAUSE;
>   
> -		adev->vcn.pause_dpg_mode(adev, 0, &new_state);
> +		adev->vcn.inst[0].pause_dpg_mode(adev, 0, &new_state);
>   	}
>   
>   	fences += amdgpu_fence_count_emitted(adev->jpeg.inst->ring_dec);
> @@ -1872,7 +1872,7 @@ static void vcn_v1_0_ring_begin_use(struct amdgpu_ring *ring)
>   	struct	amdgpu_device *adev = ring->adev;
>   	bool set_clocks = !cancel_delayed_work_sync(&adev->vcn.inst[0].idle_work);
>   
> -	mutex_lock(&adev->vcn.vcn1_jpeg1_workaround);
> +	mutex_lock(&adev->vcn.inst[0].vcn1_jpeg1_workaround);
>   
>   	if (amdgpu_fence_wait_empty(ring->adev->jpeg.inst->ring_dec))
>   		DRM_ERROR("VCN dec: jpeg dec ring may not be empty\n");
> @@ -1898,7 +1898,7 @@ void vcn_v1_0_set_pg_for_begin_use(struct amdgpu_ring *ring, bool set_clocks)
>   		struct dpg_pause_state new_state;
>   		unsigned int fences = 0, i;
>   
> -		for (i = 0; i < adev->vcn.num_enc_rings; ++i)
> +		for (i = 0; i < adev->vcn.inst[0].num_enc_rings; ++i)
>   			fences += amdgpu_fence_count_emitted(&adev->vcn.inst->ring_enc[i]);
>   
>   		if (fences)
> @@ -1916,14 +1916,14 @@ void vcn_v1_0_set_pg_for_begin_use(struct amdgpu_ring *ring, bool set_clocks)
>   		else if (ring->funcs->type == AMDGPU_RING_TYPE_VCN_JPEG)
>   			new_state.jpeg = VCN_DPG_STATE__PAUSE;
>   
> -		adev->vcn.pause_dpg_mode(adev, 0, &new_state);
> +		adev->vcn.inst[0].pause_dpg_mode(adev, 0, &new_state);
>   	}
>   }
>   
>   void vcn_v1_0_ring_end_use(struct amdgpu_ring *ring)
>   {
>   	schedule_delayed_work(&ring->adev->vcn.inst[0].idle_work, VCN_IDLE_TIMEOUT);
> -	mutex_unlock(&ring->adev->vcn.vcn1_jpeg1_workaround);
> +	mutex_unlock(&ring->adev->vcn.inst[0].vcn1_jpeg1_workaround);
>   }
>   
>   static void vcn_v1_0_print_ip_state(struct amdgpu_ip_block *ip_block, struct drm_printer *p)
> @@ -2057,11 +2057,11 @@ static int vcn_v1_0_ring_patch_cs_in_place(struct amdgpu_cs_parser *p,
>   		uint32_t reg = amdgpu_ib_get_value(ib, i);
>   		uint32_t val = amdgpu_ib_get_value(ib, i + 1);
>   
> -		if (reg == PACKET0(p->adev->vcn.internal.data0, 0)) {
> +		if (reg == PACKET0(p->adev->vcn.inst[0].internal.data0, 0)) {
>   			msg_lo = val;
> -		} else if (reg == PACKET0(p->adev->vcn.internal.data1, 0)) {
> +		} else if (reg == PACKET0(p->adev->vcn.inst[0].internal.data1, 0)) {
>   			msg_hi = val;
> -		} else if (reg == PACKET0(p->adev->vcn.internal.cmd, 0)) {
> +		} else if (reg == PACKET0(p->adev->vcn.inst[0].internal.cmd, 0)) {
>   			r = vcn_v1_0_validate_bo(p, job,
>   						 ((u64)msg_hi) << 32 | msg_lo);
>   			if (r)
> @@ -2146,7 +2146,7 @@ static void vcn_v1_0_set_enc_ring_funcs(struct amdgpu_device *adev)
>   {
>   	int i;
>   
> -	for (i = 0; i < adev->vcn.num_enc_rings; ++i)
> +	for (i = 0; i < adev->vcn.inst[0].num_enc_rings; ++i)
>   		adev->vcn.inst->ring_enc[i].funcs = &vcn_v1_0_enc_ring_vm_funcs;
>   }
>   
> @@ -2157,7 +2157,7 @@ static const struct amdgpu_irq_src_funcs vcn_v1_0_irq_funcs = {
>   
>   static void vcn_v1_0_set_irq_funcs(struct amdgpu_device *adev)
>   {
> -	adev->vcn.inst->irq.num_types = adev->vcn.num_enc_rings + 2;
> +	adev->vcn.inst->irq.num_types = adev->vcn.inst[0].num_enc_rings + 2;
>   	adev->vcn.inst->irq.funcs = &vcn_v1_0_irq_funcs;
>   }
>   
> diff --git a/drivers/gpu/drm/amd/amdgpu/vcn_v2_0.c b/drivers/gpu/drm/amd/amdgpu/vcn_v2_0.c
> index e55c1f8f260e9..b0a957664250c 100644
> --- a/drivers/gpu/drm/amd/amdgpu/vcn_v2_0.c
> +++ b/drivers/gpu/drm/amd/amdgpu/vcn_v2_0.c
> @@ -110,9 +110,9 @@ static int vcn_v2_0_early_init(struct amdgpu_ip_block *ip_block)
>   	struct amdgpu_device *adev = ip_block->adev;
>   
>   	if (amdgpu_sriov_vf(adev))
> -		adev->vcn.num_enc_rings = 1;
> +		adev->vcn.inst[0].num_enc_rings = 1;
>   	else
> -		adev->vcn.num_enc_rings = 2;
> +		adev->vcn.inst[0].num_enc_rings = 2;
>   
>   	vcn_v2_0_set_dec_ring_funcs(adev);
>   	vcn_v2_0_set_enc_ring_funcs(adev);
> @@ -145,7 +145,7 @@ static int vcn_v2_0_sw_init(struct amdgpu_ip_block *ip_block)
>   		return r;
>   
>   	/* VCN ENC TRAP */
> -	for (i = 0; i < adev->vcn.num_enc_rings; ++i) {
> +	for (i = 0; i < adev->vcn.inst[0].num_enc_rings; ++i) {
>   		r = amdgpu_irq_add_id(adev, SOC15_IH_CLIENTID_VCN,
>   				      i + VCN_2_0__SRCID__UVD_ENC_GENERAL_PURPOSE,
>   				      &adev->vcn.inst->irq);
> @@ -175,25 +175,25 @@ static int vcn_v2_0_sw_init(struct amdgpu_ip_block *ip_block)
>   	if (r)
>   		return r;
>   
> -	adev->vcn.internal.context_id = mmUVD_CONTEXT_ID_INTERNAL_OFFSET;
> -	adev->vcn.internal.ib_vmid = mmUVD_LMI_RBC_IB_VMID_INTERNAL_OFFSET;
> -	adev->vcn.internal.ib_bar_low = mmUVD_LMI_RBC_IB_64BIT_BAR_LOW_INTERNAL_OFFSET;
> -	adev->vcn.internal.ib_bar_high = mmUVD_LMI_RBC_IB_64BIT_BAR_HIGH_INTERNAL_OFFSET;
> -	adev->vcn.internal.ib_size = mmUVD_RBC_IB_SIZE_INTERNAL_OFFSET;
> -	adev->vcn.internal.gp_scratch8 = mmUVD_GP_SCRATCH8_INTERNAL_OFFSET;
> +	adev->vcn.inst[0].internal.context_id = mmUVD_CONTEXT_ID_INTERNAL_OFFSET;
> +	adev->vcn.inst[0].internal.ib_vmid = mmUVD_LMI_RBC_IB_VMID_INTERNAL_OFFSET;
> +	adev->vcn.inst[0].internal.ib_bar_low = mmUVD_LMI_RBC_IB_64BIT_BAR_LOW_INTERNAL_OFFSET;
> +	adev->vcn.inst[0].internal.ib_bar_high = mmUVD_LMI_RBC_IB_64BIT_BAR_HIGH_INTERNAL_OFFSET;
> +	adev->vcn.inst[0].internal.ib_size = mmUVD_RBC_IB_SIZE_INTERNAL_OFFSET;
> +	adev->vcn.inst[0].internal.gp_scratch8 = mmUVD_GP_SCRATCH8_INTERNAL_OFFSET;
>   
> -	adev->vcn.internal.scratch9 = mmUVD_SCRATCH9_INTERNAL_OFFSET;
> +	adev->vcn.inst[0].internal.scratch9 = mmUVD_SCRATCH9_INTERNAL_OFFSET;
>   	adev->vcn.inst->external.scratch9 = SOC15_REG_OFFSET(UVD, 0, mmUVD_SCRATCH9);
> -	adev->vcn.internal.data0 = mmUVD_GPCOM_VCPU_DATA0_INTERNAL_OFFSET;
> +	adev->vcn.inst[0].internal.data0 = mmUVD_GPCOM_VCPU_DATA0_INTERNAL_OFFSET;
>   	adev->vcn.inst->external.data0 = SOC15_REG_OFFSET(UVD, 0, mmUVD_GPCOM_VCPU_DATA0);
> -	adev->vcn.internal.data1 = mmUVD_GPCOM_VCPU_DATA1_INTERNAL_OFFSET;
> +	adev->vcn.inst[0].internal.data1 = mmUVD_GPCOM_VCPU_DATA1_INTERNAL_OFFSET;
>   	adev->vcn.inst->external.data1 = SOC15_REG_OFFSET(UVD, 0, mmUVD_GPCOM_VCPU_DATA1);
> -	adev->vcn.internal.cmd = mmUVD_GPCOM_VCPU_CMD_INTERNAL_OFFSET;
> +	adev->vcn.inst[0].internal.cmd = mmUVD_GPCOM_VCPU_CMD_INTERNAL_OFFSET;
>   	adev->vcn.inst->external.cmd = SOC15_REG_OFFSET(UVD, 0, mmUVD_GPCOM_VCPU_CMD);
> -	adev->vcn.internal.nop = mmUVD_NO_OP_INTERNAL_OFFSET;
> +	adev->vcn.inst[0].internal.nop = mmUVD_NO_OP_INTERNAL_OFFSET;
>   	adev->vcn.inst->external.nop = SOC15_REG_OFFSET(UVD, 0, mmUVD_NO_OP);
>   
> -	for (i = 0; i < adev->vcn.num_enc_rings; ++i) {
> +	for (i = 0; i < adev->vcn.inst[0].num_enc_rings; ++i) {
>   		enum amdgpu_ring_priority_level hw_prio = amdgpu_vcn_get_enc_ring_prio(i);
>   
>   		ring = &adev->vcn.inst->ring_enc[i];
> @@ -210,7 +210,7 @@ static int vcn_v2_0_sw_init(struct amdgpu_ip_block *ip_block)
>   			return r;
>   	}
>   
> -	adev->vcn.pause_dpg_mode = vcn_v2_0_pause_dpg_mode;
> +	adev->vcn.inst[0].pause_dpg_mode = vcn_v2_0_pause_dpg_mode;
>   
>   	r = amdgpu_virt_alloc_mm_table(adev);
>   	if (r)
> @@ -292,7 +292,7 @@ static int vcn_v2_0_hw_init(struct amdgpu_ip_block *ip_block)
>   	if (amdgpu_sriov_vf(adev))
>   		ring->sched.ready = false;
>   
> -	for (i = 0; i < adev->vcn.num_enc_rings; ++i) {
> +	for (i = 0; i < adev->vcn.inst[0].num_enc_rings; ++i) {
>   		ring = &adev->vcn.inst->ring_enc[i];
>   		r = amdgpu_ring_test_helper(ring);
>   		if (r)
> @@ -981,7 +981,7 @@ static int vcn_v2_0_start(struct amdgpu_device *adev)
>   		amdgpu_dpm_enable_vcn(adev, true, 0);
>   
>   	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> -		return vcn_v2_0_start_dpg_mode(adev, adev->vcn.indirect_sram);
> +		return vcn_v2_0_start_dpg_mode(adev, adev->vcn.inst->indirect_sram);
>   
>   	vcn_v2_0_disable_static_power_gating(adev);
>   
> @@ -1421,9 +1421,9 @@ void vcn_v2_0_dec_ring_insert_start(struct amdgpu_ring *ring)
>   {
>   	struct amdgpu_device *adev = ring->adev;
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.data0, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.data0, 0));
>   	amdgpu_ring_write(ring, 0);
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.cmd, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.cmd, 0));
>   	amdgpu_ring_write(ring, VCN_DEC_KMD_CMD | (VCN_DEC_CMD_PACKET_START << 1));
>   }
>   
> @@ -1438,7 +1438,7 @@ void vcn_v2_0_dec_ring_insert_end(struct amdgpu_ring *ring)
>   {
>   	struct amdgpu_device *adev = ring->adev;
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.cmd, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[0].internal.cmd, 0));
>   	amdgpu_ring_write(ring, VCN_DEC_KMD_CMD | (VCN_DEC_CMD_PACKET_END << 1));
>   }
>   
> @@ -1458,7 +1458,7 @@ void vcn_v2_0_dec_ring_insert_nop(struct amdgpu_ring *ring, uint32_t count)
>   	WARN_ON(ring->wptr % 2 || count % 2);
>   
>   	for (i = 0; i < count / 2; i++) {
> -		amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.nop, 0));
> +		amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.nop, 0));
>   		amdgpu_ring_write(ring, 0);
>   	}
>   }
> @@ -1479,25 +1479,25 @@ void vcn_v2_0_dec_ring_emit_fence(struct amdgpu_ring *ring, u64 addr, u64 seq,
>   	struct amdgpu_device *adev = ring->adev;
>   
>   	WARN_ON(flags & AMDGPU_FENCE_FLAG_64BIT);
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.context_id, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.context_id, 0));
>   	amdgpu_ring_write(ring, seq);
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.data0, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.data0, 0));
>   	amdgpu_ring_write(ring, addr & 0xffffffff);
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.data1, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.data1, 0));
>   	amdgpu_ring_write(ring, upper_32_bits(addr) & 0xff);
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.cmd, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.cmd, 0));
>   	amdgpu_ring_write(ring, VCN_DEC_KMD_CMD | (VCN_DEC_CMD_FENCE << 1));
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.data0, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.data0, 0));
>   	amdgpu_ring_write(ring, 0);
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.data1, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.data1, 0));
>   	amdgpu_ring_write(ring, 0);
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.cmd, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.cmd, 0));
>   
>   	amdgpu_ring_write(ring, VCN_DEC_KMD_CMD | (VCN_DEC_CMD_TRAP << 1));
>   }
> @@ -1520,14 +1520,14 @@ void vcn_v2_0_dec_ring_emit_ib(struct amdgpu_ring *ring,
>   	struct amdgpu_device *adev = ring->adev;
>   	unsigned vmid = AMDGPU_JOB_GET_VMID(job);
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.ib_vmid, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.ib_vmid, 0));
>   	amdgpu_ring_write(ring, vmid);
>   
> -	amdgpu_ring_write(ring,	PACKET0(adev->vcn.internal.ib_bar_low, 0));
> +	amdgpu_ring_write(ring,	PACKET0(adev->vcn.inst[ring->me].internal.ib_bar_low, 0));
>   	amdgpu_ring_write(ring, lower_32_bits(ib->gpu_addr));
> -	amdgpu_ring_write(ring,	PACKET0(adev->vcn.internal.ib_bar_high, 0));
> +	amdgpu_ring_write(ring,	PACKET0(adev->vcn.inst[ring->me].internal.ib_bar_high, 0));
>   	amdgpu_ring_write(ring, upper_32_bits(ib->gpu_addr));
> -	amdgpu_ring_write(ring,	PACKET0(adev->vcn.internal.ib_size, 0));
> +	amdgpu_ring_write(ring,	PACKET0(adev->vcn.inst[ring->me].internal.ib_size, 0));
>   	amdgpu_ring_write(ring, ib->length_dw);
>   }
>   
> @@ -1536,16 +1536,16 @@ void vcn_v2_0_dec_ring_emit_reg_wait(struct amdgpu_ring *ring, uint32_t reg,
>   {
>   	struct amdgpu_device *adev = ring->adev;
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.data0, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.data0, 0));
>   	amdgpu_ring_write(ring, reg << 2);
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.data1, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.data1, 0));
>   	amdgpu_ring_write(ring, val);
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.gp_scratch8, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.gp_scratch8, 0));
>   	amdgpu_ring_write(ring, mask);
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.cmd, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.cmd, 0));
>   
>   	amdgpu_ring_write(ring, VCN_DEC_KMD_CMD | (VCN_DEC_CMD_REG_READ_COND_WAIT << 1));
>   }
> @@ -1570,13 +1570,13 @@ void vcn_v2_0_dec_ring_emit_wreg(struct amdgpu_ring *ring,
>   {
>   	struct amdgpu_device *adev = ring->adev;
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.data0, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.data0, 0));
>   	amdgpu_ring_write(ring, reg << 2);
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.data1, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.data1, 0));
>   	amdgpu_ring_write(ring, val);
>   
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.cmd, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.cmd, 0));
>   
>   	amdgpu_ring_write(ring, VCN_DEC_KMD_CMD | (VCN_DEC_CMD_WRITE_REG << 1));
>   }
> @@ -1777,9 +1777,9 @@ int vcn_v2_0_dec_ring_test_ring(struct amdgpu_ring *ring)
>   	r = amdgpu_ring_alloc(ring, 4);
>   	if (r)
>   		return r;
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.cmd, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.cmd, 0));
>   	amdgpu_ring_write(ring, VCN_DEC_KMD_CMD | (VCN_DEC_CMD_PACKET_START << 1));
> -	amdgpu_ring_write(ring, PACKET0(adev->vcn.internal.scratch9, 0));
> +	amdgpu_ring_write(ring, PACKET0(adev->vcn.inst[ring->me].internal.scratch9, 0));
>   	amdgpu_ring_write(ring, 0xDEADBEEF);
>   	amdgpu_ring_commit(ring);
>   	for (i = 0; i < adev->usec_timeout; i++) {
> @@ -1863,7 +1863,7 @@ static int vcn_v2_0_start_mmsch(struct amdgpu_device *adev,
>   	adev->vcn.inst->ring_dec.wptr_old = 0;
>   	vcn_v2_0_dec_ring_set_wptr(&adev->vcn.inst->ring_dec);
>   
> -	for (i = 0; i < adev->vcn.num_enc_rings; ++i) {
> +	for (i = 0; i < adev->vcn.inst[0].num_enc_rings; ++i) {
>   		adev->vcn.inst->ring_enc[i].wptr = 0;
>   		adev->vcn.inst->ring_enc[i].wptr_old = 0;
>   		vcn_v2_0_enc_ring_set_wptr(&adev->vcn.inst->ring_enc[i]);
> @@ -1989,7 +1989,7 @@ static int vcn_v2_0_start_sriov(struct amdgpu_device *adev)
>   			SOC15_REG_OFFSET(UVD, i, mmUVD_VCPU_CACHE_SIZE2),
>   			AMDGPU_VCN_CONTEXT_SIZE);
>   
> -		for (r = 0; r < adev->vcn.num_enc_rings; ++r) {
> +		for (r = 0; r < adev->vcn.inst[0].num_enc_rings; ++r) {
>   			ring = &adev->vcn.inst->ring_enc[r];
>   			ring->wptr = 0;
>   			MMSCH_V2_0_INSERT_DIRECT_WT(
> @@ -2178,7 +2178,7 @@ static void vcn_v2_0_set_enc_ring_funcs(struct amdgpu_device *adev)
>   {
>   	int i;
>   
> -	for (i = 0; i < adev->vcn.num_enc_rings; ++i)
> +	for (i = 0; i < adev->vcn.inst[0].num_enc_rings; ++i)
>   		adev->vcn.inst->ring_enc[i].funcs = &vcn_v2_0_enc_ring_vm_funcs;
>   }
>   
> @@ -2189,7 +2189,7 @@ static const struct amdgpu_irq_src_funcs vcn_v2_0_irq_funcs = {
>   
>   static void vcn_v2_0_set_irq_funcs(struct amdgpu_device *adev)
>   {
> -	adev->vcn.inst->irq.num_types = adev->vcn.num_enc_rings + 1;
> +	adev->vcn.inst->irq.num_types = adev->vcn.inst[0].num_enc_rings + 1;
>   	adev->vcn.inst->irq.funcs = &vcn_v2_0_irq_funcs;
>   }
>   
> diff --git a/drivers/gpu/drm/amd/amdgpu/vcn_v2_5.c b/drivers/gpu/drm/amd/amdgpu/vcn_v2_5.c
> index 1d3780a2d8513..a3bac39e4c9db 100644
> --- a/drivers/gpu/drm/amd/amdgpu/vcn_v2_5.c
> +++ b/drivers/gpu/drm/amd/amdgpu/vcn_v2_5.c
> @@ -121,11 +121,13 @@ static int amdgpu_ih_clientid_vcns[] = {
>   static int vcn_v2_5_early_init(struct amdgpu_ip_block *ip_block)
>   {
>   	struct amdgpu_device *adev = ip_block->adev;
> +	int i;
>   
>   	if (amdgpu_sriov_vf(adev)) {
>   		adev->vcn.num_vcn_inst = 2;
>   		adev->vcn.harvest_config = 0;
> -		adev->vcn.num_enc_rings = 1;
> +		for (i = 0; i < adev->vcn.num_vcn_inst; i++)
> +			adev->vcn.inst[i].num_enc_rings = 1;
>   	} else {
>   		u32 harvest;
>   		int i;
> @@ -134,13 +136,12 @@ static int vcn_v2_5_early_init(struct amdgpu_ip_block *ip_block)
>   			harvest = RREG32_SOC15(VCN, i, mmCC_UVD_HARVESTING);
>   			if (harvest & CC_UVD_HARVESTING__UVD_DISABLE_MASK)
>   				adev->vcn.harvest_config |= 1 << i;
> +			adev->vcn.inst[i].num_enc_rings = 2;
>   		}
>   		if (adev->vcn.harvest_config == (AMDGPU_VCN_HARVEST_VCN0 |
>   					AMDGPU_VCN_HARVEST_VCN1))
>   			/* both instances are harvested, disable the block */
>   			return -ENOENT;
> -
> -		adev->vcn.num_enc_rings = 2;
>   	}
>   
>   	vcn_v2_5_set_dec_ring_funcs(adev);
> @@ -176,7 +177,7 @@ static int vcn_v2_5_sw_init(struct amdgpu_ip_block *ip_block)
>   			return r;
>   
>   		/* VCN ENC TRAP */
> -		for (i = 0; i < adev->vcn.num_enc_rings; ++i) {
> +		for (i = 0; i < adev->vcn.inst[j].num_enc_rings; ++i) {
>   			r = amdgpu_irq_add_id(adev, amdgpu_ih_clientid_vcns[j],
>   				i + VCN_2_0__SRCID__UVD_ENC_GENERAL_PURPOSE, &adev->vcn.inst[j].irq);
>   			if (r)
> @@ -205,22 +206,22 @@ static int vcn_v2_5_sw_init(struct amdgpu_ip_block *ip_block)
>   
>   		if (adev->vcn.harvest_config & (1 << j))
>   			continue;
> -		adev->vcn.internal.context_id = mmUVD_CONTEXT_ID_INTERNAL_OFFSET;
> -		adev->vcn.internal.ib_vmid = mmUVD_LMI_RBC_IB_VMID_INTERNAL_OFFSET;
> -		adev->vcn.internal.ib_bar_low = mmUVD_LMI_RBC_IB_64BIT_BAR_LOW_INTERNAL_OFFSET;
> -		adev->vcn.internal.ib_bar_high = mmUVD_LMI_RBC_IB_64BIT_BAR_HIGH_INTERNAL_OFFSET;
> -		adev->vcn.internal.ib_size = mmUVD_RBC_IB_SIZE_INTERNAL_OFFSET;
> -		adev->vcn.internal.gp_scratch8 = mmUVD_GP_SCRATCH8_INTERNAL_OFFSET;
> -
> -		adev->vcn.internal.scratch9 = mmUVD_SCRATCH9_INTERNAL_OFFSET;
> +		adev->vcn.inst[j].internal.context_id = mmUVD_CONTEXT_ID_INTERNAL_OFFSET;
> +		adev->vcn.inst[j].internal.ib_vmid = mmUVD_LMI_RBC_IB_VMID_INTERNAL_OFFSET;
> +		adev->vcn.inst[j].internal.ib_bar_low = mmUVD_LMI_RBC_IB_64BIT_BAR_LOW_INTERNAL_OFFSET;
> +		adev->vcn.inst[j].internal.ib_bar_high = mmUVD_LMI_RBC_IB_64BIT_BAR_HIGH_INTERNAL_OFFSET;
> +		adev->vcn.inst[j].internal.ib_size = mmUVD_RBC_IB_SIZE_INTERNAL_OFFSET;
> +		adev->vcn.inst[j].internal.gp_scratch8 = mmUVD_GP_SCRATCH8_INTERNAL_OFFSET;
> +
> +		adev->vcn.inst[j].internal.scratch9 = mmUVD_SCRATCH9_INTERNAL_OFFSET;
>   		adev->vcn.inst[j].external.scratch9 = SOC15_REG_OFFSET(VCN, j, mmUVD_SCRATCH9);
> -		adev->vcn.internal.data0 = mmUVD_GPCOM_VCPU_DATA0_INTERNAL_OFFSET;
> +		adev->vcn.inst[j].internal.data0 = mmUVD_GPCOM_VCPU_DATA0_INTERNAL_OFFSET;
>   		adev->vcn.inst[j].external.data0 = SOC15_REG_OFFSET(VCN, j, mmUVD_GPCOM_VCPU_DATA0);
> -		adev->vcn.internal.data1 = mmUVD_GPCOM_VCPU_DATA1_INTERNAL_OFFSET;
> +		adev->vcn.inst[j].internal.data1 = mmUVD_GPCOM_VCPU_DATA1_INTERNAL_OFFSET;
>   		adev->vcn.inst[j].external.data1 = SOC15_REG_OFFSET(VCN, j, mmUVD_GPCOM_VCPU_DATA1);
> -		adev->vcn.internal.cmd = mmUVD_GPCOM_VCPU_CMD_INTERNAL_OFFSET;
> +		adev->vcn.inst[j].internal.cmd = mmUVD_GPCOM_VCPU_CMD_INTERNAL_OFFSET;
>   		adev->vcn.inst[j].external.cmd = SOC15_REG_OFFSET(VCN, j, mmUVD_GPCOM_VCPU_CMD);
> -		adev->vcn.internal.nop = mmUVD_NO_OP_INTERNAL_OFFSET;
> +		adev->vcn.inst[j].internal.nop = mmUVD_NO_OP_INTERNAL_OFFSET;
>   		adev->vcn.inst[j].external.nop = SOC15_REG_OFFSET(VCN, j, mmUVD_NO_OP);
>   
>   		ring = &adev->vcn.inst[j].ring_dec;
> @@ -240,7 +241,7 @@ static int vcn_v2_5_sw_init(struct amdgpu_ip_block *ip_block)
>   		if (r)
>   			return r;
>   
> -		for (i = 0; i < adev->vcn.num_enc_rings; ++i) {
> +		for (i = 0; i < adev->vcn.inst[j].num_enc_rings; ++i) {
>   			enum amdgpu_ring_priority_level hw_prio = amdgpu_vcn_get_enc_ring_prio(i);
>   
>   			ring = &adev->vcn.inst[j].ring_enc[i];
> @@ -268,6 +269,9 @@ static int vcn_v2_5_sw_init(struct amdgpu_ip_block *ip_block)
>   
>   		if (amdgpu_vcnfw_log)
>   			amdgpu_vcn_fwlog_init(&adev->vcn.inst[i]);
> +
> +		if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> +			adev->vcn.inst[i].pause_dpg_mode = vcn_v2_5_pause_dpg_mode;
>   	}
>   
>   	if (amdgpu_sriov_vf(adev)) {
> @@ -276,9 +280,6 @@ static int vcn_v2_5_sw_init(struct amdgpu_ip_block *ip_block)
>   			return r;
>   	}
>   
> -	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> -		adev->vcn.pause_dpg_mode = vcn_v2_5_pause_dpg_mode;
> -
>   	r = amdgpu_vcn_ras_sw_init(adev);
>   	if (r)
>   		return r;
> @@ -369,7 +370,7 @@ static int vcn_v2_5_hw_init(struct amdgpu_ip_block *ip_block)
>   			if (r)
>   				return r;
>   
> -			for (i = 0; i < adev->vcn.num_enc_rings; ++i) {
> +			for (i = 0; i < adev->vcn.inst[j].num_enc_rings; ++i) {
>   				ring = &adev->vcn.inst[j].ring_enc[i];
>   				r = amdgpu_ring_test_helper(ring);
>   				if (r)
> @@ -1018,7 +1019,7 @@ static int vcn_v2_5_start(struct amdgpu_device *adev, int i)
>   		amdgpu_dpm_enable_vcn(adev, true, i);
>   
>   	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> -		return vcn_v2_5_start_dpg_mode(adev, i, adev->vcn.indirect_sram);
> +		return vcn_v2_5_start_dpg_mode(adev, i, adev->vcn.inst[i].indirect_sram);
>   
>   	/* disable register anti-hang mechanism */
>   	WREG32_P(SOC15_REG_OFFSET(VCN, i, mmUVD_POWER_STATUS), 0,
> @@ -1746,7 +1747,7 @@ static void vcn_v2_5_set_enc_ring_funcs(struct amdgpu_device *adev)
>   	for (j = 0; j < adev->vcn.num_vcn_inst; ++j) {
>   		if (adev->vcn.harvest_config & (1 << j))
>   			continue;
> -		for (i = 0; i < adev->vcn.num_enc_rings; ++i) {
> +		for (i = 0; i < adev->vcn.inst[j].num_enc_rings; ++i) {
>   			adev->vcn.inst[j].ring_enc[i].funcs = &vcn_v2_5_enc_ring_vm_funcs;
>   			adev->vcn.inst[j].ring_enc[i].me = j;
>   		}
> @@ -1917,10 +1918,10 @@ static void vcn_v2_5_set_irq_funcs(struct amdgpu_device *adev)
>   	for (i = 0; i < adev->vcn.num_vcn_inst; ++i) {
>   		if (adev->vcn.harvest_config & (1 << i))
>   			continue;
> -		adev->vcn.inst[i].irq.num_types = adev->vcn.num_enc_rings + 1;
> +		adev->vcn.inst[i].irq.num_types = adev->vcn.inst[i].num_enc_rings + 1;
>   		adev->vcn.inst[i].irq.funcs = &vcn_v2_5_irq_funcs;
>   
> -		adev->vcn.inst[i].ras_poison_irq.num_types = adev->vcn.num_enc_rings + 1;
> +		adev->vcn.inst[i].ras_poison_irq.num_types = adev->vcn.inst[i].num_enc_rings + 1;
>   		adev->vcn.inst[i].ras_poison_irq.funcs = &vcn_v2_6_ras_irq_funcs;
>   	}
>   }
> diff --git a/drivers/gpu/drm/amd/amdgpu/vcn_v3_0.c b/drivers/gpu/drm/amd/amdgpu/vcn_v3_0.c
> index 13b9ed96cccda..fabe4d75a7f6b 100644
> --- a/drivers/gpu/drm/amd/amdgpu/vcn_v3_0.c
> +++ b/drivers/gpu/drm/amd/amdgpu/vcn_v3_0.c
> @@ -127,11 +127,13 @@ static void vcn_v3_0_enc_ring_set_wptr(struct amdgpu_ring *ring);
>   static int vcn_v3_0_early_init(struct amdgpu_ip_block *ip_block)
>   {
>   	struct amdgpu_device *adev = ip_block->adev;
> +	int i;
>   
>   	if (amdgpu_sriov_vf(adev)) {
>   		adev->vcn.num_vcn_inst = VCN_INSTANCES_SIENNA_CICHLID;
>   		adev->vcn.harvest_config = 0;
> -		adev->vcn.num_enc_rings = 1;
> +		for (i = 0; i < adev->vcn.num_vcn_inst; i++)
> +			adev->vcn.inst[i].num_enc_rings = 1;
>   
>   	} else {
>   		if (adev->vcn.harvest_config == (AMDGPU_VCN_HARVEST_VCN0 |
> @@ -139,11 +141,13 @@ static int vcn_v3_0_early_init(struct amdgpu_ip_block *ip_block)
>   			/* both instances are harvested, disable the block */
>   			return -ENOENT;
>   
> -		if (amdgpu_ip_version(adev, UVD_HWIP, 0) ==
> -		    IP_VERSION(3, 0, 33))
> -			adev->vcn.num_enc_rings = 0;
> -		else
> -			adev->vcn.num_enc_rings = 2;
> +		for (i = 0; i < adev->vcn.num_vcn_inst; i++) {
> +			if (amdgpu_ip_version(adev, UVD_HWIP, 0) ==
> +			    IP_VERSION(3, 0, 33))
> +				adev->vcn.inst[i].num_enc_rings = 0;
> +			else
> +				adev->vcn.inst[i].num_enc_rings = 2;
> +		}
>   	}
>   
>   	vcn_v3_0_set_dec_ring_funcs(adev);
> @@ -198,22 +202,22 @@ static int vcn_v3_0_sw_init(struct amdgpu_ip_block *ip_block)
>   		if (adev->vcn.harvest_config & (1 << i))
>   			continue;
>   
> -		adev->vcn.internal.context_id = mmUVD_CONTEXT_ID_INTERNAL_OFFSET;
> -		adev->vcn.internal.ib_vmid = mmUVD_LMI_RBC_IB_VMID_INTERNAL_OFFSET;
> -		adev->vcn.internal.ib_bar_low = mmUVD_LMI_RBC_IB_64BIT_BAR_LOW_INTERNAL_OFFSET;
> -		adev->vcn.internal.ib_bar_high = mmUVD_LMI_RBC_IB_64BIT_BAR_HIGH_INTERNAL_OFFSET;
> -		adev->vcn.internal.ib_size = mmUVD_RBC_IB_SIZE_INTERNAL_OFFSET;
> -		adev->vcn.internal.gp_scratch8 = mmUVD_GP_SCRATCH8_INTERNAL_OFFSET;
> +		adev->vcn.inst[i].internal.context_id = mmUVD_CONTEXT_ID_INTERNAL_OFFSET;
> +		adev->vcn.inst[i].internal.ib_vmid = mmUVD_LMI_RBC_IB_VMID_INTERNAL_OFFSET;
> +		adev->vcn.inst[i].internal.ib_bar_low = mmUVD_LMI_RBC_IB_64BIT_BAR_LOW_INTERNAL_OFFSET;
> +		adev->vcn.inst[i].internal.ib_bar_high = mmUVD_LMI_RBC_IB_64BIT_BAR_HIGH_INTERNAL_OFFSET;
> +		adev->vcn.inst[i].internal.ib_size = mmUVD_RBC_IB_SIZE_INTERNAL_OFFSET;
> +		adev->vcn.inst[i].internal.gp_scratch8 = mmUVD_GP_SCRATCH8_INTERNAL_OFFSET;
>   
> -		adev->vcn.internal.scratch9 = mmUVD_SCRATCH9_INTERNAL_OFFSET;
> +		adev->vcn.inst[i].internal.scratch9 = mmUVD_SCRATCH9_INTERNAL_OFFSET;
>   		adev->vcn.inst[i].external.scratch9 = SOC15_REG_OFFSET(VCN, i, mmUVD_SCRATCH9);
> -		adev->vcn.internal.data0 = mmUVD_GPCOM_VCPU_DATA0_INTERNAL_OFFSET;
> +		adev->vcn.inst[i].internal.data0 = mmUVD_GPCOM_VCPU_DATA0_INTERNAL_OFFSET;
>   		adev->vcn.inst[i].external.data0 = SOC15_REG_OFFSET(VCN, i, mmUVD_GPCOM_VCPU_DATA0);
> -		adev->vcn.internal.data1 = mmUVD_GPCOM_VCPU_DATA1_INTERNAL_OFFSET;
> +		adev->vcn.inst[i].internal.data1 = mmUVD_GPCOM_VCPU_DATA1_INTERNAL_OFFSET;
>   		adev->vcn.inst[i].external.data1 = SOC15_REG_OFFSET(VCN, i, mmUVD_GPCOM_VCPU_DATA1);
> -		adev->vcn.internal.cmd = mmUVD_GPCOM_VCPU_CMD_INTERNAL_OFFSET;
> +		adev->vcn.inst[i].internal.cmd = mmUVD_GPCOM_VCPU_CMD_INTERNAL_OFFSET;
>   		adev->vcn.inst[i].external.cmd = SOC15_REG_OFFSET(VCN, i, mmUVD_GPCOM_VCPU_CMD);
> -		adev->vcn.internal.nop = mmUVD_NO_OP_INTERNAL_OFFSET;
> +		adev->vcn.inst[i].internal.nop = mmUVD_NO_OP_INTERNAL_OFFSET;
>   		adev->vcn.inst[i].external.nop = SOC15_REG_OFFSET(VCN, i, mmUVD_NO_OP);
>   
>   		/* VCN DEC TRAP */
> @@ -227,7 +231,7 @@ static int vcn_v3_0_sw_init(struct amdgpu_ip_block *ip_block)
>   		ring = &adev->vcn.inst[i].ring_dec;
>   		ring->use_doorbell = true;
>   		if (amdgpu_sriov_vf(adev)) {
> -			ring->doorbell_index = vcn_doorbell_index + i * (adev->vcn.num_enc_rings + 1);
> +			ring->doorbell_index = vcn_doorbell_index + i * (adev->vcn.inst[i].num_enc_rings + 1);
>   		} else {
>   			ring->doorbell_index = (adev->doorbell_index.vcn.vcn_ring0_1 << 1) + 8 * i;
>   		}
> @@ -239,7 +243,7 @@ static int vcn_v3_0_sw_init(struct amdgpu_ip_block *ip_block)
>   		if (r)
>   			return r;
>   
> -		for (j = 0; j < adev->vcn.num_enc_rings; ++j) {
> +		for (j = 0; j < adev->vcn.inst[i].num_enc_rings; ++j) {
>   			enum amdgpu_ring_priority_level hw_prio = amdgpu_vcn_get_enc_ring_prio(j);
>   
>   			/* VCN ENC TRAP */
> @@ -251,7 +255,7 @@ static int vcn_v3_0_sw_init(struct amdgpu_ip_block *ip_block)
>   			ring = &adev->vcn.inst[i].ring_enc[j];
>   			ring->use_doorbell = true;
>   			if (amdgpu_sriov_vf(adev)) {
> -				ring->doorbell_index = vcn_doorbell_index + i * (adev->vcn.num_enc_rings + 1) + 1 + j;
> +				ring->doorbell_index = vcn_doorbell_index + i * (adev->vcn.inst[i].num_enc_rings + 1) + 1 + j;
>   			} else {
>   				ring->doorbell_index = (adev->doorbell_index.vcn.vcn_ring0_1 << 1) + 2 + j + 8 * i;
>   			}
> @@ -277,6 +281,9 @@ static int vcn_v3_0_sw_init(struct amdgpu_ip_block *ip_block)
>   
>   		if (amdgpu_vcnfw_log)
>   			amdgpu_vcn_fwlog_init(&adev->vcn.inst[i]);
> +
> +		if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> +			adev->vcn.inst[i].pause_dpg_mode = vcn_v3_0_pause_dpg_mode;
>   	}
>   
>   	if (amdgpu_sriov_vf(adev)) {
> @@ -284,8 +291,6 @@ static int vcn_v3_0_sw_init(struct amdgpu_ip_block *ip_block)
>   		if (r)
>   			return r;
>   	}
> -	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> -		adev->vcn.pause_dpg_mode = vcn_v3_0_pause_dpg_mode;
>   
>   	/* Allocate memory for VCN IP Dump buffer */
>   	ptr = kcalloc(adev->vcn.num_vcn_inst * reg_count, sizeof(uint32_t), GFP_KERNEL);
> @@ -373,7 +378,7 @@ static int vcn_v3_0_hw_init(struct amdgpu_ip_block *ip_block)
>   				ring->sched.ready = true;
>   			}
>   
> -			for (j = 0; j < adev->vcn.num_enc_rings; ++j) {
> +			for (j = 0; j < adev->vcn.inst[i].num_enc_rings; ++j) {
>   				ring = &adev->vcn.inst[i].ring_enc[j];
>   				if (amdgpu_vcn_is_disabled_vcn(adev, VCN_ENCODE_RING, i)) {
>   					ring->sched.ready = false;
> @@ -401,7 +406,7 @@ static int vcn_v3_0_hw_init(struct amdgpu_ip_block *ip_block)
>   			if (r)
>   				return r;
>   
> -			for (j = 0; j < adev->vcn.num_enc_rings; ++j) {
> +			for (j = 0; j < adev->vcn.inst[i].num_enc_rings; ++j) {
>   				ring = &adev->vcn.inst[i].ring_enc[j];
>   				r = amdgpu_ring_test_helper(ring);
>   				if (r)
> @@ -1153,7 +1158,7 @@ static int vcn_v3_0_start(struct amdgpu_device *adev, int i)
>   		amdgpu_dpm_enable_vcn(adev, true, i);
>   
>   	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> -		return vcn_v3_0_start_dpg_mode(adev, i, adev->vcn.indirect_sram);
> +		return vcn_v3_0_start_dpg_mode(adev, i, adev->vcn.inst[i].indirect_sram);
>   
>   	/* disable VCN power gating */
>   	vcn_v3_0_disable_static_power_gating(adev, i);
> @@ -1433,7 +1438,7 @@ static int vcn_v3_0_start_sriov(struct amdgpu_device *adev)
>   			mmUVD_VCPU_CACHE_SIZE2),
>   			AMDGPU_VCN_CONTEXT_SIZE);
>   
> -		for (j = 0; j < adev->vcn.num_enc_rings; ++j) {
> +		for (j = 0; j < adev->vcn.inst[i].num_enc_rings; ++j) {
>   			ring = &adev->vcn.inst[i].ring_enc[j];
>   			ring->wptr = 0;
>   			rb_addr = ring->gpu_addr;
> @@ -1921,11 +1926,11 @@ static int vcn_v3_0_ring_patch_cs_in_place(struct amdgpu_cs_parser *p,
>   		uint32_t reg = amdgpu_ib_get_value(ib, i);
>   		uint32_t val = amdgpu_ib_get_value(ib, i + 1);
>   
> -		if (reg == PACKET0(p->adev->vcn.internal.data0, 0)) {
> +		if (reg == PACKET0(p->adev->vcn.inst[ring->me].internal.data0, 0)) {
>   			msg_lo = val;
> -		} else if (reg == PACKET0(p->adev->vcn.internal.data1, 0)) {
> +		} else if (reg == PACKET0(p->adev->vcn.inst[ring->me].internal.data1, 0)) {
>   			msg_hi = val;
> -		} else if (reg == PACKET0(p->adev->vcn.internal.cmd, 0) &&
> +		} else if (reg == PACKET0(p->adev->vcn.inst[ring->me].internal.cmd, 0) &&
>   			   val == 0) {
>   			r = vcn_v3_0_dec_msg(p, job,
>   					     ((u64)msg_hi) << 32 | msg_lo);
> @@ -2089,7 +2094,7 @@ static void vcn_v3_0_set_enc_ring_funcs(struct amdgpu_device *adev)
>   		if (adev->vcn.harvest_config & (1 << i))
>   			continue;
>   
> -		for (j = 0; j < adev->vcn.num_enc_rings; ++j) {
> +		for (j = 0; j < adev->vcn.inst[i].num_enc_rings; ++j) {
>   			adev->vcn.inst[i].ring_enc[j].funcs = &vcn_v3_0_enc_ring_vm_funcs;
>   			adev->vcn.inst[i].ring_enc[j].me = i;
>   		}
> @@ -2255,7 +2260,7 @@ static void vcn_v3_0_set_irq_funcs(struct amdgpu_device *adev)
>   		if (adev->vcn.harvest_config & (1 << i))
>   			continue;
>   
> -		adev->vcn.inst[i].irq.num_types = adev->vcn.num_enc_rings + 1;
> +		adev->vcn.inst[i].irq.num_types = adev->vcn.inst[i].num_enc_rings + 1;
>   		adev->vcn.inst[i].irq.funcs = &vcn_v3_0_irq_funcs;
>   	}
>   }
> diff --git a/drivers/gpu/drm/amd/amdgpu/vcn_v4_0.c b/drivers/gpu/drm/amd/amdgpu/vcn_v4_0.c
> index dbbeeffc90726..ee87594fafa60 100644
> --- a/drivers/gpu/drm/amd/amdgpu/vcn_v4_0.c
> +++ b/drivers/gpu/drm/amd/amdgpu/vcn_v4_0.c
> @@ -129,8 +129,9 @@ static int vcn_v4_0_early_init(struct amdgpu_ip_block *ip_block)
>   		}
>   	}
>   
> -	/* re-use enc ring as unified ring */
> -	adev->vcn.num_enc_rings = 1;
> +	for (i = 0; i < adev->vcn.num_vcn_inst; ++i)
> +		/* re-use enc ring as unified ring */
> +		adev->vcn.inst[i].num_enc_rings = 1;
>   
>   	vcn_v4_0_set_unified_ring_funcs(adev);
>   	vcn_v4_0_set_irq_funcs(adev);
> @@ -214,7 +215,8 @@ static int vcn_v4_0_sw_init(struct amdgpu_ip_block *ip_block)
>   		ring = &adev->vcn.inst[i].ring_enc[0];
>   		ring->use_doorbell = true;
>   		if (amdgpu_sriov_vf(adev))
> -			ring->doorbell_index = (adev->doorbell_index.vcn.vcn_ring0_1 << 1) + i * (adev->vcn.num_enc_rings + 1) + 1;
> +			ring->doorbell_index = (adev->doorbell_index.vcn.vcn_ring0_1 << 1) + i *
> +				(adev->vcn.inst[i].num_enc_rings + 1) + 1;
>   		else
>   			ring->doorbell_index = (adev->doorbell_index.vcn.vcn_ring0_1 << 1) + 2 + 8 * i;
>   		ring->vm_hub = AMDGPU_MMHUB0(0);
> @@ -226,6 +228,9 @@ static int vcn_v4_0_sw_init(struct amdgpu_ip_block *ip_block)
>   			return r;
>   
>   		vcn_v4_0_fw_shared_init(adev, i);
> +
> +		if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> +			adev->vcn.inst[i].pause_dpg_mode = vcn_v4_0_pause_dpg_mode;
>   	}
>   
>   	/* TODO: Add queue reset mask when FW fully supports it */
> @@ -238,8 +243,6 @@ static int vcn_v4_0_sw_init(struct amdgpu_ip_block *ip_block)
>   			return r;
>   	}
>   
> -	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> -		adev->vcn.pause_dpg_mode = vcn_v4_0_pause_dpg_mode;
>   
>   	r = amdgpu_vcn_ras_sw_init(adev);
>   	if (r)
> @@ -1111,7 +1114,7 @@ static int vcn_v4_0_start(struct amdgpu_device *adev, int i)
>   	fw_shared = adev->vcn.inst[i].fw_shared.cpu_addr;
>   
>   	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> -		return vcn_v4_0_start_dpg_mode(adev, i, adev->vcn.indirect_sram);
> +		return vcn_v4_0_start_dpg_mode(adev, i, adev->vcn.inst[i].indirect_sram);
>   
>   	/* disable VCN power gating */
>   	vcn_v4_0_disable_static_power_gating(adev, i);
> @@ -2172,10 +2175,10 @@ static void vcn_v4_0_set_irq_funcs(struct amdgpu_device *adev)
>   		if (adev->vcn.harvest_config & (1 << i))
>   			continue;
>   
> -		adev->vcn.inst[i].irq.num_types = adev->vcn.num_enc_rings + 1;
> +		adev->vcn.inst[i].irq.num_types = adev->vcn.inst[i].num_enc_rings + 1;
>   		adev->vcn.inst[i].irq.funcs = &vcn_v4_0_irq_funcs;
>   
> -		adev->vcn.inst[i].ras_poison_irq.num_types = adev->vcn.num_enc_rings + 1;
> +		adev->vcn.inst[i].ras_poison_irq.num_types = adev->vcn.inst[i].num_enc_rings + 1;
>   		adev->vcn.inst[i].ras_poison_irq.funcs = &vcn_v4_0_ras_irq_funcs;
>   	}
>   }
> diff --git a/drivers/gpu/drm/amd/amdgpu/vcn_v4_0_3.c b/drivers/gpu/drm/amd/amdgpu/vcn_v4_0_3.c
> index 8396ef6831b69..35854e074d142 100644
> --- a/drivers/gpu/drm/amd/amdgpu/vcn_v4_0_3.c
> +++ b/drivers/gpu/drm/amd/amdgpu/vcn_v4_0_3.c
> @@ -114,9 +114,11 @@ static inline bool vcn_v4_0_3_normalizn_reqd(struct amdgpu_device *adev)
>   static int vcn_v4_0_3_early_init(struct amdgpu_ip_block *ip_block)
>   {
>   	struct amdgpu_device *adev = ip_block->adev;
> +	int i;
>   
> -	/* re-use enc ring as unified ring */
> -	adev->vcn.num_enc_rings = 1;
> +	for (i = 0; i < adev->vcn.num_vcn_inst; ++i)
> +		/* re-use enc ring as unified ring */
> +		adev->vcn.inst[i].num_enc_rings = 1;
>   
>   	vcn_v4_0_3_set_unified_ring_funcs(adev);
>   	vcn_v4_0_3_set_irq_funcs(adev);
> @@ -194,6 +196,9 @@ static int vcn_v4_0_3_sw_init(struct amdgpu_ip_block *ip_block)
>   			return r;
>   
>   		vcn_v4_0_3_fw_shared_init(adev, i);
> +
> +		if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> +			adev->vcn.inst[i].pause_dpg_mode = vcn_v4_0_3_pause_dpg_mode;
>   	}
>   
>   	/* TODO: Add queue reset mask when FW fully supports it */
> @@ -206,9 +211,6 @@ static int vcn_v4_0_3_sw_init(struct amdgpu_ip_block *ip_block)
>   			return r;
>   	}
>   
> -	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> -		adev->vcn.pause_dpg_mode = vcn_v4_0_3_pause_dpg_mode;
> -
>   	if (amdgpu_ras_is_supported(adev, AMDGPU_RAS_BLOCK__VCN)) {
>   		r = amdgpu_vcn_ras_sw_init(adev);
>   		if (r) {
> @@ -1138,7 +1140,7 @@ static int vcn_v4_0_3_start(struct amdgpu_device *adev, int i)
>   		amdgpu_dpm_enable_vcn(adev, true, i);
>   
>   	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> -		return vcn_v4_0_3_start_dpg_mode(adev, i, adev->vcn.indirect_sram);
> +		return vcn_v4_0_3_start_dpg_mode(adev, i, adev->vcn.inst[i].indirect_sram);
>   
>   	vcn_inst = GET_INST(VCN, i);
>   	/* set VCN status busy */
> diff --git a/drivers/gpu/drm/amd/amdgpu/vcn_v4_0_5.c b/drivers/gpu/drm/amd/amdgpu/vcn_v4_0_5.c
> index f6b347fcdb7ed..0700a5f96084c 100644
> --- a/drivers/gpu/drm/amd/amdgpu/vcn_v4_0_5.c
> +++ b/drivers/gpu/drm/amd/amdgpu/vcn_v4_0_5.c
> @@ -115,9 +115,11 @@ static void vcn_v4_0_5_unified_ring_set_wptr(struct amdgpu_ring *ring);
>   static int vcn_v4_0_5_early_init(struct amdgpu_ip_block *ip_block)
>   {
>   	struct amdgpu_device *adev = ip_block->adev;
> +	int i;
>   
> -	/* re-use enc ring as unified ring */
> -	adev->vcn.num_enc_rings = 1;
> +	for (i = 0; i < adev->vcn.num_vcn_inst; ++i)
> +		/* re-use enc ring as unified ring */
> +		adev->vcn.inst[i].num_enc_rings = 1;
>   	vcn_v4_0_5_set_unified_ring_funcs(adev);
>   	vcn_v4_0_5_set_irq_funcs(adev);
>   
> @@ -173,7 +175,7 @@ static int vcn_v4_0_5_sw_init(struct amdgpu_ip_block *ip_block)
>   		ring->use_doorbell = true;
>   		if (amdgpu_sriov_vf(adev))
>   			ring->doorbell_index = (adev->doorbell_index.vcn.vcn_ring0_1 << 1) +
> -						i * (adev->vcn.num_enc_rings + 1) + 1;
> +						i * (adev->vcn.inst[i].num_enc_rings + 1) + 1;
>   		else
>   			ring->doorbell_index = (adev->doorbell_index.vcn.vcn_ring0_1 << 1) +
>   						2 + 8 * i;
> @@ -198,6 +200,9 @@ static int vcn_v4_0_5_sw_init(struct amdgpu_ip_block *ip_block)
>   
>   		if (amdgpu_vcnfw_log)
>   			amdgpu_vcn_fwlog_init(&adev->vcn.inst[i]);
> +
> +		if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> +			adev->vcn.inst[i].pause_dpg_mode = vcn_v4_0_5_pause_dpg_mode;
>   	}
>   
>   	if (amdgpu_sriov_vf(adev)) {
> @@ -206,9 +211,6 @@ static int vcn_v4_0_5_sw_init(struct amdgpu_ip_block *ip_block)
>   			return r;
>   	}
>   
> -	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> -		adev->vcn.pause_dpg_mode = vcn_v4_0_5_pause_dpg_mode;
> -
>   	/* Allocate memory for VCN IP Dump buffer */
>   	ptr = kcalloc(adev->vcn.num_vcn_inst * reg_count, sizeof(uint32_t), GFP_KERNEL);
>   	if (!ptr) {
> @@ -1014,7 +1016,7 @@ static int vcn_v4_0_5_start(struct amdgpu_device *adev, int i)
>   	fw_shared = adev->vcn.inst[i].fw_shared.cpu_addr;
>   
>   	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> -		return vcn_v4_0_5_start_dpg_mode(adev, i, adev->vcn.indirect_sram);
> +		return vcn_v4_0_5_start_dpg_mode(adev, i, adev->vcn.inst[i].indirect_sram);
>   
>   	/* disable VCN power gating */
>   	vcn_v4_0_5_disable_static_power_gating(adev, i);
> @@ -1624,7 +1626,7 @@ static void vcn_v4_0_5_set_irq_funcs(struct amdgpu_device *adev)
>   		if (adev->vcn.harvest_config & (1 << i))
>   			continue;
>   
> -		adev->vcn.inst[i].irq.num_types = adev->vcn.num_enc_rings + 1;
> +		adev->vcn.inst[i].irq.num_types = adev->vcn.inst[i].num_enc_rings + 1;
>   		adev->vcn.inst[i].irq.funcs = &vcn_v4_0_5_irq_funcs;
>   	}
>   }
> diff --git a/drivers/gpu/drm/amd/amdgpu/vcn_v5_0_0.c b/drivers/gpu/drm/amd/amdgpu/vcn_v5_0_0.c
> index c5d59edf3a482..eeb3c9875ad50 100644
> --- a/drivers/gpu/drm/amd/amdgpu/vcn_v5_0_0.c
> +++ b/drivers/gpu/drm/amd/amdgpu/vcn_v5_0_0.c
> @@ -98,9 +98,11 @@ static void vcn_v5_0_0_unified_ring_set_wptr(struct amdgpu_ring *ring);
>   static int vcn_v5_0_0_early_init(struct amdgpu_ip_block *ip_block)
>   {
>   	struct amdgpu_device *adev = ip_block->adev;
> +	int i;
>   
> -	/* re-use enc ring as unified ring */
> -	adev->vcn.num_enc_rings = 1;
> +	for (i = 0; i < adev->vcn.num_vcn_inst; ++i)
> +		/* re-use enc ring as unified ring */
> +		adev->vcn.inst[i].num_enc_rings = 1;
>   
>   	vcn_v5_0_0_set_unified_ring_funcs(adev);
>   	vcn_v5_0_0_set_irq_funcs(adev);
> @@ -184,15 +186,15 @@ static int vcn_v5_0_0_sw_init(struct amdgpu_ip_block *ip_block)
>   
>   		if (amdgpu_vcnfw_log)
>   			amdgpu_vcn_fwlog_init(&adev->vcn.inst[i]);
> +
> +		if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> +			adev->vcn.inst[i].pause_dpg_mode = vcn_v5_0_0_pause_dpg_mode;
>   	}
>   
>   	/* TODO: Add queue reset mask when FW fully supports it */
>   	adev->vcn.supported_reset =
>   		amdgpu_get_soft_full_reset_mask(&adev->vcn.inst[0].ring_enc[0]);
>   
> -	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> -		adev->vcn.pause_dpg_mode = vcn_v5_0_0_pause_dpg_mode;
> -
>   	vcn_v5_0_0_alloc_ip_dump(adev);
>   
>   	r = amdgpu_vcn_sysfs_reset_mask_init(adev);
> @@ -791,7 +793,7 @@ static int vcn_v5_0_0_start(struct amdgpu_device *adev, int i)
>   	fw_shared = adev->vcn.inst[i].fw_shared.cpu_addr;
>   
>   	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> -		return vcn_v5_0_0_start_dpg_mode(adev, i, adev->vcn.indirect_sram);
> +		return vcn_v5_0_0_start_dpg_mode(adev, i, adev->vcn.inst[i].indirect_sram);
>   
>   	/* disable VCN power gating */
>   	vcn_v5_0_0_disable_static_power_gating(adev, i);
> @@ -1367,7 +1369,7 @@ static void vcn_v5_0_0_set_irq_funcs(struct amdgpu_device *adev)
>   		if (adev->vcn.harvest_config & (1 << i))
>   			continue;
>   
> -		adev->vcn.inst[i].irq.num_types = adev->vcn.num_enc_rings + 1;
> +		adev->vcn.inst[i].irq.num_types = adev->vcn.inst[i].num_enc_rings + 1;
>   		adev->vcn.inst[i].irq.funcs = &vcn_v5_0_0_irq_funcs;
>   	}
>   }
> diff --git a/drivers/gpu/drm/amd/amdgpu/vcn_v5_0_1.c b/drivers/gpu/drm/amd/amdgpu/vcn_v5_0_1.c
> index 51a2d70a65c9e..f428d23eb2857 100644
> --- a/drivers/gpu/drm/amd/amdgpu/vcn_v5_0_1.c
> +++ b/drivers/gpu/drm/amd/amdgpu/vcn_v5_0_1.c
> @@ -58,9 +58,11 @@ static void vcn_v5_0_1_unified_ring_set_wptr(struct amdgpu_ring *ring);
>   static int vcn_v5_0_1_early_init(struct amdgpu_ip_block *ip_block)
>   {
>   	struct amdgpu_device *adev = ip_block->adev;
> +	int i;
>   
> -	/* re-use enc ring as unified ring */
> -	adev->vcn.num_enc_rings = 1;
> +	for (i = 0; i < adev->vcn.num_vcn_inst; ++i)
> +		/* re-use enc ring as unified ring */
> +		adev->vcn.inst[i].num_enc_rings = 1;
>   
>   	vcn_v5_0_1_set_unified_ring_funcs(adev);
>   	vcn_v5_0_1_set_irq_funcs(adev);
> @@ -586,7 +588,7 @@ static int vcn_v5_0_1_start(struct amdgpu_device *adev, int i)
>   	fw_shared = adev->vcn.inst[i].fw_shared.cpu_addr;
>   
>   	if (adev->pg_flags & AMD_PG_SUPPORT_VCN_DPG)
> -		return vcn_v5_0_1_start_dpg_mode(adev, i, adev->vcn.indirect_sram);
> +		return vcn_v5_0_1_start_dpg_mode(adev, i, adev->vcn.inst[i].indirect_sram);
>   
>   	vcn_inst = GET_INST(VCN, i);
>