[PATCH v3 1/2] drm/i915/gvt: Factor out scan and shadow from workload dispatch

Thu Jun 15 02:03:59 UTC 2017

On 06/09/17 13:52, Ping Gao wrote:
> To perform the workload scan and shadow in ELSP writing stage for
> performance consideration, the workload scan and shadow stuffs
> should be factored out from dispatch_workload().
>
> v2:Put context pin before i915_add_request;
>     Refine the comments;
>     Rename some APIs;
>
> v3:workload->status should set only when error happens.
>
> Signed-off-by: Ping Gao <ping.a.gao at intel.com>
> ---
>   drivers/gpu/drm/i915/gvt/cmd_parser.c |  2 +-
>   drivers/gpu/drm/i915/gvt/cmd_parser.h |  2 +-
>   drivers/gpu/drm/i915/gvt/gvt.h        |  2 +
>   drivers/gpu/drm/i915/gvt/scheduler.c  | 79 +++++++++++++++++++++--------------
>   4 files changed, 51 insertions(+), 34 deletions(-)
>
> diff --git a/drivers/gpu/drm/i915/gvt/cmd_parser.c b/drivers/gpu/drm/i915/gvt/cmd_parser.c
> index 5634eb1..e68fda2 100644
> --- a/drivers/gpu/drm/i915/gvt/cmd_parser.c
> +++ b/drivers/gpu/drm/i915/gvt/cmd_parser.c
> @@ -2643,7 +2643,7 @@ static int shadow_workload_ring_buffer(struct intel_vgpu_workload *workload)
>   	return 0;
>   }
>   
> -int intel_gvt_scan_and_shadow_workload(struct intel_vgpu_workload *workload)
> +int intel_gvt_scan_and_shadow_ringbuffer(struct intel_vgpu_workload *workload)
>   {
>   	int ret;
>   	struct intel_vgpu *vgpu = workload->vgpu;
> diff --git a/drivers/gpu/drm/i915/gvt/cmd_parser.h b/drivers/gpu/drm/i915/gvt/cmd_parser.h
> index bed3351..2867036 100644
> --- a/drivers/gpu/drm/i915/gvt/cmd_parser.h
> +++ b/drivers/gpu/drm/i915/gvt/cmd_parser.h
> @@ -42,7 +42,7 @@ void intel_gvt_clean_cmd_parser(struct intel_gvt *gvt);
>   
>   int intel_gvt_init_cmd_parser(struct intel_gvt *gvt);
>   
> -int intel_gvt_scan_and_shadow_workload(struct intel_vgpu_workload *workload);
> +int intel_gvt_scan_and_shadow_ringbuffer(struct intel_vgpu_workload *workload);
>   
>   int intel_gvt_scan_and_shadow_wa_ctx(struct intel_shadow_wa_ctx *wa_ctx);
>   
> diff --git a/drivers/gpu/drm/i915/gvt/gvt.h b/drivers/gpu/drm/i915/gvt/gvt.h
> index 930732e..ae6e7a4 100644
> --- a/drivers/gpu/drm/i915/gvt/gvt.h
> +++ b/drivers/gpu/drm/i915/gvt/gvt.h
> @@ -450,6 +450,8 @@ int intel_vgpu_init_opregion(struct intel_vgpu *vgpu, u32 gpa);
>   int intel_vgpu_emulate_opregion_request(struct intel_vgpu *vgpu, u32 swsci);
>   void populate_pvinfo_page(struct intel_vgpu *vgpu);
>   
> +int intel_gvt_scan_and_shadow_workload(struct intel_vgpu_workload *workload);
> +
>   struct intel_gvt_ops {
>   	int (*emulate_cfg_read)(struct intel_vgpu *, unsigned int, void *,
>   				unsigned int);
> diff --git a/drivers/gpu/drm/i915/gvt/scheduler.c b/drivers/gpu/drm/i915/gvt/scheduler.c
> index 6ae286c..e986d86 100644
> --- a/drivers/gpu/drm/i915/gvt/scheduler.c
> +++ b/drivers/gpu/drm/i915/gvt/scheduler.c
> @@ -172,42 +172,27 @@ static int shadow_context_status_change(struct notifier_block *nb,
>   	return NOTIFY_OK;
>   }
>   
> -static int dispatch_workload(struct intel_vgpu_workload *workload)
> +/**
> + * intel_gvt_scan_and_shadow_workload - audit the workload by scanning and
> + * shadow it as well, include ringbuffer,wa_ctx and ctx.
> + * @workload: an abstract entity for each execlist submission.
> + *
> + * This function is called before the workload submitting to i915, to make
> + * sure the content of the workload is valid.
> + */
> +int intel_gvt_scan_and_shadow_workload(struct intel_vgpu_workload *workload)
>   {
>   	int ring_id = workload->ring_id;
>   	struct i915_gem_context *shadow_ctx = workload->vgpu->shadow_ctx;
>   	struct drm_i915_private *dev_priv = workload->vgpu->gvt->dev_priv;
> -	struct intel_engine_cs *engine = dev_priv->engine[ring_id];
>   	struct drm_i915_gem_request *rq;
>   	struct intel_vgpu *vgpu = workload->vgpu;
> -	struct intel_ring *ring;
>   	int ret;
>   
> -	gvt_dbg_sched("ring id %d prepare to dispatch workload %p\n",
> -		ring_id, workload);
> -
>   	shadow_ctx->desc_template &= ~(0x3 << GEN8_CTX_ADDRESSING_MODE_SHIFT);
>   	shadow_ctx->desc_template |= workload->ctx_desc.addressing_mode <<
>   				    GEN8_CTX_ADDRESSING_MODE_SHIFT;
>   
> -	mutex_lock(&dev_priv->drm.struct_mutex);
> -
> -	/* pin shadow context by gvt even the shadow context will be pinned
> -	 * when i915 alloc request. That is because gvt will update the guest
> -	 * context from shadow context when workload is completed, and at that
> -	 * moment, i915 may already unpined the shadow context to make the
> -	 * shadow_ctx pages invalid. So gvt need to pin itself. After update
> -	 * the guest context, gvt can unpin the shadow_ctx safely.
> -	 */
> -	ring = engine->context_pin(engine, shadow_ctx);
> -	if (IS_ERR(ring)) {
> -		ret = PTR_ERR(ring);
> -		gvt_vgpu_err("fail to pin shadow context\n");
> -		workload->status = ret;
> -		mutex_unlock(&dev_priv->drm.struct_mutex);
> -		return ret;
> -	}
> -
>   	rq = i915_gem_request_alloc(dev_priv->engine[ring_id], shadow_ctx);
>   	if (IS_ERR(rq)) {
>   		gvt_vgpu_err("fail to allocate gem request\n");
> @@ -219,7 +204,7 @@ static int dispatch_workload(struct intel_vgpu_workload *workload)
>   
>   	workload->req = i915_gem_request_get(rq);
>   
> -	ret = intel_gvt_scan_and_shadow_workload(workload);
> +	ret = intel_gvt_scan_and_shadow_ringbuffer(workload);
>   	if (ret)
>   		goto out;
>   
> @@ -231,6 +216,27 @@ static int dispatch_workload(struct intel_vgpu_workload *workload)
>   	}
>   
>   	ret = populate_shadow_context(workload);
> +
> +out:
> +	return ret;
> +}
> +
> +static int dispatch_workload(struct intel_vgpu_workload *workload)
> +{
> +	int ring_id = workload->ring_id;
> +	struct i915_gem_context *shadow_ctx = workload->vgpu->shadow_ctx;
> +	struct drm_i915_private *dev_priv = workload->vgpu->gvt->dev_priv;
> +	struct intel_engine_cs *engine = dev_priv->engine[ring_id];
> +	struct intel_vgpu *vgpu = workload->vgpu;
> +	struct intel_ring *ring;
> +	int ret = 0;
> +
> +	gvt_dbg_sched("ring id %d prepare to dispatch workload %p\n",
> +		ring_id, workload);
> +
> +	mutex_lock(&dev_priv->drm.struct_mutex);
> +
> +	ret = intel_gvt_scan_and_shadow_workload(workload);
>   	if (ret)
>   		goto out;
>   
> @@ -240,20 +246,29 @@ static int dispatch_workload(struct intel_vgpu_workload *workload)
>   			goto out;
>   	}
>   
Is there any reason why you move context_pin to this place?
> +	/* pin shadow context by gvt even the shadow context will be pinned
> +	 * when i915 alloc request. That is because gvt will update the guest
> +	 * context from shadow context when workload is completed, and at that
> +	 * moment, i915 may already unpined the shadow context to make the
> +	 * shadow_ctx pages invalid. So gvt need to pin itself. After update
> +	 * the guest context, gvt can unpin the shadow_ctx safely.
> +	 */
> +	ring = engine->context_pin(engine, shadow_ctx);
> +	if (IS_ERR(ring)) {
> +		ret = PTR_ERR(ring);
> +		gvt_vgpu_err("fail to pin shadow context\n");
> +		goto out;
> +	}
> +
>   	gvt_dbg_sched("ring id %d submit workload to i915 %p\n",
>   			ring_id, workload->req);
>   
> -	ret = 0;
> +	i915_add_request(workload->req);
>   	workload->dispatched = true;
> +
>   out:
>   	if (ret)
>   		workload->status = ret;
> -
> -	if (!IS_ERR_OR_NULL(rq))
> -		i915_add_request(rq);
> -	else
> -		engine->context_unpin(engine, shadow_ctx);
> -
>   	mutex_unlock(&dev_priv->drm.struct_mutex);
>   	return ret;
>   }