<div dir="ltr"><br><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Nov 1, 2016 at 2:57 PM, Chris Wilson <span dir="ltr"><<a href="mailto:chris@chris-wilson.co.uk" target="_blank">chris@chris-wilson.co.uk</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5">On Fri, Oct 28, 2016 at 03:14:29AM +0100, Robert Bragg wrote:<br>
> This adds 'compute', 'compute extended', 'memory reads', 'memory writes'<br>
> and 'sampler balance' metric sets for Haswell.<br>
><br>
> The code is auto generated from an XML description of metric sets,<br>
> currently maintained in gputop, ref:<br>
><br>
>  <a href="https://github.com/rib/gputop" rel="noreferrer" target="_blank">https://github.com/rib/gputop</a><br>
>  > gputop-data/oa-*.xml<br>
>  > scripts/i915-perf-kernelgen.py<br>
><br>
>  $ make -C gputop-data -f Makefile.xml<br>
><br>
> Signed-off-by: Robert Bragg <<a href="mailto:robert@sixbynine.org">robert@sixbynine.org</a>><br>
> Reviewed-by: Matthew Auld <<a href="mailto:matthew.auld@intel.com">matthew.auld@intel.com</a>><br>
> ---<br>
>  drivers/gpu/drm/i915/i915_oa_<wbr>hsw.c | 559 ++++++++++++++++++++++++++++++<wbr>++++++-<br>
>  1 file changed, 558 insertions(+), 1 deletion(-)<br>
><br>
> diff --git a/drivers/gpu/drm/i915/i915_<wbr>oa_hsw.c b/drivers/gpu/drm/i915/i915_<wbr>oa_hsw.c<br>
> index 6af25cf..4ddf756 100644<br>
> --- a/drivers/gpu/drm/i915/i915_<wbr>oa_hsw.c<br>
> +++ b/drivers/gpu/drm/i915/i915_<wbr>oa_hsw.c<br>
> @@ -31,9 +31,14 @@<br>
><br>
>  enum metric_set_id {<br>
>       METRIC_SET_ID_RENDER_BASIC = 1,<br>
> +     METRIC_SET_ID_COMPUTE_BASIC,<br>
> +     METRIC_SET_ID_COMPUTE_<wbr>EXTENDED,<br>
> +     METRIC_SET_ID_MEMORY_READS,<br>
> +     METRIC_SET_ID_MEMORY_WRITES,<br>
> +     METRIC_SET_ID_SAMPLER_BALANCE,<br>
>  };<br>
><br>
> -int i915_oa_n_builtin_metric_sets_<wbr>hsw = 1;<br>
> +int i915_oa_n_builtin_metric_sets_<wbr>hsw = 6;<br>
><br>
>  static const struct i915_oa_reg b_counter_config_render_basic[<wbr>] = {<br>
>       { _MMIO(0x2724), 0x00800000 },<br>
> @@ -112,6 +117,298 @@ get_render_basic_mux_config(<wbr>struct drm_i915_private *dev_priv,<br>
>       return mux_config_render_basic;<br>
>  }<br>
><br>
> +static const struct i915_oa_reg b_counter_config_compute_<wbr>basic[] = {<br>
> +     { _MMIO(0x2710), 0x00000000 },<br>
> +     { _MMIO(0x2714), 0x00800000 },<br>
> +     { _MMIO(0x2718), 0xaaaaaaaa },<br>
> +     { _MMIO(0x271c), 0xaaaaaaaa },<br>
> +     { _MMIO(0x2720), 0x00000000 },<br>
> +     { _MMIO(0x2724), 0x00800000 },<br>
> +     { _MMIO(0x2728), 0xaaaaaaaa },<br>
> +     { _MMIO(0x272c), 0xaaaaaaaa },<br>
> +     { _MMIO(0x2740), 0x00000000 },<br>
> +     { _MMIO(0x2744), 0x00000000 },<br>
> +     { _MMIO(0x2748), 0x00000000 },<br>
> +     { _MMIO(0x274c), 0x00000000 },<br>
> +     { _MMIO(0x2750), 0x00000000 },<br>
> +     { _MMIO(0x2754), 0x00000000 },<br>
> +     { _MMIO(0x2758), 0x00000000 },<br>
> +     { _MMIO(0x275c), 0x00000000 },<br>
> +     { _MMIO(0x236c), 0x00000000 },<br>
> +};<br>
> +<br>
> +static const struct i915_oa_reg mux_config_compute_basic[] = {<br>
> +     { _MMIO(0x253a4), 0x00000000 },<br>
> +     { _MMIO(0x2681c), 0x01f00800 },<br>
> +     { _MMIO(0x26820), 0x00001000 },<br>
> +     { _MMIO(0x2781c), 0x01f00800 },<br>
> +     { _MMIO(0x26520), 0x00000007 },<br>
> +     { _MMIO(0x265a0), 0x00000007 },<br>
> +     { _MMIO(0x25380), 0x00000010 },<br>
> +     { _MMIO(0x2538c), 0x00300000 },<br>
> +     { _MMIO(0x25384), 0xaa8aaaaa },<br>
> +     { _MMIO(0x25404), 0xffffffff },<br>
> +     { _MMIO(0x26800), 0x00004202 },<br>
> +     { _MMIO(0x26808), 0x00605817 },<br>
> +     { _MMIO(0x2680c), 0x10001005 },<br>
> +     { _MMIO(0x26804), 0x00000000 },<br>
> +     { _MMIO(0x27800), 0x00000102 },<br>
> +     { _MMIO(0x27808), 0x0c0701e0 },<br>
> +     { _MMIO(0x2780c), 0x000200a0 },<br>
> +     { _MMIO(0x27804), 0x00000000 },<br>
> +     { _MMIO(0x26484), 0x44000000 },<br>
> +     { _MMIO(0x26704), 0x44000000 },<br>
> +     { _MMIO(0x26500), 0x00000006 },<br>
> +     { _MMIO(0x26510), 0x00000001 },<br>
> +     { _MMIO(0x26504), 0x88000000 },<br>
> +     { _MMIO(0x26580), 0x00000006 },<br>
> +     { _MMIO(0x26590), 0x00000020 },<br>
> +     { _MMIO(0x26584), 0x00000000 },<br>
> +     { _MMIO(0x26104), 0x55822222 },<br>
> +     { _MMIO(0x26184), 0xaa866666 },<br>
> +     { _MMIO(0x25420), 0x08320c83 },<br>
> +     { _MMIO(0x25424), 0x06820c83 },<br>
> +     { _MMIO(0x2541c), 0x00000000 },<br>
> +     { _MMIO(0x25428), 0x00000c03 },<br>
> +};<br>
> +<br>
> +static const struct i915_oa_reg *<br>
> +get_compute_basic_mux_config(<wbr>struct drm_i915_private *dev_priv,<br>
> +                          int *len)<br>
> +{<br>
> +     *len = ARRAY_SIZE(mux_config_compute_<wbr>basic);<br>
> +     return mux_config_compute_basic;<br>
> +}<br>
<br>
</div></div><span class="">> @@ -140,6 +437,106 @@ int i915_oa_select_metric_set_hsw(<wbr>struct drm_i915_private *dev_priv)<br>
>                       ARRAY_SIZE(b_counter_config_<wbr>render_basic);<br>
><br>
>               return 0;<br>
> +     case METRIC_SET_ID_COMPUTE_BASIC:<br>
> +             dev_priv->perf.oa.mux_regs =<br>
> +                     get_compute_basic_mux_config(<wbr>dev_priv,<br>
> +                                                  &dev_priv->perf.oa.mux_regs_<wbr>len);<br>
> +             if (!dev_priv->perf.oa.mux_regs) {<br>
> +                     DRM_DEBUG_DRIVER("No suitable MUX config for \"COMPUTE_BASIC\" metric set");<br>
> +<br>
> +                     /* EINVAL because *_register_sysfs already checked this<br>
> +                      * and so it wouldn't have been advertised so userspace and<br>
> +                      * so shouldn't have been requested<br>
> +                      */<br>
> +                     return -EINVAL;<br>
> +             }<br>
> +<br>
> +             dev_priv->perf.oa.b_counter_<wbr>regs =<br>
> +                     b_counter_config_compute_<wbr>basic;<br>
> +             dev_priv->perf.oa.b_counter_<wbr>regs_len =<br>
> +                     ARRAY_SIZE(b_counter_config_<wbr>compute_basic);<br>
> +<br>
> +             return 0;<br>
<br>
</span><span class="">>  int<br>
>  i915_perf_register_sysfs_hsw(<wbr>struct drm_i915_private *dev_priv)<br>
>  {<br>
> @@ -178,9 +685,49 @@ i915_perf_register_sysfs_hsw(<wbr>struct drm_i915_private *dev_priv)<br>
>               if (ret)<br>
>                       goto error_render_basic;<br>
>       }<br>
> +     if (get_compute_basic_mux_config(<wbr>dev_priv, &mux_len)) {<br>
<br>
</span>Why not use the derived state in dev_priv->perf.oa.mux_regs? Then we<br>
only expose what is initialised.<br></blockquote><div><br></div><div>Although for Haswell none of our metric sets have conditional MUX configurations, the generated code should already be in shape to only advertising metric sets applicable to the system (which becomes an issue for gen8+). This was changed relatively recently in the gen8+ series after Mark Janes was hitting issues on Skylake in some of his tooling due to Mesa advertising one of the compute metric sets that wasn't really available on the system he had, which was only discoverable as a GL error when attempting to use it.<br><br></div><div>The perf.oa.mux_regs state only pertains to one current metric set that the OA unit has been configured with, after calling the generated i915_oa_select_metric_set_hsw() function in hsw_enable_metric_set(). Until an OA stream is opened and enabled perf.oa.mux_regs won't be initialised.<br><br>Notably the recent change for gen8+ mentioned above was to have the _select_metric_set_<gen>() code and the _register_sysfs_<gen>() code both work in terms of the get_<metric_set>_mux_config() functions since it's these functions that will check the fiddly sku specfic details on gen8+ to select the right MUX config or potentially fail if the metric set isn't available on the current system. So for gen8+ we can expect get_compute_basic_mux_config() will fail if the config isn't available and then won't be advertised via sysfs. On Haswell it looks a little redundant having these get_ functions unconditionally return a pointer to a corresponding array.<br><br></div>Hope that clarifies,<br></div><div class="gmail_quote">- Robert<br></div><div class="gmail_quote"><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<span class="HOEnZb"><font color="#888888">-Chris<br>
<br>
--<br>
Chris Wilson, Intel Open Source Technology Centre<br>
</font></span></blockquote></div><br></div></div>