<div dir="ltr"><br><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Apr 27, 2017 at 11:32 AM, Nanley Chery <span dir="ltr"><<a href="mailto:nanleychery@gmail.com" target="_blank">nanleychery@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Signed-off-by: Nanley Chery <<a href="mailto:nanley.g.chery@intel.com">nanley.g.chery@intel.com</a>><br>
---<br>
 src/intel/vulkan/anv_image.c   | 75 ++++++++++++++++++++++++++++++<wbr>+++++-------<br>
 src/intel/vulkan/anv_private.h |  5 +++<br>
 2 files changed, 69 insertions(+), 11 deletions(-)<br>
<br>
diff --git a/src/intel/vulkan/anv_image.c b/src/intel/vulkan/anv_image.c<br>
index 9f3eb52a37..751f2d6026 100644<br>
--- a/src/intel/vulkan/anv_image.c<br>
+++ b/src/intel/vulkan/anv_image.c<br>
@@ -179,6 +179,37 @@ add_clear_value_buffer(struct anv_image * const image,<br>
    image->size += device->isl_dev.ss.size * anv_color_aux_levels(image);<br>
 }<br>
<br>
+/* Populates a buffer with a surface state object that can be used for<br>
+ * resolving the specified subresource of a CCS buffer.<br>
+ */<br>
+void<br>
+anv_fill_ccs_resolve_ss(const struct anv_device * const device,<br>
+                        void * const data, const struct anv_image * const image,<br>
+                        const uint8_t level, const uint32_t layer)<br>
+{<br>
+   assert(device && image && data);<br>
+<br>
+   /* The image subresource must have a color auxiliary buffer. */<br>
+   assert(level < anv_color_aux_levels(image));<br>
+   assert(layer < anv_color_aux_layers(image, level));<br>
+<br>
+   isl_surf_fill_state(&device-><wbr>isl_dev, data,<br>
+                       .surf = &image->color_surface.isl,<br>
+                       .view = &(struct isl_view) {<br>
+                           .usage = ISL_SURF_USAGE_RENDER_TARGET_<wbr>BIT,<br>
+                           .format = image->color_surface.isl.<wbr>format,<br>
+                           .swizzle = ISL_SWIZZLE_IDENTITY,<br>
+                           .base_level = level,<br>
+                           .levels = 1,<br>
+                           .base_array_layer = layer,<br>
+                           .array_len = 1,<br>
+                        },<br>
+                       .aux_surf = &image->aux_surface.isl,<br>
+                       .aux_usage = image->aux_usage == ISL_AUX_USAGE_NONE ?<br>
+                                    ISL_AUX_USAGE_CCS_D : image->aux_usage,<br>
+                       .mocs = device->default_mocs);<br>
+}<br>
+<br>
 /**<br>
  * Initialize the anv_image::*_surface selected by \a aspect. Then update the<br>
  * image's memory requirements (that is, the image's size and alignment).<br>
@@ -411,6 +442,9 @@ VkResult anv_BindImageMemory(<br>
    image->bo = &mem->bo;<br>
    image->offset = memoryOffset;<br>
<br>
+   /* The data after the main surface must be initialized for various<br>
+    * reasons.<br>
+    */<br>
    if (image->aux_surface.isl.size > 0) {<br>
<br>
       /* The offset must be a multiple of 4K or else the anv_gem_mmap call<br>
@@ -418,16 +452,11 @@ VkResult anv_BindImageMemory(<br>
        */<br>
       assert((image->offset + image->aux_surface.offset) % 4096 == 0);<br>
<br>
-      /* Auxiliary surfaces need to have their memory cleared to 0 before they<br>
-       * can be used.  For CCS surfaces, this puts them in the "resolved"<br>
-       * state so they can be used with CCS enabled before we ever touch it<br>
-       * from the GPU.  For HiZ, we need something valid or else we may get<br>
-       * GPU hangs on some hardware and 0 works fine.<br>
-       */<br>
-      void *map = anv_gem_mmap(device, image->bo->gem_handle,<br>
-                               image->offset + image->aux_surface.offset,<br>
-                               image->aux_surface.isl.size,<br>
-                               device->info.has_llc ? 0 : I915_MMAP_WC);<br>
+      const uint32_t image_map_size = image->size - image->aux_surface.offset;<br>
+      void * const map = anv_gem_mmap(device, image->bo->gem_handle,<br>
+                                      image->offset + image->aux_surface.offset,<br>
+                                      image_map_size,<br>
+                                      device->info.has_llc ? 0 : I915_MMAP_WC);<br>
<br>
       /* If anv_gem_mmap returns NULL, it's likely that the kernel was<br>
        * not able to find space on the host to create a proper mapping.<br>
@@ -435,9 +464,33 @@ VkResult anv_BindImageMemory(<br>
       if (map == NULL)<br>
          return vk_error(VK_ERROR_OUT_OF_HOST_<wbr>MEMORY);<br>
<br>
+      /* Auxiliary surfaces need to have their memory cleared to 0 before they<br>
+       * can be used.  For CCS surfaces, this puts them in the "resolved"<br>
+       * state so they can be used with CCS enabled before we ever touch it<br>
+       * from the GPU.  For HiZ, we need something valid or else we may get<br>
+       * GPU hangs on some hardware and 0 works fine.<br>
+       */<br>
       memset(map, 0, image->aux_surface.isl.size);<br>
<br>
-      anv_gem_munmap(map, image->aux_surface.isl.size);<br>
+      /* For color auxiliary surfaces, the clear values buffer must be<br>
+       * initialized. This is because a render pass attachment's loadOp may be<br>
+       * LOAD_OP_LOAD, triggering a GPU memcpy from the clear values buffer<br>
+       * into the surface state object. Pre-SKL, the dword containing the clear<br>
+       * values also contains other fields, so we need to initialize those<br>
+       * fields to match the values for a color attachment. On SKL+, the MCS<br>
+       * surface state only allows 1/0 clear colors. Using the fill function<br>
+       * for a CCS resolve state also gives the desired result for MCS images.<br>
+       */<br></blockquote><div><br></div><div>Ugh... So, I now have a good argument for not storing full surface states but I don't really like it....<br><br></div><div>Short version: We really badly need to stop initializing things from the CPU in BindImageMemory.<br><br></div><div>Longer version: Vulkan allows the client to alias memory.  In other words, they can have, for instance a depth image and a color image bound to overlapping memory locations so long as they transition things properly.  In particular, if they most recently used it as a color image and they want to use it as a depth image, they have to transition from UNDEFINED to whatever layout they want.  Then, when they want to go back to using the depth image, they transition it from UNDEFINED to whatever.  This may sound crazy but it can allow an application to significantly reduce its memory footprint if it has temporary images that it uses in its rendering pipeline but never at the same time.  Today, thanks to memset hacks, we don't support this properly.<br><br></div><div>We really need to switch depth and color over to doing the initialization during the UNDEFINED -> whatever layout transition instead of the memset.  For the clear color values, this means that we need to either initialize the whole thing from the GPU on the UNDEFINED transition or else we need to make sure that we don't store anything important in the clear color values other than the clear color itself.  It should be fairly easy to use the CS ALU to mask the clear color and OR it into the surface state packet.<br></div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
+      if (image->aspects == VK_IMAGE_ASPECT_COLOR_BIT &&<br>
+          (device->info.gen <= 8 || image->samples > 1)) {<br>
+         for (uint8_t lod = 0; lod < anv_color_aux_levels(image); ++lod) {<br>
+            anv_fill_ccs_resolve_ss(<wbr>device, map + image->aux_surface.isl.size +<br>
+                                    device->isl_dev.ss.size * lod,<br>
+                                    image, lod, 0);<br>
+         }<br>
+      }<br>
+<br>
+      anv_gem_munmap(map, image_map_size);<br>
    }<br>
<br>
    return VK_SUCCESS;<br>
diff --git a/src/intel/vulkan/anv_<wbr>private.h b/src/intel/vulkan/anv_<wbr>private.h<br>
index ac71537e88..12531264d5 100644<br>
--- a/src/intel/vulkan/anv_<wbr>private.h<br>
+++ b/src/intel/vulkan/anv_<wbr>private.h<br>
@@ -2019,6 +2019,11 @@ anv_color_aux_layers(const struct anv_image * const image,<br>
                image->aux_surface.isl.<wbr>logical_level0_px.depth >> miplevel);<br>
 }<br>
<br>
+void<br>
+anv_fill_ccs_resolve_ss(const struct anv_device * const device,<br>
+                        void * const data, const struct anv_image * const image,<br>
+                        const uint8_t level, const uint32_t layer);<br>
+<br>
 /* Returns true if a HiZ-enabled depth buffer can be sampled from. */<br>
 static inline bool<br>
 anv_can_sample_with_hiz(const struct gen_device_info * const devinfo,<br>
<span class="HOEnZb"><font color="#888888">--<br>
2.12.2<br>
<br>
______________________________<wbr>_________________<br>
mesa-dev mailing list<br>
<a href="mailto:mesa-dev@lists.freedesktop.org">mesa-dev@lists.freedesktop.org</a><br>
<a href="https://lists.freedesktop.org/mailman/listinfo/mesa-dev" rel="noreferrer" target="_blank">https://lists.freedesktop.org/<wbr>mailman/listinfo/mesa-dev</a><br>
</font></span></blockquote></div><br></div></div>