<div dir="ltr"><div>(I've been out on vacation for the past week and a half so sorry it took so long for me to get to this)<br><br>I'm okay with reverting the initial commit entirely.  At the time I was thinking about the alignment in terms of C++ memory allocation, in which case the struct would be allocated with new and the alignment attribute on the member would ensure that it gets aligned properly, regardless of the underlying cpu arch.  However, since it's actually being allocated with malloc and cast to the struct pointer, the alignment attribute instead is just asserting that the member is aligned, regardless of whether or not it actually is.  Given that, the implementation is definitely the wrong way to go about trying to address this issue.<br><br></div>Please revert.<br></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr">- Chuck<br></div></div></div>
<br><div class="gmail_quote">On Wed, Jul 13, 2016 at 4:15 AM, Nicolai Hähnle <span dir="ltr"><<a href="mailto:nhaehnle@gmail.com" target="_blank">nhaehnle@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5">On 12.07.2016 15:44, Roland Scheidegger wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Am 12.07.2016 um 13:40 schrieb Nicolai Hähnle:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
From: Nicolai Hähnle <<a href="mailto:nicolai.haehnle@amd.com" target="_blank">nicolai.haehnle@amd.com</a>><br>
<br>
This fixes a regression introduced by commit d8d6091a8.<br>
<br>
Heap allocations may be only 8-byte aligned on 32-bit system, and so having<br>
members with 16-byte alignment (such as in the case where pipe_blend_color is<br>
embedded in radeonsi's si_context) is undefined behavior which indeed causes<br>
crashes when compiled with gcc -O3.<br>
<br>
Rather than track down and fix all allocation sites where a pipe_blend_color<br>
may be embedded, assume that the original compiler bug only affects 64-bits.<br>
<br>
Bugzilla: <a href="https://bugs.freedesktop.org/show_bug.cgi?id=96835" rel="noreferrer" target="_blank">https://bugs.freedesktop.org/show_bug.cgi?id=96835</a><br>
Cc: Tim Rowley <<a href="mailto:timothy.o.rowley@intel.com" target="_blank">timothy.o.rowley@intel.com</a>><br>
Cc: Chuck Atkins <<a href="mailto:chuck.atkins@kitware.com" target="_blank">chuck.atkins@kitware.com</a>><br>
Cc: <<a href="mailto:mesa-stable@lists.freedesktop.org" target="_blank">mesa-stable@lists.freedesktop.org</a>><br>
--<br>
This should fix the linked bug report. The big question is whether the<br>
assumption about the original compiler problem is correct?<br>
---<br>
  src/gallium/include/pipe/p_state.h | 7 ++++++-<br>
  1 file changed, 6 insertions(+), 1 deletion(-)<br>
<br>
diff --git a/src/gallium/include/pipe/p_state.h b/src/gallium/include/pipe/p_state.h<br>
index a73a771..1986495 100644<br>
--- a/src/gallium/include/pipe/p_state.h<br>
+++ b/src/gallium/include/pipe/p_state.h<br>
@@ -335,8 +335,13 @@ struct pipe_blend_color<br>
      * unaligned accessors resulting in a segfault.  Specifically several<br>
      * versions of the Intel compiler are known to be affected but it's likely<br>
      * others are as well.<br>
+    *<br>
+    * This only applies on 64-bit architectures, and adding the alignment on<br>
+    * 32-bit architectures causes bugs because heap allocations are not<br>
+    * sufficiently aligned.<br>
      */<br>
-   PIPE_ALIGN_VAR(16) float color[4];<br>
+   PIPE_ALIGN_VAR(sizeof(void *) >= 8 ? 16 : 4)<br>
+   float color[4];<br>
  };<br>
<br>
</blockquote>
<br>
Honestly, I'd rather get rid of it, this gets really hacky. (If the<br>
compiler bug was happening in the driver, it could easily do alignment<br>
on its own, even if possibly at the cost of a copy).<br>
<br>
Note that technically, malloc allocations aren't guaranteed to be 16<br>
byte on a 64bit arch. Rather, malloc() has to honor biggest alignment<br>
for a standard type (and no, __mm128 doesn't count), which on x64 linux<br>
is long double (128bit). No idea if that's the case everywhere (even if<br>
it's not, there's of course some possibility it will return 16 byte<br>
aligned addresses anyway).<br>
</blockquote>
<br></div></div>
Yeah, I'm really not happy about this either. Tim, Chuck, given that the original fix created a new bug, is this something you could just fix in the affected driver instead?<br>
<br>
Nicolai<br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
Roland<br>
<br>
<br>
</blockquote>
</blockquote></div><br></div>