<div dir="ltr"><div class="gmail_default" style="font-family:monospace,monospace">I tried building Mesa on OS X, but I'm not nearly as familiar with development on OS X, so I wasn't able to get it to build.  If someone could build / test that on OS X, it would certainly give more confidence in its correctness.  I *think* the generated code is correct, but you know how that is.</div><div class="gmail_default" style="font-family:monospace,monospace"><br></div><div class="gmail_default" style="font-family:monospace,monospace">If there is no need for this on OS X any longer, then the best thing might be to remove it entirely.</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Sat, Sep 26, 2015 at 5:56 PM, Jeremy Huddleston Sequoia <span dir="ltr"><<a href="mailto:jeremyhu@apple.com" target="_blank">jeremyhu@apple.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Reviewing diffs of code that generates code is always ick. =(<br>
<br>
This *looks* right to me, but has it been given a beating for correctness?  If not, let me know, and I'll give it a whirl when I have some cycles.<br>
<br>
Reviewed-by: Jeremy Huddleston Sequoia <<a href="mailto:jeremyhu@apple.com">jeremyhu@apple.com</a>><br>
<br>
---<br>
<br>
You're right that this used to be use in xserver as well, but that was removed in:<br>
<br>
commit e61e19959d9138d5b81b1f25b7aa3e257918170d<br>
Author: Adam Jackson <<a href="mailto:ajax@redhat.com">ajax@redhat.com</a>><br>
Date:   Tue Dec 3 13:45:43 2013 -0500<br>
<br>
    xquartz/glx: Convert to non-glapi dispatch<br>
<br>
    CGL doesn't have anything like glXGetProcAddress, and the old code just<br>
    called down to dlsym in any case.  It's a little mind-warping since<br>
    dlopening a framework actually loads multiple dylibs, but that's just<br>
    how OSX rolls.<br>
<br>
    Signed-off-by: Adam Jackson <<a href="mailto:ajax@redhat.com">ajax@redhat.com</a>><br>
    Reviewed-by: Jeremy Huddleston Sequoia <<a href="mailto:jeremyhu@apple.com">jeremyhu@apple.com</a>><br>
<div class="HOEnZb"><div class="h5"><br>
<br>
> On Sep 22, 2015, at 15:55, Ian Romanick <<a href="mailto:idr@freedesktop.org">idr@freedesktop.org</a>> wrote:<br>
><br>
> On 09/17/2015 03:19 PM, Arlie Davis wrote:<br>
>> Ok, here's v2 of the change, with the suggested edits.<br>
><br>
> So... I think this code is fine, and I admire the effort.  I have a<br>
> couple concerns.<br>
><br>
> 1. We have no way to test this, so it's quite possible something was broken.<br>
><br>
> 2. This function is only used in the OSX builds.  Jeremy is the<br>
> maintainer for those builds, so I've added him to the CC list.<br>
><br>
> For every non-OSX build, we should just stop linking<br>
> src/mapi/glapi/glapi_gentable.c.  I thought maybe the X sever used it,<br>
> but I couldn't find any evidence of that.<br>
><br>
> If this is still a viable route, I have a few suggestions of follow-on<br>
> patches...<br>
><br>
> I guess this patch is<br>
><br>
> Reviewed-by: Ian Romanick <<a href="mailto:ian.d.romanick@intel.com">ian.d.romanick@intel.com</a>><br>
><br>
> but I really think we need to get Jeremy's approval before pushing it.<br>
><br>
>> From 5f393faa058f453408dfc640eecae3fe6335dfed Mon Sep 17 00:00:00 2001<br>
>> From: Arlie Davis <<a href="mailto:arlied@google.com">arlied@google.com</a>><br>
>> Date: Tue, 15 Sep 2015 09:58:34 -0700<br>
>> Subject: [PATCH] This patch significantly reduces the size of the libGL.so<br>
>> binary. It does not change the (externally visible) behavior of libGL.so at<br>
>> all.<br>
>><br>
>> gl_gentable.py generates a function, _glapi_create_table_from_handle.<br>
>> This function allocates a large dispatch table, consisting of 1300 or so<br>
>> function pointers, and fills this dispatch table by doing symbol lookups<br>
>> on a given shared library.  Previously, gl_gentable.py would generate a<br>
>> single, very large _glapi_create_table_from_handle function, with a short<br>
>> cluster of lines for each entry point (function).  The idiom it generates<br>
>> was a NULL check, a call to snprintf, a call to dlsym / GetProcAddress,<br>
>> and then a store into the dispatch table.  Since this function processes<br>
>> a large number of entry points, this code is duplicated many times over.<br>
>><br>
>> We can encode the same information much more compactly, by using a lookup<br>
>> table.  The previous total size of _glapi_create_table_from_handle on x64<br>
>> was 125848 bytes.  By using a lookup table, the size of<br>
>> _glapi_create_table_from_handle (and the related lookup tables) is reduced<br>
>> to 10840 bytes.  In other words, this enormous function is reduced by 91%.<br>
>> The size of the entire libGL.so binary (measured when stripped) itself drops<br>
>> by 15%.<br>
>><br>
>> So the purpose of this change is to reduce the binary size, which frees up<br>
>> disk space, memory, etc.<br>
>> ---<br>
>> src/mapi/glapi/gen/gl_gentable.py | 57 ++++++++++++++++++++++++++++-----------<br>
>> 1 file changed, 41 insertions(+), 16 deletions(-)<br>
>><br>
>> diff --git a/src/mapi/glapi/gen/gl_gentable.py b/src/mapi/glapi/gen/gl_gentable.py<br>
>> index 1b3eb72..7cd475a 100644<br>
>> --- a/src/mapi/glapi/gen/gl_gentable.py<br>
>> +++ b/src/mapi/glapi/gen/gl_gentable.py<br>
>> @@ -113,6 +113,9 @@ __glapi_gentable_set_remaining_noop(struct _glapi_table *disp) {<br>
>>             dispatch[i] = p.v;<br>
>> }<br>
>><br>
>> +"""<br>
>> +<br>
>> +footer = """<br>
>> struct _glapi_table *<br>
>> _glapi_create_table_from_handle(void *handle, const char *symbol_prefix) {<br>
>>     struct _glapi_table *disp = calloc(_glapi_get_dispatch_table_size(), sizeof(_glapi_proc));<br>
>> @@ -123,27 +126,28 @@ _glapi_create_table_from_handle(void *handle, const char *symbol_prefix) {<br>
>><br>
>>     if(symbol_prefix == NULL)<br>
>>         symbol_prefix = "";<br>
>> -"""<br>
>><br>
>> -footer = """<br>
>> -    __glapi_gentable_set_remaining_noop(disp);<br>
>> -<br>
>> -    return disp;<br>
>> -}<br>
>> -"""<br>
>> +    /* Note: This code relies on _glapi_table_func_names being sorted by the<br>
>> +     * entry point index of each function.<br>
>> +     */<br>
>> +    for (int func_index = 0; func_index < GLAPI_TABLE_COUNT; ++func_index) {<br>
>> +        const char *name = _glapi_table_func_names[func_index];<br>
>> +        void ** procp = &((void **)disp)[func_index];<br>
>><br>
>> -body_template = """<br>
>> -    if(!disp->%(name)s) {<br>
>> -        void ** procp = (void **) &disp->%(name)s;<br>
>> -        snprintf(symboln, sizeof(symboln), "%%s%(entry_point)s", symbol_prefix);<br>
>> +        snprintf(symboln, sizeof(symboln), \"%s%s\", symbol_prefix, name);<br>
>> #ifdef _WIN32<br>
>>         *procp = GetProcAddress(handle, symboln);<br>
>> #else<br>
>>         *procp = dlsym(handle, symboln);<br>
>> #endif<br>
>>     }<br>
>> +    __glapi_gentable_set_remaining_noop(disp);<br>
>> +<br>
>> +    return disp;<br>
>> +}<br>
>> """<br>
>><br>
>> +<br>
>> class PrintCode(gl_XML.gl_print_base):<br>
>><br>
>>     def __init__(self):<br>
>> @@ -180,12 +184,33 @@ class PrintCode(gl_XML.gl_print_base):<br>
>><br>
>><br>
>>     def printBody(self, api):<br>
>> -        for f in api.functionIterateByOffset():<br>
>> -            for entry_point in f.entry_points:<br>
>> -                vars = { 'entry_point' : entry_point,<br>
>> -                         'name' : <a href="http://f.name" rel="noreferrer" target="_blank">f.name</a> }<br>
>><br>
>> -                print body_template % vars<br>
>> +        # Determine how many functions have a defined offset.<br>
>> +        func_count = 0<br>
>> +        for f in api.functions_by_name.itervalues():<br>
>> +            if f.offset != -1:<br>
>> +                func_count += 1<br>
>> +<br>
>> +        # Build the mapping from offset to function name.<br>
>> +        funcnames = [None] * func_count<br>
>> +        for f in api.functions_by_name.itervalues():<br>
>> +            if f.offset != -1:<br>
>> +                if not (funcnames[f.offset] is None):<br>
>> +                    raise Exception("Function table has more than one function with same offset (offset %d, func %s)" % (f.offset, <a href="http://f.name" rel="noreferrer" target="_blank">f.name</a>))<br>
>> +                funcnames[f.offset] = <a href="http://f.name" rel="noreferrer" target="_blank">f.name</a><br>
>> +<br>
>> +        # Check that the table has no gaps.  We expect a function at every offset,<br>
>> +        # and the code which generates the table relies on this.<br>
>> +        for i in xrange(0, func_count):<br>
>> +            if funcnames[i] is None:<br>
>> +                raise Exception("Function table has no function at offset %d" % (i))<br>
>> +<br>
>> +        print "#define GLAPI_TABLE_COUNT %d" % func_count<br>
>> +        print "static const char * const _glapi_table_func_names[GLAPI_TABLE_COUNT] = {"<br>
>> +        for i in xrange(0, func_count):<br>
>> +            print "    /* %5d */ \"%s\"," % (i, funcnames[i])<br>
>> +        print "};"<br>
>> +<br>
>>         return<br>
>><br>
>><br>
>><br>
>><br>
>><br>
>><br>
>> On 09/16/2015 07:07 AM, Matt Turner wrote:<br>
>>> On Tue, Sep 15, 2015 at 10:38 AM, Arlie Davis <<a href="mailto:arlied@google.com">arlied@google.com</a>> wrote:<br>
>>>><br>
>>>> Hello!  I noticed an inefficiency in libGL.so, so I thought I'd take a<br>
>>>> stab at fixing it.  This is my first patch submitted to mesa-dev, so<br>
>>>> if I'm doing anything dumb, let me know.  I can't use git send-email,<br>
>>>> but I've formatted the patch using git format-patch, which should<br>
>>>> hopefully produce similar output.  The patch text (below) describes<br>
>>>> the inefficiency and the improvement.<br>
>>>><br>
>>>><br>
>>>><br>
>>>> From 0abde226eed1b9f6052193f36f6cdc060698f621 Mon Sep 17 00:00:00 2001<br>
>>>> From: Arlie Davis <<a href="mailto:arlied@google.com">arlied@google.com</a>><br>
>>>> Date: Tue, 15 Sep 2015 09:58:34 -0700<br>
>>>> Subject: [PATCH] This patch significantly reduces the size of the libGL.so<br>
>>>>  binary. It does not change the (externally visible) behavior of libGL.so at<br>
>>>>  all.<br>
>>>><br>
>>>> gl_gentable.py generates a function, _glapi_create_table_from_handle.<br>
>>>> This function allocates a large dispatch table, consisting of 1300 or so<br>
>>>> function pointers, and fills this dispatch table by doing symbol lookups<br>
>>>> on a given shared library.  Previously, gl_gentable.py would generate a<br>
>>>> single, very large _glapi_create_table_from_handle function, with a short<br>
>>>> cluster of lines for each entry point (function).  The idiom it generates<br>
>>>> was a NULL check, a call to snprintf, a call to dlsym / GetProcAddress,<br>
>>>> and then a store into the dispatch table.  Since this function processes<br>
>>>> a large number of entry points, this code is duplicated many times over.<br>
>>>><br>
>>>> We can encode the same information much more compactly, by using a lookup<br>
>>>> table.  The previous total size of _glapi_create_table_from_handle on x64<br>
>>>> was 125848 bytes.  By using a lookup table, the size of<br>
>>>> _glapi_create_table_from_handle (and the related lookup tables) is reduced<br>
>>>> to 10840 bytes.  In other words, this enormous function is reduced by 91%.<br>
>>>> The size of the entire libGL.so binary (measured when stripped) itself drops<br>
>>>> by 15%.<br>
>>>><br>
>>>> So the purpose of this change is to reduce the binary size, which frees up<br>
>>>> disk space, memory, etc.<br>
>>>> ---<br>
>>><br>
>>> Seems like a nice change. size lib/libGL.so.1.2.0 on my system shows<br>
>>><br>
>>>    text   data    bss    dec    hex filename<br>
>>>  604031  11360   2792 618183  96ec7 lib/libGL.so.1.2.0 before<br>
>>>  490751  21920   2792 515463  7dd87 lib/libGL.so.1.2.0 after<br>
>>><br>
>>> Feel free to include that in the commit message.<br>
>>><br>
>>>>  src/mapi/glapi/gen/gl_gentable.py | 56 ++++++++++++++++++++++++++++-----------<br>
>>>>  1 file changed, 40 insertions(+), 16 deletions(-)<br>
>>>><br>
>>>> diff --git a/src/mapi/glapi/gen/gl_gentable.py b/src/mapi/glapi/gen/gl_gentable.py<br>
>>>> index 1b3eb72..2563b6b 100644<br>
>>>> --- a/src/mapi/glapi/gen/gl_gentable.py<br>
>>>> +++ b/src/mapi/glapi/gen/gl_gentable.py<br>
>>>> @@ -113,6 +113,9 @@ __glapi_gentable_set_remaining_noop(struct _glapi_table *disp) {<br>
>>>>              dispatch[i] = p.v;<br>
>>>>  }<br>
>>>><br>
>>>> +"""<br>
>>>> +<br>
>>>> +footer = """<br>
>>>>  struct _glapi_table *<br>
>>>>  _glapi_create_table_from_handle(void *handle, const char *symbol_prefix) {<br>
>>>>      struct _glapi_table *disp = calloc(_glapi_get_dispatch_table_size(), sizeof(_glapi_proc));<br>
>>>> @@ -123,27 +126,27 @@ _glapi_create_table_from_handle(void *handle, const char *symbol_prefix) {<br>
>>>><br>
>>>>      if(symbol_prefix == NULL)<br>
>>>>          symbol_prefix = "";<br>
>>>> -"""<br>
>>>><br>
>>>> -footer = """<br>
>>>> -    __glapi_gentable_set_remaining_noop(disp);<br>
>>>> -<br>
>>>> -    return disp;<br>
>>>> -}<br>
>>>> -"""<br>
>>>> +    /* Note: This code relies on _glapi_table_func_names being sorted by the<br>
>>>> +       entry point index of each function. */<br>
>>><br>
>>> Mesa style puts the */ on its own line for multiline comments.<br>
>>><br>
>>>> +    for (int func_index = 0; func_index < GLAPI_TABLE_COUNT; ++func_index) {<br>
>>>> +        const char* name = _glapi_table_func_names[func_index];<br>
>>><br>
>>> * goes with the var name, not the type. That is, "char* " should be "char *"<br>
>>><br>
>>>> +        void ** procp = &((void **)disp)[func_index];<br>
>>>><br>
>>>> -body_template = """<br>
>>>> -    if(!disp->%(name)s) {<br>
>>><br>
>>> We're removing the null check. Is that okay to do?<br>
>>><br>
>>>> -        void ** procp = (void **) &disp->%(name)s;<br>
>>>> -        snprintf(symboln, sizeof(symboln), "%%s%(entry_point)s", symbol_prefix);<br>
>>>> +        snprintf(symboln, sizeof(symboln), \"%s%s\", symbol_prefix, name);<br>
>>>>  #ifdef _WIN32<br>
>>>>          *procp = GetProcAddress(handle, symboln);<br>
>>>>  #else<br>
>>>>          *procp = dlsym(handle, symboln);<br>
>>>>  #endif<br>
>>>>      }<br>
>>>> +    __glapi_gentable_set_remaining_noop(disp);<br>
>>>> +<br>
>>>> +    return disp;<br>
>>>> +}<br>
>>>>  """<br>
>>>><br>
>>>> +<br>
>>>>  class PrintCode(gl_XML.gl_print_base):<br>
>>>><br>
>>>>      def __init__(self):<br>
>>>> @@ -180,12 +183,33 @@ class PrintCode(gl_XML.gl_print_base):<br>
>>>><br>
>>>><br>
>>>>      def printBody(self, api):<br>
>>>> -        for f in api.functionIterateByOffset():<br>
>>>> -            for entry_point in f.entry_points:<br>
>>>> -                vars = { 'entry_point' : entry_point,<br>
>>>> -                         'name' : <a href="http://f.name" rel="noreferrer" target="_blank">f.name</a> }<br>
>>>><br>
>>>> -                print body_template % vars<br>
>>>> +        # Determine how many functions have a defined offset.<br>
>>>> +        func_count = 0<br>
>>>> +        for f in api.functions_by_name.itervalues():<br>
>>>> +            if f.offset != -1:<br>
>>>> +                func_count += 1<br>
>>>> +<br>
>>>> +        # Build the mapping from offset to function name.<br>
>>>> +        funcnames = [None] * func_count<br>
>>>> +        for f in api.functions_by_name.itervalues():<br>
>>>> +            if f.offset != -1:<br>
>>>> +                if not (funcnames[f.offset] is None):<br>
>>>> +                    raise Exception("Function table has more than one function with same offset (offset %d, func %s)" % (f.offset, <a href="http://f.name" rel="noreferrer" target="_blank">f.name</a>))<br>
>>>> +                funcnames[f.offset] = <a href="http://f.name" rel="noreferrer" target="_blank">f.name</a><br>
>>>> +<br>
>>>> +        # Check that the table has no gaps.  We expect a function at every offset,<br>
>>>> +        # and the code which generates the table relies on this.<br>
>>>> +        for i in range(0, func_count):<br>
>>><br>
>>> I don't know much python, but I think you want to use xrange instead of range.<br>
>>><br>
>>>> +            if funcnames[i] is None:<br>
>>>> +                raise Exception("Function table has no function at offset %d" % (i))<br>
>>>> +<br>
>>>> +        print "#define GLAPI_TABLE_COUNT %d" % func_count<br>
>>>> +        print "static const char* const _glapi_table_func_names[GLAPI_TABLE_COUNT] = {"<br>
>>><br>
>>> "char*" -> "char *"<br>
>>><br>
>>>> +        for i in range(0, func_count):<br>
>>><br>
>>> xrange instead of range, I think.<br>
>>><br>
>>>> +            print "    /* %5d */ \"%s\"," % (i, funcnames[i])<br>
>>>> +        print "};"<br>
>>>> +<br>
>>>>          return<br>
>> _______________________________________________<br>
>> mesa-dev mailing list<br>
>> <a href="mailto:mesa-dev@lists.freedesktop.org">mesa-dev@lists.freedesktop.org</a><br>
>> <a href="http://lists.freedesktop.org/mailman/listinfo/mesa-dev" rel="noreferrer" target="_blank">http://lists.freedesktop.org/mailman/listinfo/mesa-dev</a><br>
>><br>
><br>
<br>
</div></div></blockquote></div><br></div>