<p dir="ltr"></p>
<p dir="ltr">On Aug 4, 2016 10:36 PM, <<a href="mailto:Mathias.Froehlich@gmx.net">Mathias.Froehlich@gmx.net</a>> wrote:<br>
><br>
> From: Mathias Fröhlich <<a href="mailto:mathias.froehlich@web.de">mathias.froehlich@web.de</a>><br>
><br>
> Hi Brian,<br>
><br>
> As requested with the initial creation of util/bitscan.h<br>
> now move other bitscan related functions into util.<br>
> Make use of win32 intrinsics for util_last_bit/fls if present.</p>
<p dir="ltr">Of you made material changes during the move, I would suggest two patches: one that only moves stuff and updates files to point at the right headers and another that makes the win32 changes.  That way it's clearer what's changing in the move and it's easier to fix if broken.</p>
<p dir="ltr">> Signed-off-by: Mathias Fröhlich <<a href="mailto:Mathias.Froehlich@web.de">Mathias.Froehlich@web.de</a>><br>
><br>
><br>
> Any testing especially on win32 is apprechiated.<br>
><br>
> Please review<br>
><br>
> Mathias<br>
><br>
><br>
> ---<br>
>  src/compiler/glsl/glsl_to_nir.cpp                 |  2 +-<br>
>  src/gallium/auxiliary/util/u_math.h               | 64 ------------------<br>
>  src/mesa/drivers/dri/i965/brw_cs.c                |  2 +-<br>
>  src/mesa/drivers/dri/i965/brw_draw.c              | 10 +--<br>
>  src/mesa/drivers/dri/i965/brw_fs_nir.cpp          |  6 +-<br>
>  src/mesa/drivers/dri/i965/brw_program.c           |  2 +-<br>
>  src/mesa/drivers/dri/i965/brw_shader.cpp          |  2 +-<br>
>  src/mesa/drivers/dri/i965/brw_vec4_gs_visitor.cpp |  2 +-<br>
>  src/mesa/drivers/dri/i965/brw_wm_surface_state.c  |  2 +-<br>
>  src/mesa/main/imports.h                           | 45 -------------<br>
>  src/mesa/program/prog_to_nir.c                    |  6 +-<br>
>  src/util/bitscan.h                                | 80 +++++++++++++++++++++++<br>
>  12 files changed, 97 insertions(+), 126 deletions(-)<br>
><br>
> diff --git a/src/compiler/glsl/glsl_to_nir.cpp b/src/compiler/glsl/glsl_to_nir.cpp<br>
> index 20302e3..d3cc5b4 100644<br>
> --- a/src/compiler/glsl/glsl_to_nir.cpp<br>
> +++ b/src/compiler/glsl/glsl_to_nir.cpp<br>
> @@ -146,7 +146,7 @@ glsl_to_nir(const struct gl_shader_program *shader_prog,<br>
>     shader-><a href="http://info.name">info.name</a> = ralloc_asprintf(shader, "GLSL%d", shader_prog->Name);<br>
>     if (shader_prog->Label)<br>
>        shader->info.label = ralloc_strdup(shader, shader_prog->Label);<br>
> -   shader->info.num_textures = _mesa_fls(sh->Program->SamplersUsed);<br>
> +   shader->info.num_textures = util_last_bit(sh->Program->SamplersUsed);<br>
>     shader->info.num_ubos = sh->NumUniformBlocks;<br>
>     shader->info.num_abos = shader_prog->NumAtomicBuffers;<br>
>     shader->info.num_ssbos = sh->NumShaderStorageBlocks;<br>
> diff --git a/src/gallium/auxiliary/util/u_math.h b/src/gallium/auxiliary/util/u_math.h<br>
> index 1661e63..a923271 100644<br>
> --- a/src/gallium/auxiliary/util/u_math.h<br>
> +++ b/src/gallium/auxiliary/util/u_math.h<br>
> @@ -347,70 +347,6 @@ util_half_inf_sign(int16_t x)<br>
><br>
><br>
>  /**<br>
> - * Find last bit set in a word.  The least significant bit is 1.<br>
> - * Return 0 if no bits are set.<br>
> - */<br>
> -static inline unsigned<br>
> -util_last_bit(unsigned u)<br>
> -{<br>
> -#if defined(HAVE___BUILTIN_CLZ)<br>
> -   return u == 0 ? 0 : 32 - __builtin_clz(u);<br>
> -#else<br>
> -   unsigned r = 0;<br>
> -   while (u) {<br>
> -       r++;<br>
> -       u >>= 1;<br>
> -   }<br>
> -   return r;<br>
> -#endif<br>
> -}<br>
> -<br>
> -/**<br>
> - * Find last bit set in a word.  The least significant bit is 1.<br>
> - * Return 0 if no bits are set.<br>
> - */<br>
> -static inline unsigned<br>
> -util_last_bit64(uint64_t u)<br>
> -{<br>
> -#if defined(HAVE___BUILTIN_CLZLL)<br>
> -   return u == 0 ? 0 : 64 - __builtin_clzll(u);<br>
> -#else<br>
> -   unsigned r = 0;<br>
> -   while (u) {<br>
> -       r++;<br>
> -       u >>= 1;<br>
> -   }<br>
> -   return r;<br>
> -#endif<br>
> -}<br>
> -<br>
> -/**<br>
> - * Find last bit in a word that does not match the sign bit. The least<br>
> - * significant bit is 1.<br>
> - * Return 0 if no bits are set.<br>
> - */<br>
> -static inline unsigned<br>
> -util_last_bit_signed(int i)<br>
> -{<br>
> -   if (i >= 0)<br>
> -      return util_last_bit(i);<br>
> -   else<br>
> -      return util_last_bit(~(unsigned)i);<br>
> -}<br>
> -<br>
> -/* Returns a bitfield in which the first count bits starting at start are<br>
> - * set.<br>
> - */<br>
> -static inline unsigned<br>
> -u_bit_consecutive(unsigned start, unsigned count)<br>
> -{<br>
> -   assert(start + count <= 32);<br>
> -   if (count == 32)<br>
> -      return ~0;<br>
> -   return ((1u << count) - 1) << start;<br>
> -}<br>
> -<br>
> -/**<br>
>   * Return float bits.<br>
>   */<br>
>  static inline unsigned<br>
> diff --git a/src/mesa/drivers/dri/i965/brw_cs.c b/src/mesa/drivers/dri/i965/brw_cs.c<br>
> index 655adc1..6685acd 100644<br>
> --- a/src/mesa/drivers/dri/i965/brw_cs.c<br>
> +++ b/src/mesa/drivers/dri/i965/brw_cs.c<br>
> @@ -220,7 +220,7 @@ brw_upload_cs_prog(struct brw_context *brw)<br>
>        return;<br>
><br>
>     brw->cs.base.sampler_count =<br>
> -      _mesa_fls(ctx->ComputeProgram._Current->Base.SamplersUsed);<br>
> +      util_last_bit(ctx->ComputeProgram._Current->Base.SamplersUsed);<br>
><br>
>     brw_cs_populate_key(brw, &key);<br>
><br>
> diff --git a/src/mesa/drivers/dri/i965/brw_draw.c b/src/mesa/drivers/dri/i965/brw_draw.c<br>
> index d7a1ba3..9b1e18c 100644<br>
> --- a/src/mesa/drivers/dri/i965/brw_draw.c<br>
> +++ b/src/mesa/drivers/dri/i965/brw_draw.c<br>
> @@ -452,15 +452,15 @@ brw_try_draw_prims(struct gl_context *ctx,<br>
>      * index.<br>
>      */<br>
>     brw->wm.base.sampler_count =<br>
> -      _mesa_fls(ctx->FragmentProgram._Current->Base.SamplersUsed);<br>
> +      util_last_bit(ctx->FragmentProgram._Current->Base.SamplersUsed);<br>
>     brw->gs.base.sampler_count = ctx->GeometryProgram._Current ?<br>
> -      _mesa_fls(ctx->GeometryProgram._Current->Base.SamplersUsed) : 0;<br>
> +      util_last_bit(ctx->GeometryProgram._Current->Base.SamplersUsed) : 0;<br>
>     brw->tes.base.sampler_count = ctx->TessEvalProgram._Current ?<br>
> -      _mesa_fls(ctx->TessEvalProgram._Current->Base.SamplersUsed) : 0;<br>
> +      util_last_bit(ctx->TessEvalProgram._Current->Base.SamplersUsed) : 0;<br>
>     brw->tcs.base.sampler_count = ctx->TessCtrlProgram._Current ?<br>
> -      _mesa_fls(ctx->TessCtrlProgram._Current->Base.SamplersUsed) : 0;<br>
> +      util_last_bit(ctx->TessCtrlProgram._Current->Base.SamplersUsed) : 0;<br>
>     brw->vs.base.sampler_count =<br>
> -      _mesa_fls(ctx->VertexProgram._Current->Base.SamplersUsed);<br>
> +      util_last_bit(ctx->VertexProgram._Current->Base.SamplersUsed);<br>
><br>
>     intel_prepare_render(brw);<br>
>     brw_predraw_set_aux_buffers(brw);<br>
> diff --git a/src/mesa/drivers/dri/i965/brw_fs_nir.cpp b/src/mesa/drivers/dri/i965/brw_fs_nir.cpp<br>
> index c1f413b..117eabe 100644<br>
> --- a/src/mesa/drivers/dri/i965/brw_fs_nir.cpp<br>
> +++ b/src/mesa/drivers/dri/i965/brw_fs_nir.cpp<br>
> @@ -1845,7 +1845,7 @@ fs_visitor::emit_gs_control_data_bits(const fs_reg &vertex_count)<br>
>        fs_reg prev_count = bld.vgrf(BRW_REGISTER_TYPE_UD, 1);<br>
>        abld.ADD(prev_count, vertex_count, brw_imm_ud(0xffffffffu));<br>
>        unsigned log2_bits_per_vertex =<br>
> -         _mesa_fls(gs_compile->control_data_bits_per_vertex);<br>
> +         util_last_bit(gs_compile->control_data_bits_per_vertex);<br>
>        abld.SHR(dword_index, prev_count, brw_imm_ud(6u - log2_bits_per_vertex));<br>
><br>
>        if (per_slot_offset.file != BAD_FILE) {<br>
> @@ -2789,7 +2789,7 @@ fs_visitor::nir_emit_tcs_intrinsic(const fs_builder &bld,<br>
>        if (mask == 0)<br>
>           break;<br>
><br>
> -      unsigned num_components = _mesa_fls(mask);<br>
> +      unsigned num_components = util_last_bit(mask);<br>
>        enum opcode opcode;<br>
><br>
>        /* We can only pack two 64-bit components in a single message, so send<br>
> @@ -4547,7 +4547,7 @@ fs_visitor::nir_emit_texture(const fs_builder &bld, nir_tex_instr *instr)<br>
>                              nir_ssa_def_components_read(&instr->dest.ssa):<br>
>                              (1 << dest_size) - 1;<br>
>        assert(write_mask != 0); /* dead code should have been eliminated */<br>
> -      inst->regs_written = _mesa_fls(write_mask) * dispatch_width / 8;<br>
> +      inst->regs_written = util_last_bit(write_mask) * dispatch_width / 8;<br>
>     } else {<br>
>        inst->regs_written = 4 * dispatch_width / 8;<br>
>     }<br>
> diff --git a/src/mesa/drivers/dri/i965/brw_program.c b/src/mesa/drivers/dri/i965/brw_program.c<br>
> index 7785490..0e55c7b 100644<br>
> --- a/src/mesa/drivers/dri/i965/brw_program.c<br>
> +++ b/src/mesa/drivers/dri/i965/brw_program.c<br>
> @@ -674,7 +674,7 @@ brw_setup_tex_for_precompile(struct brw_context *brw,<br>
>                               struct gl_program *prog)<br>
>  {<br>
>     const bool has_shader_channel_select = brw->is_haswell || brw->gen >= 8;<br>
> -   unsigned sampler_count = _mesa_fls(prog->SamplersUsed);<br>
> +   unsigned sampler_count = util_last_bit(prog->SamplersUsed);<br>
>     for (unsigned i = 0; i < sampler_count; i++) {<br>
>        if (!has_shader_channel_select && (prog->ShadowSamplers & (1 << i))) {<br>
>           /* Assume DEPTH_TEXTURE_MODE is the default: X, X, X, 1 */<br>
> diff --git a/src/mesa/drivers/dri/i965/brw_shader.cpp b/src/mesa/drivers/dri/i965/brw_shader.cpp<br>
> index 559e44c..62bad9b 100644<br>
> --- a/src/mesa/drivers/dri/i965/brw_shader.cpp<br>
> +++ b/src/mesa/drivers/dri/i965/brw_shader.cpp<br>
> @@ -1157,7 +1157,7 @@ brw_assign_common_binding_table_offsets(gl_shader_stage stage,<br>
>                                          uint32_t next_binding_table_offset)<br>
>  {<br>
>     const struct gl_linked_shader *shader = NULL;<br>
> -   int num_textures = _mesa_fls(prog->SamplersUsed);<br>
> +   int num_textures = util_last_bit(prog->SamplersUsed);<br>
><br>
>     if (shader_prog)<br>
>        shader = shader_prog->_LinkedShaders[stage];<br>
> diff --git a/src/mesa/drivers/dri/i965/brw_vec4_gs_visitor.cpp b/src/mesa/drivers/dri/i965/brw_vec4_gs_visitor.cpp<br>
> index 927438f..c5886d4 100644<br>
> --- a/src/mesa/drivers/dri/i965/brw_vec4_gs_visitor.cpp<br>
> +++ b/src/mesa/drivers/dri/i965/brw_vec4_gs_visitor.cpp<br>
> @@ -334,7 +334,7 @@ vec4_gs_visitor::emit_control_data_bits()<br>
>        emit(ADD(dst_reg(prev_count), this->vertex_count,<br>
>                 brw_imm_ud(0xffffffffu)));<br>
>        unsigned log2_bits_per_vertex =<br>
> -         _mesa_fls(c->control_data_bits_per_vertex);<br>
> +         util_last_bit(c->control_data_bits_per_vertex);<br>
>        emit(SHR(dst_reg(dword_index), prev_count,<br>
>                 brw_imm_ud(6 - log2_bits_per_vertex)));<br>
>     }<br>
> diff --git a/src/mesa/drivers/dri/i965/brw_wm_surface_state.c b/src/mesa/drivers/dri/i965/brw_wm_surface_state.c<br>
> index 9bee7dd..a53f9da 100644<br>
> --- a/src/mesa/drivers/dri/i965/brw_wm_surface_state.c<br>
> +++ b/src/mesa/drivers/dri/i965/brw_wm_surface_state.c<br>
> @@ -998,7 +998,7 @@ update_stage_texture_surfaces(struct brw_context *brw,<br>
>     else<br>
>        surf_offset += stage_state->prog_data->binding_table.plane_start[plane];<br>
><br>
> -   unsigned num_samplers = _mesa_fls(prog->SamplersUsed);<br>
> +   unsigned num_samplers = util_last_bit(prog->SamplersUsed);<br>
>     for (unsigned s = 0; s < num_samplers; s++) {<br>
>        surf_offset[s] = 0;<br>
><br>
> diff --git a/src/mesa/main/imports.h b/src/mesa/main/imports.h<br>
> index 05cc5ca..21bcb10 100644<br>
> --- a/src/mesa/main/imports.h<br>
> +++ b/src/mesa/main/imports.h<br>
> @@ -339,51 +339,6 @@ extern unsigned int<br>
>  _mesa_bitcount_64(uint64_t n);<br>
>  #endif<br>
><br>
> -/**<br>
> - * Find the last (most significant) bit set in a word.<br>
> - *<br>
> - * Essentially ffs() in the reverse direction.<br>
> - */<br>
> -static inline unsigned int<br>
> -_mesa_fls(unsigned int n)<br>
> -{<br>
> -#ifdef HAVE___BUILTIN_CLZ<br>
> -   return n == 0 ? 0 : 32 - __builtin_clz(n);<br>
> -#else<br>
> -   unsigned int v = 1;<br>
> -<br>
> -   if (n == 0)<br>
> -      return 0;<br>
> -<br>
> -   while (n >>= 1)<br>
> -       v++;<br>
> -<br>
> -   return v;<br>
> -#endif<br>
> -}<br>
> -<br>
> -/**<br>
> - * Find the last (most significant) bit set in a uint64_t value.<br>
> - *<br>
> - * Essentially ffsll() in the reverse direction.<br>
> - */<br>
> -static inline unsigned int<br>
> -_mesa_flsll(uint64_t n)<br>
> -{<br>
> -#ifdef HAVE___BUILTIN_CLZLL<br>
> -   return n == 0 ? 0 : 64 - __builtin_clzll(n);<br>
> -#else<br>
> -   unsigned int v = 1;<br>
> -<br>
> -   if (n == 0)<br>
> -      return 0;<br>
> -<br>
> -   while (n >>= 1)<br>
> -       v++;<br>
> -<br>
> -   return v;<br>
> -#endif<br>
> -}<br>
><br>
>  static inline bool<br>
>  _mesa_half_is_negative(GLhalfARB h)<br>
> diff --git a/src/mesa/program/prog_to_nir.c b/src/mesa/program/prog_to_nir.c<br>
> index 9e01151..1efd1a1 100644<br>
> --- a/src/mesa/program/prog_to_nir.c<br>
> +++ b/src/mesa/program/prog_to_nir.c<br>
> @@ -887,7 +887,7 @@ setup_registers_and_variables(struct ptn_compile *c)<br>
>     struct nir_shader *shader = b->shader;<br>
><br>
>     /* Create input variables. */<br>
> -   const int num_inputs = _mesa_flsll(c->prog->InputsRead);<br>
> +   const int num_inputs = util_last_bit64(c->prog->InputsRead);<br>
>     for (int i = 0; i < num_inputs; i++) {<br>
>        if (!(c->prog->InputsRead & BITFIELD64_BIT(i)))<br>
>           continue;<br>
> @@ -948,7 +948,7 @@ setup_registers_and_variables(struct ptn_compile *c)<br>
>     }<br>
><br>
>     /* Create output registers and variables. */<br>
> -   int max_outputs = _mesa_fls(c->prog->OutputsWritten);<br>
> +   int max_outputs = util_last_bit(c->prog->OutputsWritten);<br>
>     c->output_regs = rzalloc_array(c, nir_register *, max_outputs);<br>
><br>
>     for (int i = 0; i < max_outputs; i++) {<br>
> @@ -1043,7 +1043,7 @@ prog_to_nir(const struct gl_program *prog,<br>
>     ptn_add_output_stores(c);<br>
><br>
>     s-><a href="http://info.name">info.name</a> = ralloc_asprintf(s, "ARB%d", prog->Id);<br>
> -   s->info.num_textures = _mesa_fls(prog->SamplersUsed);<br>
> +   s->info.num_textures = util_last_bit(prog->SamplersUsed);<br>
>     s->info.num_ubos = 0;<br>
>     s->info.num_abos = 0;<br>
>     s->info.num_ssbos = 0;<br>
> diff --git a/src/util/bitscan.h b/src/util/bitscan.h<br>
> index 4999b74..a5bb34e 100644<br>
> --- a/src/util/bitscan.h<br>
> +++ b/src/util/bitscan.h<br>
> @@ -29,6 +29,7 @@<br>
>  #ifndef BITSCAN_H<br>
>  #define BITSCAN_H<br>
><br>
> +#include <assert.h><br>
>  #include <stdint.h><br>
><br>
>  #if defined(_MSC_VER)<br>
> @@ -146,6 +147,85 @@ u_bit_scan_consecutive_range64(uint64_t *mask, int *start, int *count)<br>
>  }<br>
><br>
><br>
> +/**<br>
> + * Find last bit set in a word.  The least significant bit is 1.<br>
> + * Return 0 if no bits are set.<br>
> + * Essentially ffs() in the reverse direction.<br>
> + */<br>
> +static inline unsigned<br>
> +util_last_bit(unsigned u)<br>
> +{<br>
> +#if defined(HAVE___BUILTIN_CLZ)<br>
> +   return u == 0 ? 0 : 32 - __builtin_clz(u);<br>
> +#elif defined(_MSC_VER) && (_M_IX86 || _M_ARM || _M_AMD64 || _M_IA64)<br>
> +   unsigned long index;<br>
> +   if (_BitScanReverse(&index, u))<br>
> +      return index;<br>
> +   else<br>
> +      return 0;<br>
> +#else<br>
> +   unsigned r = 0;<br>
> +   while (u) {<br>
> +      r++;<br>
> +      u >>= 1;<br>
> +   }<br>
> +   return r;<br>
> +#endif<br>
> +}<br>
> +<br>
> +/**<br>
> + * Find last bit set in a word.  The least significant bit is 1.<br>
> + * Return 0 if no bits are set.<br>
> + * Essentially ffsll() in the reverse direction.<br>
> + */<br>
> +static inline unsigned<br>
> +util_last_bit64(uint64_t u)<br>
> +{<br>
> +#if defined(HAVE___BUILTIN_CLZLL)<br>
> +   return u == 0 ? 0 : 64 - __builtin_clzll(u);<br>
> +#elif defined(_MSC_VER) && (_M_AMD64 || _M_ARM || _M_IA64)<br>
> +   unsigned long index;<br>
> +   if (_BitScanReverse64(&index, u))<br>
> +      return index;<br>
> +   else<br>
> +      return 0;<br>
> +#else<br>
> +   unsigned r = 0;<br>
> +   while (u) {<br>
> +      r++;<br>
> +      u >>= 1;<br>
> +   }<br>
> +   return r;<br>
> +#endif<br>
> +}<br>
> +<br>
> +/**<br>
> + * Find last bit in a word that does not match the sign bit. The least<br>
> + * significant bit is 1.<br>
> + * Return 0 if no bits are set.<br>
> + */<br>
> +static inline unsigned<br>
> +util_last_bit_signed(int i)<br>
> +{<br>
> +   if (i >= 0)<br>
> +      return util_last_bit(i);<br>
> +   else<br>
> +      return util_last_bit(~(unsigned)i);<br>
> +}<br>
> +<br>
> +/* Returns a bitfield in which the first count bits starting at start are<br>
> + * set.<br>
> + */<br>
> +static inline unsigned<br>
> +u_bit_consecutive(unsigned start, unsigned count)<br>
> +{<br>
> +   assert(start + count <= 32);<br>
> +   if (count == 32)<br>
> +      return ~0;<br>
> +   return ((1u << count) - 1) << start;<br>
> +}<br>
> +<br>
> +<br>
>  #ifdef __cplusplus<br>
>  }<br>
>  #endif<br>
> --<br>
> 2.5.5<br>
><br>
> _______________________________________________<br>
> mesa-dev mailing list<br>
> <a href="mailto:mesa-dev@lists.freedesktop.org">mesa-dev@lists.freedesktop.org</a><br>
> <a href="https://lists.freedesktop.org/mailman/listinfo/mesa-dev">https://lists.freedesktop.org/mailman/listinfo/mesa-dev</a><br>
</p>