<div dir="ltr">Hi Vincent,<div><br></div><div><span style="font-family:arial,sans-serif;font-size:13px">> Out of curiosity, I think you’re already using ICU,</span></div><div><span style="font-family:arial,sans-serif;font-size:13px">> so why would you use libunibreak and not ICU’s line break iterator?</span><br>

</div><div><span style="font-family:arial,sans-serif;font-size:13px"><br></span></div><div><font face="arial, sans-serif">The truth is that I have not yet started to tackle the issue of line-breaking, so everything is open / vague / frightening at this stage...</font></div>

<div><font face="arial, sans-serif"><br></font></div><div><font face="arial, sans-serif">A+</font></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Tue, Feb 11, 2014 at 2:00 PM, Vincent Isambart <span dir="ltr"><<a href="mailto:vincent.isambart@gmail.com" target="_blank">vincent.isambart@gmail.com</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Ariel,<br>
<br>
Out of curiosity, I think you’re already using ICU, so why would you use libunibreak and not ICU’s line break iterator?<br>
<br>
Thanks,<br>
Vincent<br>
<div class=""><br>
<br>
On Sunday, February 9, 2014 at 18:01, Ariel Malka wrote:<br>
<br>
> Hi Jeremy,<br>
><br>
> I have developed a solution based on Harfbuzz and ICU for rendering Unicode text with C++ and OpenGL from the ground-up:<br>
> <a href="https://github.com/arielm/Unicode" target="_blank">https://github.com/arielm/Unicode</a><br>
><br>
> The topic of line-breaking is also on my agenda (more on the long term, nothing urgent...)<br>
> One of the directions I'm planning to check in the future: <a href="https://github.com/adah1972/libunibreak" target="_blank">https://github.com/adah1972/libunibreak</a><br>
><br>
> I wonder how do you handle topics like font-fallback, script-itemization and BIDI, prior to shaping and line-breaking?<br>
><br>
> Regarding one of your questions, it's easy to pass to Harfbuzz some text previously processed with ICU, as demonstrated here:<br>
> <a href="https://github.com/arielm/Unicode/blob/v4.0.0/Projects/Rendering/src/TextRun.h#L50" target="_blank">https://github.com/arielm/Unicode/blob/v4.0.0/Projects/Rendering/src/TextRun.h#L50</a><br>
><br>
> HTH,<br>
> Ariel<br>
> <a href="http://chronotext.org" target="_blank">http://chronotext.org</a><br>
><br>
><br>
</div><div class="">> On Sat, Feb 8, 2014 at 12:01 AM, Jeremy Moles <<a href="mailto:cubicool@gmail.com">cubicool@gmail.com</a> (mailto:<a href="mailto:cubicool@gmail.com">cubicool@gmail.com</a>)> wrote:<br>
> > Hey guys! I'm working on a Python3-based OpenGL library and I want to use the union of Harfbuzz and libicu to do some (a small subset) of what Pango currently does. I cannot, unfortunately, simply use Pango, as its dependency chain will likely stop my clients' interest dead in its tracks. Further, there are some issues when customizing Pango's rendering model (and I'm not speaking without experience here, I've done it when I wrote osgPango) that aren't ideal to work with.<br>


> ><br>
> > So, I would like to use hb and icu to accomplish some very basic layout in my OpenGL scenes (note: I will also be using Glyphy instead of my own rasterized SDF font textures too). I will need basic left|right|center alignment (potentitally justify, but it isn't a request yet), some basic markup support, etc.<br>


> ><br>
> > I nearly have everything working locally, but the one area I'm having a lot of trouble with is knowing how--and in fact, WHOSE responsibility it is--to determine how to break large lines of text given my sizing constraints. This doesn't appear to be something harfbuzz attempts to do, but it may have helper functions nonetheless.<br>


> ><br>
> > What I'm looking for are a few hints on how people (Behdad?) might tackle this problem. ALL text in this library gets converted in whitespace-normalized UTF8 using libicu and line breaks can only be FORCED by using <p/> or <br/> markup. Otherwise, all breaks should behave similarly to how they do in HTML.<br>


> ><br>
> > If I feed my force-delimited lines of text (that is, break my input feed up by <br>/<p>) one huge chunk at a time to harfbuzz, I can get the extents for each glyph as if I had unlimited X coordinate space. I can use these extents to position as required by the calling function, but again, I'm having trouble determining where it is safe to break.<br>


> ><br>
> > Is this something libicu can handle? Can harfbuzz make it easier?<br>
> ><br>
> > NOTE: When I "whitespace normalize" my string before ever passing it harfbuzz, I use the UBRK API of libicu. There are also functions like:<br>
> ><br>
> > u_isspace()<br>
> ><br>
> > ...which look promising, but it expects a UChar32, which I do not know how to easily fetch while using harfbuzz's UTF8 functions, who operate on potential multibyte chars.<br>
> ><br>
> > Thanks in advance!<br>
> > _______________________________________________<br>
> > HarfBuzz mailing list<br>
</div>> > <a href="mailto:HarfBuzz@lists.freedesktop.org">HarfBuzz@lists.freedesktop.org</a> (mailto:<a href="mailto:HarfBuzz@lists.freedesktop.org">HarfBuzz@lists.freedesktop.org</a>)<br>
> > <a href="http://lists.freedesktop.org/mailman/listinfo/harfbuzz" target="_blank">http://lists.freedesktop.org/mailman/listinfo/harfbuzz</a><br>
><br>
><br>
> _______________________________________________<br>
> HarfBuzz mailing list<br>
> <a href="mailto:HarfBuzz@lists.freedesktop.org">HarfBuzz@lists.freedesktop.org</a> (mailto:<a href="mailto:HarfBuzz@lists.freedesktop.org">HarfBuzz@lists.freedesktop.org</a>)<br>
> <a href="http://lists.freedesktop.org/mailman/listinfo/harfbuzz" target="_blank">http://lists.freedesktop.org/mailman/listinfo/harfbuzz</a><br>
<br>
<br>
<br>
</blockquote></div><br></div>