<div dir="ltr">Oh oh!  Can you point us to the tutorial page?<div><br></div><div>Nate, can you fix this please?</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Apr 11, 2019 at 5:24 PM Paul Daughetee <<a href="mailto:Daughetee@finaldraft.com">Daughetee@finaldraft.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Thanks Richard for the pointer. I wish I had seen Jonathan's post. However, it never appeared in the digest I received from the list (nor to me directly) so I never saw it. To be fair, the following is from the HarfBuzz tutorial on the "Why do I need a shaping engine?" page:  "For example, in Tamil, when the letter "TTA" (ட) letter is followed by "U" (உ), the pair must be replaced by the single glyph "டு". The sequence of Unicode characters "டஉ" needs to be substituted with a single "டு" glyph from the font." So maybe that needs an edit.<br>
<br>
I converted my UTF-8 string to be [0xE0, 0xAE, 0x88, 0xE0, 0xAE, 0x9F, 0xE0, 0xAF, 0x81] and I finally got back the correct glyph identifiers. So thank you all for your responses. I'm sure I'll have more questions as this project evolves.<br>
<br>
-----Original Message-----<br>
From: Richard Wordingham <<a href="mailto:richard.wordingham@ntlworld.com" target="_blank">richard.wordingham@ntlworld.com</a>> <br>
Sent: April 11, 2019 12:16 PM<br>
To: <a href="mailto:harfbuzz@lists.freedesktop.org" target="_blank">harfbuzz@lists.freedesktop.org</a><br>
Cc: Paul Daughetee <<a href="mailto:Daughetee@finaldraft.com" target="_blank">Daughetee@finaldraft.com</a>><br>
Subject: Re: [HarfBuzz] Question on converting UTF-8 codepoints to complex glyphs<br>
<br>
On Thu, 11 Apr 2019 18:03:10 +0000<br>
Paul Daughetee <<a href="mailto:Daughetee@finaldraft.com" target="_blank">Daughetee@finaldraft.com</a>> wrote:<br>
<br>
>  டு  [...]<br>
> is the ligature formed by the codepoints corresponding to the glyphs ட <br>
> and உ.<br>
<br>
No!  You already have been told by Jonathan Kew.<br>
<br>
டு is the codepoint sequence <U+0B9F TAMIL LETTER TTA, U+0BC1 TAMIL VOWEL SIGN U>; it is **not** the ligature of ட <U+0B9F TAMIL LETTER<br>
TTA> and உ <u+0B89 TAMIL LETTER U> .  If you don't believe me, paste<br>
them into Word and use alt/X to convert the characters to their codepoints.<br>
<br>
Richard.<br>
_______________________________________________<br>
HarfBuzz mailing list<br>
<a href="mailto:HarfBuzz@lists.freedesktop.org" target="_blank">HarfBuzz@lists.freedesktop.org</a><br>
<a href="https://lists.freedesktop.org/mailman/listinfo/harfbuzz" rel="noreferrer" target="_blank">https://lists.freedesktop.org/mailman/listinfo/harfbuzz</a></blockquote></div><br clear="all"><div><br></div>-- <br><div dir="ltr" class="gmail_signature">behdad<br><a href="http://behdad.org/" target="_blank">http://behdad.org/</a></div>