<br><div class="gmail_quote">Hi Behdad and Jonathan<br><br><br><br><div class="gmail_quote"><div class="im">On Mon, May 28, 2012 at 7:04 AM, Behdad Esfahbod <span dir="ltr"><<a href="mailto:behdad@behdad.org" target="_blank">behdad@behdad.org</a>></span> wrote:<br>

</div><div class="im"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hello HarfBuzz lists,<br>
<br>
I promised to write a short report about the hackfest earlier this month.<br>
Here's it is.<br>
<br>
Jonathan Kew (Mozilla) and I met at the Google Zurich offices on May 9..11 for<br>
the HarfBuzz Massala Hackfest.  We got together for three days of 12+ hours<br>
intense hacking on the new HarfBuzz Indic shaper, using Wikipedia word list as<br>
test suite.<br></blockquote></div><div> <br>
Thanks for the update on indic shaper. I tried out the code on Ubuntu 
12.04 and was able to experiment with utility programs with Telugu 
strings. I am delighted to see the framework enabling independent 
testing without native knowledge of language.</div><blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div class="im">
<br>
We started with the Devanagari script, testing against Uniscribe (Windows 7's<br>
implementation).  Initially we were failing on 35% of the words in the list.<br>
Three days, 86 commits, and dozens cups of coffee later, we got down to 0.08%.<br>
 Out of the ~700,000 words, we disagree only on 560.  Of those 560, many are<br>
invalid or meaningless Devanagari sequences, not character combinations that<br>
ever occur in correctly-spelled words. In these cases we are less concerned to<br>
precisely match Uniscribe's behavior.<br>
<br>
We discovered a number of bugs or peculiarities in Uniscribe.  We can do<br>
better in some of those cases (and we do).  But for testing purposes, we added<br>
a "uniscribe-bug-compatibility" mode to the Indic shaper.  The numbers above<br>
were in that mode.<br></div>
--cut--<br></blockquote><div>Can you let us know more details on your testing like 
 how Uniscribe has  been setup to produce the  glyph sequences and how 
the comparison of the rendering results were done along with a sample extract of wordlist for one language?<br></div><div> </div></div>
<br>Looking forward to seeing Telugu and other languages supported and integrated to Pango 
soon.  <br><br>
Regards<span class="HOEnZb"><font color="#888888"><br>
Arjuna
</font></span></div><br>