Hi, Everyone,<br><br><b>INDIC TEAM COORDINATION AND PROJECT GOALS<br></b>---------------------------------------------------<br><br>Unless I here objections otherwise, I volunteer to serve as the Harfbuzz Indic Team Testing Coordinator: "Ed Trager" <<a href="mailto:ed.trager@gmail.com" target="_blank">ed.trager@gmail.com</a>><br>

<br>The goal of the project (and my role as coordinator as I see it) is to facilitate the organization and compilation of comprehensive and accurate test data for vetting Indic shaping engines and fonts.  <br><br>The resulting test data will be made available as a public web resource for developer, peer, and public review.  In addition to providing the data in a web-friendly format useful for human review and vetting (<i>see Devanagari draft sample currently at <a href="http://eyegene.ophthy.med.umich.edu/indic/" target="_blank">http://eyegene.ophthy.med.umich.edu/indic/</a></i>), the data will also be downloadable in scripting-friendly formats (XML, JSON) useful for automated testing.<br>

<br>To facilitate these goals, I have already written draft testing framework software (called "Indie") suitable for preparing data reports in required and otherwise useful formats (XHTML, XML, JSON, <i>inter alia</i>).  The software facilitates the organization of test cases into logical groups (<i>reph, rakaar, nukta, pres, abvs</i>, <i>etc.</i>), and will document test conditions and inputs (<i>shaping engine, script, font, test case, description, unicode string values, UTF8 string</i>) and outputs (<i>PNG image of the shaped text, glyph ids, x offsets, y offsets</i>,<i> and other glyph geometry data as requested</i>).  The software will be released under an Open Source license.  <i>The draft software doesn't yet quite do all those things but I am working on it ...</i><br>

<br><b>NEAR-TERM GOALS<br></b>-----------------------<br><br>The near-term goal of the project will be to support the development and testing of Indic script layout in the Harfbuzz OpenType layout engine for the Free Desktop. The near-term focus will be to compile test data for 10 major Indic scripts: <i>Gurmukhi, Devanagari, Gujarati, Bengali, Oriya, Telugu, Kannada, Tamil, Malayalam, and Sinhala</i>.<br>

<br>To an extent, a portion of these data already exist in various forms, but the existing data are scattered among different projects, incomplete, difficult to find, and lack new test cases reflecting the most recent changes in OpenType technology for Indic rendering (per Unicode Consortium Public Review Issue #37).  The goal is therefore to compile all the data in one place where anyone who wants it for any purpose can obtain it easily.<br>

<br>This will be "Phase One" of the project.<br><br><b>LONG-TERM GOALS<br></b>-----------------------<br><br>One primary long-term goal, after completion of "Phase One", will be to include additional Indic and Indic-derived scripts already encoded in Unicode, or soon-to-be-encoded in Unicode.  This will include scripts such as <i>Lepcha, Balinese, Tai Le, and New Tai Lue, inter alia</i>.  To the best of my knowledge, many of these additional Indic- and Indic-derived scripts remain currently unsupported by the any of the major operating systems (Windows, OSX, Linux).  We want to facilitate changing that status quo.  <br>

<br>There is of course no restriction on the use of the test data sets. One "natural" goal is to facilitate support for additional Open Source fonts for existing and new Unicode scripts.  Another natural long term goal is to support continued development of other layout engines, such as the Open Source Graphite engine.  Note that the Indie testing framework is not restricted to Indic and Indic-derived scripts: it can be just as easily used to test scripts such as extended Arabic used for Uyghur (<i>inter alia</i>).<br>

<br>Using the data sets to test proprietary engines such as Uniscribe and OSX's ATSUI/AAT is also possible of course.  For example, it appears that Windows 7 will ship with fonts for Tai Le and New Tai Lue (<i>this may be due to requirements imposed by Mainland China for the sale of computer systems in that country</i>).  It will be interesting to test OpenType support for scripts such as New Tai Lue on any platform that supports it.<br>

<br><b>CURRENT TEAM COMPOSITION<br></b>--------------------------------------<br><br>Following up on Pravin and Harshula's lead, we still unfortunately have empty slots to fill for team leads and members for most of the scripts :-(.  <b><i>If you have good knowledge of one or more of these scripts, please identify yourselves :-).</i></b><br>

<br>The job of individual script team leads and members will be to help find, compile, and vet test data.  Once I get the Indie testing framework software into SVN (<i>in a week or up to a month's time, depending on how busy I am ... </i>), people will be able to add and edit test cases directly.  In the meanwhile, you can coordinate with me and either provide or point out where I can locate electronic resources of the data (<i>For example, Pravin provided a draft PDF document for Devanagari</i>).<br>

<br>Below is what I have so far for each script:<br><br><b>NORTHERN SCRIPTS<br></b>-------------------------<br><br><b>Gurmukhi:<br></b>TEAM: "Gurmukhi (Punjabi) Team Lead - A S Alam" <<a href="mailto:apreet.alam@gmail.com" target="_blank">apreet.alam@gmail.com</a>>,<br>

SUGGESTED WIN7 FONT: raavi.ttf<br>SUGGESTED OPEN SOURCE FONT: saab font from <a href="http://guca.sourceforge.net/" target="_blank">http://guca.sourceforge.net/</a><br>TEST DATA: ?<br><br><b>Devanagari:</b><br>TEAM:<br>   "Devanagari Team Lead - प्रविण सातपुते" <<a href="mailto:pravin.d.s@gmail.com" target="_blank">pravin.d.s@gmail.com</a>><br>

   "Devanagari Team - G Karunakar" <<a href="mailto:indlinux@gmail.com" target="_blank">indlinux@gmail.com</a>><br>SUGGESTED WIN7 FONT: mangal.ttf<br>SUGGESTED OPEN SOURCE FONT: Chandas (v. 1.3+, GPL)<br>
TEST DATA: <br>  * Some draft test cases put online at <a href="http://eyegene.ophthy.med.umich.edu/indic/">http://eyegene.ophthy.med.umich.edu/indic/</a> as an example<br>  * List of practical two consonant conjuncts<br>

<a href="http://indlinux.sourceforge.net/tdata/dev/conjuncts-hi.txt" target="_blank">http://indlinux.sourceforge.net/tdata/dev/conjuncts-hi.txt</a><br>
with some example words<br>
<a href="http://www.indlinux.org/wiki/index.php/Hindi_Conjuncts" target="_blank">http://www.indlinux.org/wiki/index.php/Hindi_Conjuncts</a><br>  *Sample text containing most of Devanagari characters (95% of current<br>
Unicode devanagari range)<br>
<a href="http://indlinux.sourceforge.net/tdata/dev/mahabharat.txt" target="_blank">http://indlinux.sourceforge.net/tdata/dev/mahabharat.txt</a><br>
<br><br><b>Gujarati:</b><br>
TEAM: ?<br>SUGGESTED WIN7 FONT: shruti.ttf<br>SUGGESTED OPEN SOURCE FONT: rekha.ttf from Utkarsh.org<br>TEST DATA: ?<br><br><b>Bengali:</b><br>TEAM: ?<br>
SUGGESTED WIN7 FONT: Shonar.ttf<br>
SUGGESTED OPEN SOURCE FONT: <a href="http://ekushey.org" target="_blank">ekushey.org</a>'s SolaimanLipi font<br>TEST DATA: ?<br>
<br><b>Oriya:</b><br>TEAM: ?<br>
SUGGESTED WIN7 FONT: kalinga.ttf<br>
SUGGESTED OPEN SOURCE FONT: <a href="http://oriya.sarovar.org" target="_blank">oriya.sarovar.org</a>'s utkal.ttf<br>TEST DATA: ?<br>
<br><b>SOUTHERN SCRIPTS<br></b>-------------------------<br><br><b>Telugu:</b><br>TEAM: ?<br>
SUGGESTED WIN7 FONT: gautami.ttf<br>
SUGGESTED OPEN SOURCE FONT: <a href="http://www.kavya-nandanam.com/dload.htm" target="_blank">http://www.kavya-nandanam.com/dload.htm</a> Pothana2000 font<br>TEST DATA: ?<br>
<br><b>Kannada:</b><br>TEAM: ?<br>
SUGGESTED WIN7 FONT: tunga.ttf<br>
SUGGESTED OPEN SOURCE FONT: <span style="font-size: 10pt; font-family: Arial;"><span>Mallige</span> or <span>Kedage</span></span> font from <a href="http://brahmi.sourceforge.net" target="_blank">brahmi.sourceforge.net</a><br>

TEST DATA: ?<br>
<br><b>Tamil:</b><br>TEAM: ?<br>
SUGGESTED WIN7 FONT: latha.ttf<br>
SUGGESTED OPEN SOURCE FONT: ??? -- Need to check <a href="http://tamilnation.org" target="_blank">tamilnation.org</a>'s list (but a lot of those are incomplete or old fonts)<br>TEST DATA: ?<br>
<br><b>Malayalam:</b><br>TEAM: "Malayalam Team Lead - Hiran V." <<a href="mailto:hiran.v@gmail.com" target="_blank">hiran.v@gmail.com</a>><br>

SUGGESTED WIN7 FONT: kartika.ttf<br>
SUGGESTED OPEN SOURCE FONT: SMC's Meera_04.ttf  <a href="http://smc.sarovar.org/" target="_blank">http://smc.sarovar.org/</a>  <a href="http://mirror.its.uidaho.edu/pub/savannah/smc/fonts/" target="_blank">http://mirror.its.uidaho.edu/pub/savannah/smc/fonts/</a> <br>

TEST DATA: <br>  * Some at <a href="http://www.indlinux.org/wiki/index.php/Test_Data/Malayalam">http://www.indlinux.org/wiki/index.php/Test_Data/Malayalam</a><br>
<br><b>Sinhala:</b><br>TEAM: "Sinhala Team Lead - Harshula" <<a href="mailto:harshula@gmail.com" target="_blank">harshula@gmail.com</a>><br>
SUGGESTED WIN7 FONT: iskpota.ttf<br>
SUGGESTED OPEN SOURCE FONT: Ask Harshula. <a href="http://www.nongnu.org/sinhala/doc/howto/sinhala-howto.html" target="_blank">http://www.nongnu.org/sinhala/doc/howto/sinhala-howto.html</a><br>TEST DATA: ?<br>
<br>