<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Fri, Oct 18, 2013 at 7:52 AM, Khaled Hosny <span dir="ltr"><<a href="mailto:khaledhosny@eglug.org" target="_blank">khaledhosny@eglug.org</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">> Very obscure test data, just to demonstrate the algorithm:<br>
><br>
> src: 0618 0619 064E 064F 0654 0658 0653 0654 0651 0656 0651 065C 0655 0650<br>
> ccc:   30   31   30   31  230  230  230  230   33  220   33  220  220   32<br>
> MCM:                      Yes  Yes       Yes                      Yes<br>
><br>
> out: 0654 0658 0651 0651 0618 064E 0619 064F 0650 0656 065C 0655 0653 0654<br>
> ccc:  230  230   33   33   30   30   31   31   32  220  220  220  230  230<br>
> MCM:  Yes  Yes                                               Yes       Yes<br>
<br>
I think the order of Hamza below is not right, I'd expect it to come at<br>
least before other below marks, regardless of whether there are other<br>
MCM marks in the sequence or not.<br></blockquote><div><br></div><div>The order is right. It is blocked by the U+065C, which has the same combining class of 220. If a user is intentionally putting something of the same combining class before the hamza below, we shouldn't reorder them, since he intended that order. The same cannot be said about character of different combining classes, since various normalizations may reorder them.</div>
<div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
I disagree here, 0653 is actually a special form of Hamza and should be<br>
treated as other MCM marks. The madda used in Quran serves a quite<br>
different purpose and had its own code point; U+06E4 ARABIC SMALL HIGH MADDA.<br></blockquote><div><br></div><div>Korans use two different kinds of madda. U+06E4 (Small High Madda) is the "small" madda used over U+06E5, U+06E6, U+06E7 and U+08F3, or if someone wants to use a smaller madda differentiated from the normal madda for some semantic or visual reason. I actually have a Unicode editorial committee action to clarify that in the text of Unicode 7.0.</div>
</div></div></div>