<html>
    <head>
      <base href="https://bugs.documentfoundation.org/">
    </head>
    <body><span class="vcard"><a class="email" href="mailto:sbergman@redhat.com" title="Stephan Bergmann <sbergman@redhat.com>"> <span class="fn">Stephan Bergmann</span></a>
</span> changed
          <a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - URL in unicode interpretate as file link (PDF export)"
   href="https://bugs.documentfoundation.org/show_bug.cgi?id=130501">bug 130501</a>
          <br>
             <table border="1" cellspacing="0" cellpadding="8">
          <tr>
            <th>What</th>
            <th>Removed</th>
            <th>Added</th>
          </tr>

         <tr>
           <td style="text-align:right;">CC</td>
           <td>
                
           </td>
           <td>sbergman@redhat.com
           </td>
         </tr></table>
      <p>
        <div>
            <b><a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - URL in unicode interpretate as file link (PDF export)"
   href="https://bugs.documentfoundation.org/show_bug.cgi?id=130501#c3">Comment # 3</a>
              on <a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - URL in unicode interpretate as file link (PDF export)"
   href="https://bugs.documentfoundation.org/show_bug.cgi?id=130501">bug 130501</a>
              from <span class="vcard"><a class="email" href="mailto:sbergman@redhat.com" title="Stephan Bergmann <sbergman@redhat.com>"> <span class="fn">Stephan Bergmann</span></a>
</span></b>
        <pre>There appears to be an issue with internationalized domain name top level
domains (IDN TLDs) somewhere in the code:

The IDN URL <<a href="http://транссеть.рф">http://транссеть.рф</a>> (with a IDN TLD) is exported as a URL with a
last segment of "<a href="http:%2F%2Fxn--80akxkhacg4g.xn--p1a%D1%84">http:%2F%2Fxn--80akxkhacg4g.xn--p1a%D1%84</a>" (i.e., some code
apparently decoded IDN label "транссеть" to "xn--80akxkhacg4g" and "рф" to
"xn--p1a%D1%84", though the latter should have been "xn-p1ai"?!?, and then
URL-encoded "//" as "%2F%2F" as it apparently decided for some reason that all
of the input should become a single segment in the resulting URL).

On the other hand, testing with current master on Linux at least,
<<a href="http://транссеть.ru">http://транссеть.ru</a>> (with a "plain" TLD) is exported as
<<a href="http://xn--80akxkhacg4g.ru/">http://xn--80akxkhacg4g.ru/</a>> (i.e., with the IDN label "транссеть" decoded to
"xn--80akxkhacg4g", which should be fine).</pre>
        </div>
      </p>


      <hr>
      <span>You are receiving this mail because:</span>

      <ul>
          <li>You are the assignee for the bug.</li>
      </ul>
    </body>
</html>