<html>
    <head>
      <base href="https://bugs.freedesktop.org/">
    </head>
    <body>
      <p>
        <div>
            <b><a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - No word splitting for pdfs produced by Chrome"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=97399#c1">Comment # 1</a>
              on <a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - No word splitting for pdfs produced by Chrome"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=97399">bug 97399</a>
              from <span class="vcard"><a class="email" href="mailto:jason@aquaticape.us" title="Jason Crain <jason@aquaticape.us>"> <span class="fn">Jason Crain</span></a>
</span></b>
        <pre>I was mistaken on IRC when I called this a linefeed character.  I confused 0xA0
and 0x0A.  Chrome is for some reason sometimes using 0xA0 (no-break space)
between words.  poppler only breaks words on regular 0x20 space so these stay
grouped together in the same word.  To work around this, we could possibly
implement something like icu's u_isUWhiteSpace to check for characters to split
on.</pre>
        </div>
      </p>


      <hr>
      <span>You are receiving this mail because:</span>

      <ul>
          <li>You are the assignee for the bug.</li>
      </ul>
    </body>
</html>