<html>
    <head>
      <base href="https://bugs.freedesktop.org/">
    </head>
    <body>
      <p>
        <div>
            <b><a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - pdftotext: UTF-16 text without BOM not properly extracted"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=103309#c1">Comment # 1</a>
              on <a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - pdftotext: UTF-16 text without BOM not properly extracted"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=103309">bug 103309</a>
              from <span class="vcard"><a class="email" href="mailto:ralf.stubner@r-institute.com" title="ralf.stubner@r-institute.com">ralf.stubner@r-institute.com</a>
</span></b>
        <pre>Additional note:

$ java -jar pdfbox-app-2.0.7.jar ExtractText 2004.pdf

Extracts the text but issues some warnings:

Okt 17, 2017 12:34:44 PM org.apache.pdfbox.pdmodel.font.PDFont <init>
WARNUNG: Invalid ToUnicode CMap in font JRLFSC+Segoe UI,Bold-Identity-H
Okt 17, 2017 12:34:44 PM org.apache.pdfbox.pdmodel.font.PDFont <init>
WARNUNG: Invalid ToUnicode CMap in font EUPBOV+Arial Unicode MS-Identity-H
Okt 17, 2017 12:34:44 PM org.apache.pdfbox.pdmodel.font.PDFont <init>
WARNUNG: Invalid ToUnicode CMap in font VRSAOT+Arial Unicode MS,Bold-Identity-H
Okt 17, 2017 12:34:44 PM org.apache.pdfbox.pdmodel.font.PDFont <init>
WARNUNG: Invalid ToUnicode CMap in font FAMOVB+Segoe UI-Identity-H</pre>
        </div>
      </p>


      <hr>
      <span>You are receiving this mail because:</span>

      <ul>
          <li>You are the assignee for the bug.</li>
      </ul>
    </body>
</html>