<html>
    <head>
      <base href="https://bugs.freedesktop.org/" />
    </head>
    <body><table border="1" cellspacing="0" cellpadding="8">
        <tr>
          <th>Bug ID</th>
          <td><a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - pdftotext and pdftohtml fails to extract columns"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=94504">94504</a>
          </td>
        </tr>

        <tr>
          <th>Summary</th>
          <td>pdftotext and pdftohtml fails to extract columns
          </td>
        </tr>

        <tr>
          <th>Product</th>
          <td>poppler
          </td>
        </tr>

        <tr>
          <th>Version</th>
          <td>unspecified
          </td>
        </tr>

        <tr>
          <th>Hardware</th>
          <td>x86 (IA32)
          </td>
        </tr>

        <tr>
          <th>OS</th>
          <td>Linux (All)
          </td>
        </tr>

        <tr>
          <th>Status</th>
          <td>NEW
          </td>
        </tr>

        <tr>
          <th>Severity</th>
          <td>normal
          </td>
        </tr>

        <tr>
          <th>Priority</th>
          <td>medium
          </td>
        </tr>

        <tr>
          <th>Component</th>
          <td>utils
          </td>
        </tr>

        <tr>
          <th>Assignee</th>
          <td>poppler-bugs@lists.freedesktop.org
          </td>
        </tr>

        <tr>
          <th>Reporter</th>
          <td>john@hovedpuden.dk
          </td>
        </tr></table>
      <p>
        <div>
        <pre>Created <span class=""><a href="attachment.cgi?id=122241" name="attach_122241" title="PDF-filewith columns that is not processed corerctly">attachment 122241</a> <a href="attachment.cgi?id=122241&action=edit" title="PDF-filewith columns that is not processed corerctly">[details]</a></span>
PDF-filewith columns that is not processed corerctly

pdftotext and pdftohtml fail to correctly process certain PDF pages with three
columns.
For the attached PDF-file the error occurs on page 5 where the rendered text is
not in correct order.

Rendered text (XXXX represents social security numbers in the file. The
rendered text is correctly with 4 digits):
S08032016-17
Alle og enhver, der har noget til gode
i nedennævnte bo, indkaldes herved
til at anmelde og dokumentere deres
krav inden 8 uger

S08032016-21
Alle og enhver, der har noget til gode
i nedennævnte bo, indkaldes herved
til at anmelde og dokumentere deres
krav inden 8 uger

S08032016-26
Alle og enhver, der har noget til gode
i nedennævnte bo, indkaldes herved
til at anmelde og dokumentere deres
krav inden 8 uger

Afdøde
Cpr.nr. 190521XXXX
Dødsdato 11.02.2016
Frede Jensen
Hyldevej 12
9300 Sæby

Afdøde
Cpr.nr. 150733XXXX
Dødsdato 04.01.2016
Inger Kathrine Simonsen
Gl. Tingvej 40F, 1 th.
9600 Aars

Afdøde
Cpr.nr. 300121XXXX
Dødsdato 26.01.2016
Anna Hartlev
Gulkrog 16, st
7100 Vejle</pre>
        </div>
      </p>
      <hr>
      <span>You are receiving this mail because:</span>
      
      <ul>
          <li>You are the assignee for the bug.</li>
      </ul>
    </body>
</html>