<html>
    <head>
      <base href="https://bugs.freedesktop.org/">
    </head>
    <body>
      <p>
        <div>
            <b><a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - libpoppler cannot recreate pdftotext output, because physical_layout is not handled correctly"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=103798#c7">Comment # 7</a>
              on <a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - libpoppler cannot recreate pdftotext output, because physical_layout is not handled correctly"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=103798">bug 103798</a>
              from <span class="vcard"><a class="email" href="mailto:dummydummy@gmx.fr" title="dummydummy@gmx.fr">dummydummy@gmx.fr</a>
</span></b>
        <pre>Unfortunately the preceding patch does not resolve the problem on its own.

Comparing main() of pdftotext.cc with the page::text() in
.../gcc/poppler-page.cpp there are 2 other differences:

(1) doc->displayPage(&td, d->index + 1, 72, 72, 0, FALSE, TRUE, false); vs
doc->displayPages(textOut, firstPage, lastPage, resolution, resolution, 0,
TRUE, FALSE, gFalse);
i.e. page::text () sets GBool useMediaBox = false, GBool crop = true and in
pdftotext it is the other way round!?

I have yet to investigate what this means by reading the source...

(2) the page::text() in .../gcc/poppler-page.cpp subsequently calls
td.getText() while pdftotext does not... Yet more source code to wade
through...

to be continued...</pre>
        </div>
      </p>


      <hr>
      <span>You are receiving this mail because:</span>

      <ul>
          <li>You are the assignee for the bug.</li>
      </ul>
    </body>
</html>