<html>
    <head>
      <base href="https://bugs.freedesktop.org/" />
    </head>
    <body><table border="1" cellspacing="0" cellpadding="8">
        <tr>
          <th>Priority</th>
          <td>medium
          </td>
        </tr>

        <tr>
          <th>Bug ID</th>
          <td><a class="bz_bug_link 
          bz_status_NEW "
   title="NEW --- - Add a way to render a page without getting the text"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=57299">57299</a>
          </td>
        </tr>

        <tr>
          <th>Assignee</th>
          <td>poppler-bugs@lists.freedesktop.org
          </td>
        </tr>

        <tr>
          <th>Summary</th>
          <td>Add a way to render a page without getting the text
          </td>
        </tr>

        <tr>
          <th>Severity</th>
          <td>normal
          </td>
        </tr>

        <tr>
          <th>Classification</th>
          <td>Unclassified
          </td>
        </tr>

        <tr>
          <th>OS</th>
          <td>All
          </td>
        </tr>

        <tr>
          <th>Reporter</th>
          <td>jose.aliste@gmail.com
          </td>
        </tr>

        <tr>
          <th>Hardware</th>
          <td>Other
          </td>
        </tr>

        <tr>
          <th>Status</th>
          <td>NEW
          </td>
        </tr>

        <tr>
          <th>Version</th>
          <td>unspecified
          </td>
        </tr>

        <tr>
          <th>Component</th>
          <td>glib frontend
          </td>
        </tr>

        <tr>
          <th>Product</th>
          <td>poppler
          </td>
        </tr></table>
      <p>
        <div>
        <pre>Created <span class=""><a href="attachment.cgi?id=70290" name="attach_70290" title="test file">attachment 70290</a> <a href="attachment.cgi?id=70290&action=edit" title="test file">[details]</a></span>
test file

While looking at large map files like the one of the RATP for the metro of
Paris (will upload) these have a lot of text, but this text is in all shapes...
Currently the glib frontend will ALWAYS get the text of the page when
rendering. A sysprof of the sample shows that most of the time is spent in
coalescing the text, which of course is doing nothing as the text on this page
is scattered all the way. 

I just quickly removed the setTextPage call in poppler_page_render, and this
files render in 3 sec in my machine (i5 with ssd) while normally it takes about
30 sec... 

So, please allow for a way of rendering the file, and getting the text in
different calls. I know I know, this will reparse the file twice... but in
normal texts, rendering and coalescing is not that slow, so we probably won't
notice it too much in applications, while going from 30 sec to 3 sec makes my
"tiled manager"  evince finally renders such a file at 100% possible. :)</pre>
        </div>
      </p>
      <hr>
      <span>You are receiving this mail because:</span>
      
      <ul>
          <li>You are the assignee for the bug.</li>
      </ul>
    </body>
</html>