<html>
    <head>
      <base href="https://bugs.freedesktop.org/" />
    </head>
    <body>
      <p>
        <div>
            <b><a class="bz_bug_link 
          bz_status_NEW "
   title="NEW --- - [PATCH] try to detect line breaks in the PDF and insert them in raw mode for pdftotext"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=62266#c2">Comment # 2</a>
              on <a class="bz_bug_link 
          bz_status_NEW "
   title="NEW --- - [PATCH] try to detect line breaks in the PDF and insert them in raw mode for pdftotext"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=62266">bug 62266</a>
              from <span class="vcard"><a class="email" href="mailto:jamslam@gmail.com" title="Andrew Gallant <jamslam@gmail.com>"> <span class="fn">Andrew Gallant</span></a>
</span></b>
        <pre>Perhaps the option is ill-named. What it's really doing is trying to insert a
single new line whenever one or more can be detected in the PDF (as defined by
an amount of white space greater than the line spacing). I think this would
fall under the category "raw" mode.

I chose the name because the intended use case of identifying vertical white
space in the PDF is to translate that white space into the raw text generated.
Usually this results in a separation of paragraphs that are also separated by
vertical white space in the PDF.

The actual need is an attempt to output raw text with respect to the PDF as
faithfully as possible. It's quite nice to get raw text that has line breaks
wherever they were found in the PDF.</pre>
        </div>
      </p>
      <hr>
      <span>You are receiving this mail because:</span>
      
      <ul>
          <li>You are the assignee for the bug.</li>
      </ul>
    </body>
</html>