<html>
    <head>
      <base href="https://bugs.freedesktop.org/" />
    </head>
    <body>
      <p>
        <div>
            <b><a class="bz_bug_link 
          bz_status_NEW "
   title="NEW --- - Tagged-PDF: LBody tag is not supported"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=67710#c7">Comment # 7</a>
              on <a class="bz_bug_link 
          bz_status_NEW "
   title="NEW --- - Tagged-PDF: LBody tag is not supported"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=67710">bug 67710</a>
              from <span class="vcard"><a class="email" href="mailto:aperez@igalia.com" title="Adrian Perez de Castro <aperez@igalia.com>"> <span class="fn">Adrian Perez de Castro</span></a>
</span></b>
        <pre>(In reply to <a href="show_bug.cgi?id=67710#c3">comment #3</a>)
<span class="quote">> Created <span class=""><a href="attachment.cgi?id=83580" name="attach_83580" title="Add support to LBody to poppler">attachment 83580</a> <a href="attachment.cgi?id=83580&action=edit" title="Add support to LBody to poppler">[details]</a></span> <a href='page.cgi?id=splinter.html&bug=67710&attachment=83580'>[review]</a> [review]
> Add support to LBody to poppler

> Fixes a typo on the previous patch.

> Note: looking at the html from pdfstructtohtml I realized that listitems are
> exposed with an extra bullet point. Using pdfinfo -struct-text we have
> things like this:

>       LI (block)
>         LBody
>           P (block):
>              /Placement /Block
>              /StartIndent 36
>             "•list item 1"

> Not sure if the bullet point should be part of the text. Again, I hope that
> someone with more experience with the current code could reply that question.</span >

Yes, the bullet glyph is part of the contents of the PDF. Note that the
structure tree is purely informative, and does not affect how things are
rendered. Therefore if a bullet is to be shown, it must be part of the
page command stream.

The “pdfstructtohtml” could be indeed be a bit smarter and do one of
(or a combination of both):

 - Checking the beginning of the text string and, if one of the usual
   bullet symbols is used (circle bullet, square bullet, etc), do not
   output the glyph inside the <li> elements and let the browser add
   the bullet.
 - Removing the bullet from the <li> elements using CSS, so the bullet
   glyph from the text is shown.</pre>
        </div>
      </p>
      <hr>
      <span>You are receiving this mail because:</span>
      
      <ul>
          <li>You are the assignee for the bug.</li>
      </ul>
    </body>
</html>