<html>
    <head>
      <base href="https://bugs.freedesktop.org/" />
    </head>
    <body>
      <p>
        <div>
            <b><a class="bz_bug_link 
          bz_status_NEW "
   title="NEW --- - [TAGGEDPDF] Parse the Tagged-PDF document structure tree when present"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=64815#c14">Comment # 14</a>
              on <a class="bz_bug_link 
          bz_status_NEW "
   title="NEW --- - [TAGGEDPDF] Parse the Tagged-PDF document structure tree when present"
   href="https://bugs.freedesktop.org/show_bug.cgi?id=64815">bug 64815</a>
              from <span class="vcard"><a class="email" href="mailto:aperez@igalia.com" title="Adrian Perez de Castro <aperez@igalia.com>"> <span class="fn">Adrian Perez de Castro</span></a>
</span></b>
        <pre>(In reply to <a href="show_bug.cgi?id=64815#c11">comment #11</a>)
<span class="quote">> Comment on <span class=""><a href="attachment.cgi?id=80407" name="attach_80407" title="[PATCH v3 2/7] Tagged-PDF: Interpret the document structure">attachment 80407</a> <a href="attachment.cgi?id=80407&action=edit" title="[PATCH v3 2/7] Tagged-PDF: Interpret the document structure">[details]</a></span> <a href='page.cgi?id=splinter.html&bug=64815&attachment=80407'>[review]</a> [review]
> [PATCH v3 2/7] Tagged-PDF: Interpret the document structure

> Review of <span class=""><a href="attachment.cgi?id=80407" name="attach_80407" title="[PATCH v3 2/7] Tagged-PDF: Interpret the document structure">attachment 80407</a> <a href="attachment.cgi?id=80407&action=edit" title="[PATCH v3 2/7] Tagged-PDF: Interpret the document structure">[details]</a></span> <a href='page.cgi?id=splinter.html&bug=64815&attachment=80407'>[review]</a> [review]:
> -----------------------------------------------------------------

> Ok, I have just a few comments for now, I'll do a full review when the patch
> is split. In general, * are placed wrongly (close to the type instead of the
> argument/variable name). Some parts of the code are hard to follow with all
> those abbreviations.

> ::: poppler/Catalog.h
> @@ +124,4 @@
> >    GooString *readMetadata();
> >  
> >    // Return the structure tree root object.
> > +  StructTreeRoot* getStructTreeRoot();

> Note that this is used by pdfinfo, you need to update it too</span >

The corresponding patch for “pdfinfo” is attached to <a class="bz_bug_link 
          bz_status_NEW "
   title="NEW --- - [METABUG, TAGGEDPDF] Tagged-PDF support in Poppler"
   href="show_bug.cgi?id=64813">bug #64813</a>

<span class="quote">> ::: poppler/StructElement.cc
> @@ +231,5 @@
> > +      }                                                                 \
> > +      return okay;                                                      \
> > +    }
> > +
> > +ARRAY_CHECKER(isRGBColor_or_OptX4, isRGBColor,        4, gTrue,  gTrue );

> what is OptX4?</span >

Instead one single color value specifying e.g. the color of all the
four sides a box border, it is possible to *optionally* have four
values (hence *X4*) with one value for each side. I will add a comment
about that in the code and think about a better name.

<span class="quote">> @@ +862,5 @@
> > +StructElement::StructElement(Dict *element, StructTreeRoot *treeRootA, StructElement *parentA):
> > +  type(Unknown),
> > +  treeRoot(treeRootA),
> > +  parent(parentA),
> > +  pageRef(),

> Do you really need this? I guess it does nothing.</span >

Explicitly initializes using the default constructor. I tend to prefer to
write code that is explicit, but I can just remove the initializer for
the “pageRef” attribute.

<span class="quote">> @@ +863,5 @@
> > +  type(Unknown),
> > +  treeRoot(treeRootA),
> > +  parent(parentA),
> > +  pageRef(),
> > +  s(new StructData())

> Why having this as a separate struct?</span >

The idea is to make the StructElement instances smaller in memory when
just storing a MCID or an OBJR.

<span class="quote">> @@ +900,5 @@
> > +{
> > +  if (isContent())
> > +    delete c;
> > +  else
> > +    delete s;

> I see why using separate structs now. I would just keep the mcid or object
> ref in the same StructElement and parse it on demand. I find very confusing
> using variable names like c and s</span >

Do you mean that you would keep them in the parent StructElement? IMHO that
would make the API of StructElement more cumbersome. Also, note that there
can be mixed MCID, OBJR and StructElem children in a structure object, so
that would also complicate to store the children (now it is just a simple
“std::vector<StructElement*>”). Or am I understanding your comment wrongly?

<span class="quote">> @@ +1160,5 @@
> > +  if (element->lookup("Alt", &obj)->isString()) {
> > +    s->altText = obj.getString();
> > +    obj.initNull(); // The StructElement takes ownership of the GooString
> > +  } else if (!obj.isNull()) {
> > +    error(errSyntaxWarning, -1, "Alt object is wrong type ({0:s})", obj.getTypeName());

> I think we can just ignore invalid objects for optional fields.</span >

Do you mean to not even print warning messages?

FWIW, the rest of your comments are valid concerns (especially the ones
related to leaking objects) and I will be fixing the issues tomorrow.

Thanks for the review, and next round would be (hopefully) easier with
the split patches :)</pre>
        </div>
      </p>
      <hr>
      <span>You are receiving this mail because:</span>
      
      <ul>
          <li>You are on the CC list for the bug.</li>
      </ul>
    </body>
</html>