<br>ahh gud ,, so is there any way we can get these optional info ? <br><br><div class="gmail_quote">On Thu, Jan 28, 2010 at 6:19 PM, Leonard Rosenthol <span dir="ltr">&lt;<a href="mailto:lrosenth@adobe.com">lrosenth@adobe.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">PDF DOES support rich semantic structure including all of things listed below (ISO 32000-1:2008, 14.7, 14.8 and 14.9). HOWEVER, it is optional and therefore many PDF documents do not contain the necessary elements.   And, as pointed out, without the presence of such elements already in the PDF - the best you can do is GUESS.<br>

<div><div></div><div class="h5"><br>
-----Original Message-----<br>
From: <a href="mailto:poppler-bounces@lists.freedesktop.org">poppler-bounces@lists.freedesktop.org</a> [mailto:<a href="mailto:poppler-bounces@lists.freedesktop.org">poppler-bounces@lists.freedesktop.org</a>] On Behalf Of <a href="mailto:mpsuzuki@hiroshima-u.ac.jp">mpsuzuki@hiroshima-u.ac.jp</a><br>

Sent: Thursday, January 28, 2010 7:04 AM<br>
To: amit aggarwal<br>
Cc: <a href="mailto:poppler@lists.freedesktop.org">poppler@lists.freedesktop.org</a><br>
Subject: Re: [poppler] Extract pdf<br>
<br>
Hi,<br>
<br>
I think PDF is a page description language and defines<br>
nothing for semantic structure; how to store the titles<br>
of section, subsection, figure and tables. Therfore, I<br>
guess, poppler cannot extract - because, PDF does not have.<br>
<br>
Is there any reliable framework defining such and your<br>
target documentations follow?<br>
<br>
Regards,<br>
mpsuzuki<br>
<br>
On Thu, 28 Jan 2010 17:23:17 +0530<br>
amit aggarwal &lt;<a href="mailto:amitcs06@gmail.com">amitcs06@gmail.com</a>&gt; wrote:<br>
<br>
&gt;Hi All,<br>
&gt;<br>
&gt;I want to extract the following inforamaton for pdf<br>
&gt;1) All Chapter Section and Subsection titles,<br>
&gt;2)  name of the Figures and tables<br>
&gt;<br>
&gt;Can any one plz help me for the same ?<br>
&gt;<br>
&gt;--<br>
&gt;Thanks<br>
&gt;Amit Aggarwal<br>
&gt;<br>
</div></div>_______________________________________________<br>
poppler mailing list<br>
<a href="mailto:poppler@lists.freedesktop.org">poppler@lists.freedesktop.org</a><br>
<a href="http://lists.freedesktop.org/mailman/listinfo/poppler" target="_blank">http://lists.freedesktop.org/mailman/listinfo/poppler</a><br>
</blockquote></div><br><br clear="all"><br>-- <br>Thanks<br>Amit Aggarwal<br><br>