Dear Poppler Developers,<br><br>Thanks for response.<br><br>For copyright information:<br><br><b>Copyright OSSD CDAC Mumbai <br><br>Changed 2010 by  Leena Chourey (<a href="mailto:leenac@cdacmumbai.in" target="_blank">leenac@cdacmumbai.in</a>) &amp; Onkar Potdar (<a href="mailto:onkar@cdacmumbai.in" target="_blank">onkar@cdacmumbai.in</a>) <br>
</b>
<br><br>With regards<br>Leena Chourey<br>For Accessibility Team <br>CDAC Mumbai<br><br>
<br><div class="gmail_quote">On Thu, Sep 16, 2010 at 12:55 AM, Albert Astals Cid <span dir="ltr">&lt;<a href="mailto:aacid@kde.org" target="_blank">aacid@kde.org</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">


A Dimarts, 7 de setembre de 2010, leena chourey va escriure:<br>
<div>&gt; Thanks Albert to review this patch again.<br>
<br>
</div>The patch seems ok.<br>
<br>
Before commiting i need the names and e-mail addresses of the people the<br>
copyright of this patch belongs to.<br>
<font color="#888888"><br>
Albert<br>
</font><div><div></div><div><br>
&gt; Comments are inline:<br>
&gt;<br>
&gt; On Sun, Jul 25, 2010 at 9:27 PM, Albert Astals Cid &lt;<a href="mailto:aacid@kde.org" target="_blank">aacid@kde.org</a>&gt; wrote:<br>
&gt; &gt; A Dimarts, 6 de juliol de 2010, leena chourey va escriure:<br>
&gt; &gt; &gt; Dear Albert,<br>
&gt; &gt;<br>
&gt; &gt; Hi<br>
&gt; &gt;<br>
&gt; &gt; &gt; Thanks for your response.<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; As discussed in the last mail, we have modified the patch so that:<br>
&gt; &gt; &gt;    - There is no behavioural change in pdftohtml -c &lt;filename&gt; means it<br>
&gt; &gt; &gt;    produces exactly the same output it did before.<br>
&gt; &gt; &gt;    - Defined new option as pdftohtml -s &lt;filename&gt; to generate a single<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; html file corresponding to a pdf file.<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; Please check and give your feedback if any further change is required.<br>
&gt; &gt;<br>
&gt; &gt; You are using a variable you deleted (tmp) in this chunk of code<br>
&gt; &gt;<br>
&gt; &gt; ***********************<br>
&gt; &gt;<br>
&gt; &gt;       delete tmp;<br>
&gt;<br>
&gt; This (delete tmp) was from the original development code only, we didn&#39;t<br>
&gt; made changes regarding tmp. I have checked, it is in the recent development<br>
&gt; version also.<br>
&gt;<br>
&gt; &gt;  -      fprintf(pageFile,&quot;%s\n&lt;HTML&gt;\n&lt;HEAD&gt;\n&lt;TITLE&gt;Page<br>
&gt; &gt;  %d&lt;/TITLE&gt;\n\n&quot;,<br>
&gt; &gt;<br>
&gt; &gt; -             DOCTYPE, page);<br>
&gt; &gt; +      if (!singleHtml)<br>
&gt; &gt; +          fprintf(pageFile,&quot;%s\n&lt;HTML&gt;\n&lt;HEAD&gt;\n&lt;TITLE&gt;Page<br>
&gt; &gt; %d&lt;/TITLE&gt;\n\n&quot;,<br>
&gt; &gt; DOCTYPE, page);<br>
&gt; &gt; +      else<br>
&gt; &gt; +          fprintf(pageFile,&quot;%s\n&lt;HTML&gt;\n&lt;HEAD&gt;\n&lt;TITLE&gt; %s&lt;/TITLE&gt;\n\n&quot;,<br>
&gt; &gt; DOCTYPE, tmp-&gt;getCString());////file name<br>
&gt; &gt; ***********************<br>
&gt; &gt;<br>
&gt; &gt; I&#39;m also concerned about you adding various &lt;HTML&gt; to the same .html<br>
&gt; &gt; page, my<br>
&gt; &gt; limited HTML knowledge says you can only have one of those.<br>
&gt;<br>
&gt; For the above: I would like to say that every page has different heading<br>
&gt; details as well as title.  This should not be changed for pages.<br>
&gt;<br>
&gt; &gt; Also it would be necessary that you update the pdftohtml.1 file (the man<br>
&gt; &gt; page)<br>
&gt; &gt; adding the new option.<br>
&gt;<br>
&gt; pdftohtml.1 is updated.<br>
&gt;<br>
&gt; Please find the latest patch for &quot;pdftohtml -s &lt;file.pdf&gt; &quot; and give<br>
&gt; feedback.<br>
&gt;<br>
&gt; &gt; Albert<br>
&gt; &gt;<br>
&gt; &gt; &gt; With best regard<br>
&gt; &gt; &gt; Leena C<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; On Wed, Jun 23, 2010 at 1:19 AM, Albert Astals Cid &lt;<a href="mailto:aacid@kde.org" target="_blank">aacid@kde.org</a>&gt;<br>
&gt; &gt;<br>
&gt; &gt; wrote:<br>
&gt; &gt; &gt; &gt; A Dimarts, 22 de juny de 2010, leena chourey va escriure:<br>
&gt; &gt; &gt; &gt; &gt; Dear Albert,<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; Thanks for giving detail comment to patch.<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; Please check updates given inline:<br>
&gt; &gt; &gt; &gt; Please do not forget to CC the poppler mailing list.<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; On Thu, Jun 17, 2010 at 4:14 AM, Albert Astals Cid &lt;<a href="mailto:aacid@kde.org" target="_blank">aacid@kde.org</a>&gt;<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; wrote:<br>
&gt; &gt; &gt; &gt; &gt; &gt; A Dimecres, 16 de juny de 2010, omkar va escriure:<br>
&gt; &gt; &gt; &gt; &gt; &gt; &gt; Dear Albert,<br>
&gt; &gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; &gt; Please find the corrected patch for &quot;accessibility of pdf<br>
&gt; &gt;<br>
&gt; &gt; document<br>
&gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; &gt; &quot; and give your feedback.<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; Hi, some comments:<br>
&gt; &gt; &gt; &gt; &gt; &gt;  * The comments like<br>
&gt; &gt; &gt; &gt; &gt; &gt;  // One more parameter(int j) is added in the getCSStyle function<br>
&gt; &gt;<br>
&gt; &gt; by<br>
&gt; &gt;<br>
&gt; &gt; &gt; &gt; CDAC<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; developer Team<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;   need to be removed, if each line had near it who coded it, the<br>
&gt; &gt;<br>
&gt; &gt; code<br>
&gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;   will<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; be<br>
&gt; &gt; &gt; &gt; &gt; &gt; twice as big and much more unreadable<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; Done, deleted all unwanted comments<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;   * The spacing of your patches could be better, that is<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; GooString* HtmlFontAccu::getCSStyle(int i, GooString* content<br>
&gt; &gt; &gt; &gt; &gt; &gt; ,int j){ should be<br>
&gt; &gt; &gt; &gt; &gt; &gt; +GooString* HtmlFontAccu::getCSStyle(int i, GooString* content,<br>
&gt; &gt; &gt; &gt; &gt; &gt; int j){ but that&#39;s nothing huge, i can fix it<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; Updated accordingly.<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;   * You are leaking (i.e. not deleting) jStr in both<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; HtmlFontAccu::getCSStyle<br>
&gt; &gt; &gt; &gt; &gt; &gt; and HtmlFontAccu::CSStyle<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; Deleted jStr<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;  * I see that the new HtmlPage::complexHtml and the old<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; HtmlPage::dumpComplex<br>
&gt; &gt; &gt; &gt; &gt; &gt; are very simple, i if you reused the code instead of copying it<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;  * This introduces a behavioural change that is unaccetable, i<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; understand<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; you<br>
&gt; &gt; &gt; &gt; &gt; &gt; want pdftohtml to produce a different (in your opinion better)<br>
&gt; &gt; &gt; &gt; &gt; &gt; output, for that you&#39;ll have to introduce a new comandline option<br>
&gt; &gt;<br>
&gt; &gt; to<br>
&gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; pdftohtml (something<br>
&gt; &gt; &gt; &gt; &gt; &gt; like --singlehtml) or something like that<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; For last 2 point we want some clarification.<br>
&gt; &gt; &gt; &gt; &gt; As you said behavioural change is unacceptable and also suggested<br>
&gt; &gt; &gt; &gt; &gt; to introduce a new command line option to generate single html. So<br>
&gt; &gt; &gt; &gt; &gt; if we do<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; as<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; following, will it be acceptable?<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;    - *Existing is:*<br>
&gt; &gt; &gt; &gt; &gt;    Command line option: pdftohtml -c  &lt;filename&gt;<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;    Function called:<br>
&gt; &gt; &gt; &gt; &gt;                       dumpComplex<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;    ()<br>
&gt; &gt; &gt; &gt; &gt;    {<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;        Read from input file<br>
&gt; &gt; &gt; &gt; &gt;        Write into file to Generates pagewise html format<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;    }<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;    - *Proposed changes:*<br>
&gt; &gt; &gt; &gt; &gt;    New Command line option : pdftohtml -s &lt;filename&gt;<br>
&gt; &gt;<br>
&gt; &gt; //Checked,<br>
&gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;    nothing  is already defined for -s            (pdftohtml -c<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt;  &lt;filename&gt;<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; will exists as it is)<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;    - Function called:<br>
&gt; &gt; &gt; &gt; &gt;                          dumpSingle()  //new function similar to<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; dumpComplex {<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;        Read from input file<br>
&gt; &gt; &gt; &gt; &gt;        Write into file to append single html format<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;    }<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;    - A function to “Read from input file” can be defined and call<br>
&gt; &gt; &gt; &gt; &gt;    it<br>
&gt; &gt;<br>
&gt; &gt; in<br>
&gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; both dumpComplex() and dumpSingle(), So that code duplication can<br>
&gt; &gt; &gt; &gt; &gt; be removed (for second last point of your mail).<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;    - And with -s option (for --single Html) behavioural change will<br>
&gt; &gt;<br>
&gt; &gt; be<br>
&gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;    defined separately. (-c will not be affected)<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; To be clear, pdftohtml -c should produce exactly the same output it<br>
&gt; &gt; &gt; &gt; did before<br>
&gt; &gt; &gt; &gt; your patch, pdftohtml -s you can output your version.<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; So yes, i think i kind of agree with your proposal.<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; Albert<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; For your opinion<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; With Regards<br>
&gt; &gt; &gt; &gt; &gt; Leena C &amp; Onkar P<br>
&gt; &gt; &gt; &gt; &gt; (for CDAC Accessibility Team)<br>
&gt;<br>
&gt; With best regards<br>
&gt; Leena C<br>
</div></div><div><div></div><div>_______________________________________________<br>
poppler mailing list<br>
<a href="mailto:poppler@lists.freedesktop.org" target="_blank">poppler@lists.freedesktop.org</a><br>
<a href="http://lists.freedesktop.org/mailman/listinfo/poppler" target="_blank">http://lists.freedesktop.org/mailman/listinfo/poppler</a><br>
</div></div></blockquote></div><br>