<html><head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; color: rgb(0, 0, 0); font-size: 14px; font-family: Calibri, sans-serif; "><div>My bad. &nbsp;I forgot that was something I added that hasn't been merged back in yet. &nbsp;I think your options are:</div><ol><li>Use my version (email me offline if you want it, and I'll send you an invite to my source — it has other enhancements to pdftohtml also — read the mailing list archives for more info),</li><li>Change the source of pdftohtml.cc to make the default sampling 96 instead of 72 dpi, or</li><li>Wait for my changes to get merged back into the main repo. &nbsp;I'm not sure when that's going to be done.</li></ol><div>Best, --josh</div><div><br></div><span id="OLK_SRC_BODY_SECTION"><div style="font-family:Calibri; font-size:11pt; text-align:left; color:black; BORDER-BOTTOM: medium none; BORDER-LEFT: medium none; PADDING-BOTTOM: 0in; PADDING-LEFT: 0in; PADDING-RIGHT: 0in; BORDER-TOP: #b5c4df 1pt solid; BORDER-RIGHT: medium none; PADDING-TOP: 3pt"><span style="font-weight:bold">From: </span> Craig Whitcombe &lt;<a href="mailto:craig.whitcombe@gmail.com">craig.whitcombe@gmail.com</a>&gt;<br><span style="font-weight:bold">Date: </span> Tue, 22 Nov 2011 06:20:20 -0800<br><span style="font-weight:bold">To: </span> Josh Richardson &lt;<a href="mailto:jric@chegg.com">jric@chegg.com</a>&gt;<br><span style="font-weight:bold">Cc: </span> &quot;<a href="mailto:poppler@lists.freedesktop.org">poppler@lists.freedesktop.org</a>&quot; &lt;<a href="mailto:poppler@lists.freedesktop.org">poppler@lists.freedesktop.org</a>&gt;<br><span style="font-weight:bold">Subject: </span> Re: [poppler] pdftohtml image quality<br></div><div><br></div>Sorry Josh, but I cannot see this -dpi setting<div><br></div><div><div>pdftohtml.exe -help</div><div><br></div><div>pdftohtml version 0.18.0</div><div>Copyright 2005-2011 The Poppler Developers - <a href="http://poppler.freedesktop.org">http://poppler.freedesktop.org</a></div><div>Copyright 1999-2003 Gueorgui Ovtcharov and Rainer Dorsch</div><div>Copyright 1996-2004 Glyph &amp; Cog, LLC</div><div><br></div><div>Usage: pdftohtml [options] &lt;PDF-file&gt; [&lt;html-file&gt; &lt;xml-file&gt;]</div><div>&nbsp; -f &lt;int&gt; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;: first page to convert</div><div>&nbsp; -l &lt;int&gt; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;: last page to convert</div><div>&nbsp; -q &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;: don't print any messages or errors</div><div>&nbsp; -h &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;: print usage information</div><div>&nbsp; -help &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; : print usage information</div><div>&nbsp; -p &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;: exchange .pdf links by .html</div><div>&nbsp; -c &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;: generate complex document</div><div>&nbsp; -s &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;: generate single document that includes all pages</div><div>&nbsp; -i &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;: ignore images</div><div>&nbsp; -noframes &nbsp; &nbsp; &nbsp; &nbsp; : generate no frames</div><div>&nbsp; -stdout &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; : use standard output</div><div>&nbsp; -zoom &lt;fp&gt; &nbsp; &nbsp; &nbsp; &nbsp;: zoom the pdf document (default 1.5)</div><div>&nbsp; -xml &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;: output for XML post-processing</div><div>&nbsp; -hidden &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; : output hidden text</div><div>&nbsp; -nomerge &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;: do not merge paragraphs</div><div>&nbsp; -enc &lt;string&gt; &nbsp; &nbsp; : output text encoding name</div><div>&nbsp; -dev &lt;string&gt; &nbsp; &nbsp; : output device name for Ghostscript (png16m, jpeg etc)</div><div>&nbsp; -fmt &lt;string&gt; &nbsp; &nbsp; : image file format for Splash output (png or jpg)</div><div>&nbsp; -v &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;: print copyright and version info</div><div>&nbsp; -opw &lt;string&gt; &nbsp; &nbsp; : owner password (for encrypted files)</div><div>&nbsp; -upw &lt;string&gt; &nbsp; &nbsp; : user password (for encrypted files)</div><div>&nbsp; -nodrm &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;: override document DRM settings</div><div><br></div><div><br></div><div>trying to use -dpi 96 anyway results in the above help message.</div><div><br></div><div>Regards,</div><div>Craig</div><div><br></div><div><br></div><div><br></div><div><br></div><br><div class="gmail_quote">

On 22 November 2011 06:45, Josh Richardson <span dir="ltr">&lt;<a href="mailto:jric@chegg.com">jric@chegg.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;"><div style="word-wrap:break-word;color:rgb(0,0,0);font-size:14px;font-family:Calibri,sans-serif"><div>By default pdftohtml is sampling the original image at 72 dpi, whereas your browser is probably displaying it at least 96 dpi. &nbsp;I recommend you try bumping up the –dpi parameter.</div><div><br></div><div>--josh</div><div><br></div><span><div style="font-family:Calibri;font-size:11pt;text-align:left;color:black;BORDER-BOTTOM:medium none;BORDER-LEFT:medium none;PADDING-BOTTOM:0in;PADDING-LEFT:0in;PADDING-RIGHT:0in;BORDER-TOP:#b5c4df 1pt solid;BORDER-RIGHT:medium none;PADDING-TOP:3pt"><span style="font-weight:bold">From: </span> Craig Whitcombe &lt;<a href="mailto:craig.whitcombe@gmail.com" target="_blank">craig.whitcombe@gmail.com</a>&gt;<br><span style="font-weight:bold">Date: </span> Sun, 20 Nov 2011 08:02:39 -0800<br><span style="font-weight:bold">To: </span> &quot;<a href="mailto:poppler@lists.freedesktop.org" target="_blank">poppler@lists.freedesktop.org</a>&quot; &lt;<a href="mailto:poppler@lists.freedesktop.org" target="_blank">poppler@lists.freedesktop.org</a>&gt;<br><span style="font-weight:bold">Subject: </span> [poppler] pdftohtml image quality<br></div><div><div class="h5"><div><br></div>Hello,<div><br></div><div>Using pdftohtml -c to create a complex document from a pdf, I find that the generated png images are not very good when compared to the original inside the source pdf.</div><div><br></div><div>Is there something that I can do to improve the output quality?</div><div><br></div><div>Using version 0.18 with pdftohtml -c somepdf.pdf</div><div>Regards,</div><div>Craig</div></div></div></span></div></blockquote></div><br></div></span></body></html>