<html><head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; color: rgb(0, 0, 0); font-size: 14px; font-family: Calibri, sans-serif; "><div>Ok, sent you a read-only access invitation for now. &nbsp;Thanks for your offer to help. &nbsp;Here is my bigger issues list to get a flavor – a lot of fun things to do. &nbsp;Let me know what you want to do with pdftohtml!</div><div><br></div><div><ol><li>Translate drawing operations into canvas with SVG</li><li>Find better way to calculate vertical positioning, by looking at browser source code</li><li>z-index handling -- currently text is never masked by graphics</li><li>Algorithmic extraction of TOC</li><li>Algorithmic extraction of page numbering (Alec may be working on this)</li><li>Algorithmic identification of chapters</li><li>Right-to-left text, proper display (e.g. Arabic, Hebrew)</li><li>Algorithmic detection of text flow (Stephen may be working on this)</li><li>Detection / removal of duplicate images</li><li>Jpg vs. png selection; automatically choose the best format for each image</li></ol></div><div>--josh</div><div><br></div><span id="OLK_SRC_BODY_SECTION"><div style="font-family:Calibri; font-size:11pt; text-align:left; color:black; BORDER-BOTTOM: medium none; BORDER-LEFT: medium none; PADDING-BOTTOM: 0in; PADDING-LEFT: 0in; PADDING-RIGHT: 0in; BORDER-TOP: #b5c4df 1pt solid; BORDER-RIGHT: medium none; PADDING-TOP: 3pt"><span style="font-weight:bold">From: </span> Clément Wehrung &lt;<a href="mailto:cwehrung@nurves.com">cwehrung@nurves.com</a>&gt;<br><span style="font-weight:bold">Date: </span> Mon, 24 Oct 2011 15:27:23 -0700<br><span style="font-weight:bold">To: </span> Josh Richardson &lt;<a href="mailto:jric@chegg.com">jric@chegg.com</a>&gt;<br><span style="font-weight:bold">Cc: </span> &quot;<a href="mailto:poppler@lists.freedesktop.org">poppler@lists.freedesktop.org</a>&quot; &lt;<a href="mailto:poppler@lists.freedesktop.org">poppler@lists.freedesktop.org</a>&gt;, Alec Taylor &lt;<a href="mailto:alec.taylor6@gmail.com">alec.taylor6@gmail.com</a>&gt;<br><span style="font-weight:bold">Subject: </span> Re: [poppler] pdftohtml does not preserve fonts<br></div><div><br></div><div style="font-family: Helvetica; font-size: 13px; ">Sure ! Do you have a link for the repo so that I can already have a look (I didn't figure out which one it is right now) ? I'm really interested in helping you, if you need something on any specific topic don't hesitate. Many thanks again,<div><br></div><div>Clément</div></div><div style="font-family: Helvetica; font-size: 13px; "><br></div><br><div class="gmail_quote">On Mon, Oct 24, 2011 at 8:01 PM, Josh Richardson <span dir="ltr">&lt;<a href="mailto:jric@chegg.com">jric@chegg.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Can you give me a couple of days? &nbsp;I want to try to get a repo hosted on,<br>
e.g. bitbucket, which is connected to my repo, so that it's easier to keep<br>
everything in synch. &nbsp;Alec Taylor set up a repo there already, which you<br>
can use to get an immediate snapshot if needed.<br><br>
Best, --josh<br><div><div></div><div class="h5"><br>
On 10/24/11 10:45 AM, &quot;iclems&quot; &lt;<a href="mailto:cwehrung@nurves.Com">cwehrung@nurves.Com</a>&gt; wrote:<br><br>
&gt;<br>
&gt;Dear Josh,<br>
&gt;<br>
&gt;Being working on a pdftohtml project which requires font preservation, I'd<br>
&gt;be really interested in getting this too. Do you think it's possible ?<br>
&gt;<br>
&gt;Thanks,<br>
&gt;<br>
&gt;Clement<br>
&gt;<a href="mailto:cwehrung@gmail.com">cwehrung@gmail.com</a><br>
&gt;<br>
&gt;<br>
&gt;Josh Richardson wrote:<br>
&gt;&gt;<br>
&gt;&gt; Preserving fonts is not integrated into the master repository yet. &nbsp;If<br>
&gt;&gt;you<br>
&gt;&gt; like, I can send you a patched version of Poppler which will do it.<br>
&gt;&gt; You'll still have to run your own process (like Fontforge) to convert<br>
&gt;&gt;the<br>
&gt;&gt; fonts into a web-usable format, but it's straightforward as long as the<br>
&gt;&gt; fonts have mapping to unicode, and doable even without.<br>
&gt;&gt;<br>
&gt;&gt; --josh<br>
&gt;&gt;<br>
&gt;&gt; From: M Naveed Akram &lt;<a href="mailto:cmnajs@gmail.com">cmnajs@gmail.com</a>&lt;mailto:<a href="mailto:cmnajs@gmail.com">cmnajs@gmail.com</a>&gt;&gt;<br>
&gt;&gt; Date: Fri, 30 Sep 2011 06:52:14 -0700<br>
&gt;&gt; To:<br>
&gt;&gt;&quot;<a href="mailto:poppler@lists.freedesktop.org">poppler@lists.freedesktop.org</a>&lt;mailto:<a href="mailto:poppler@lists.freedesktop.org">poppler@lists.freedesktop.org</a>&gt;&quot;<br>
&gt;&gt; &lt;<a href="mailto:poppler@lists.freedesktop.org">poppler@lists.freedesktop.org</a>&lt;mailto:<a href="mailto:poppler@lists.freedesktop.org">poppler@lists.freedesktop.org</a>&gt;&gt;<br>
&gt;&gt; Subject: [poppler] pdftohtml does not preserve fonts<br>
&gt;&gt;<br>
&gt;&gt; Hi,<br>
&gt;&gt;<br>
&gt;&gt; I have been using 0.16 release of poppler-utils, but I am facing a<br>
&gt;&gt; problem. When converting pdf to html using pdftohtml it does not<br>
&gt;&gt;preserve<br>
&gt;&gt; fonts in the output html. How can I solve this issue. Please help<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; poppler mailing list<br>
&gt;&gt; <a href="mailto:poppler@lists.freedesktop.org">poppler@lists.freedesktop.org</a><br>
&gt;&gt; <a href="http://lists.freedesktop.org/mailman/listinfo/poppler" target="_blank">http://lists.freedesktop.org/mailman/listinfo/poppler</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;<br>
&gt;--<br>
&gt;View this message in context:<br>
&gt;<a href="http://old.nabble.com/pdftohtml-does-not-preserve-fonts-tp32569116p3271208" target="_blank">http://old.nabble.com/pdftohtml-does-not-preserve-fonts-tp32569116p3271208</a><br>
&gt;4.html<br>
&gt;Sent from the Free Desktop - poppler mailing list archive at Nabble.com.<br>
&gt;<br>
&gt;_______________________________________________<br>
&gt;poppler mailing list<br>
&gt;<a href="mailto:poppler@lists.freedesktop.org">poppler@lists.freedesktop.org</a><br>
&gt;<a href="http://lists.freedesktop.org/mailman/listinfo/poppler" target="_blank">http://lists.freedesktop.org/mailman/listinfo/poppler</a><br>
&gt;<br><br></div></div></blockquote></div><br></span></body></html>