<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; color: rgb(0, 0, 0); font-size: 14px; font-family: Calibri, sans-serif;">
<div>If you already have PDFs – why are you also storing images?   PDF is an open international standard (ISO 32000) that offers not only a richer content model (including text, vector and raster) but also metadata, marginalia and more using modern compression
 methods.  TIFF on the other hand is a proprietary standard (that hasn’t been updated since 1992) that only handles raster images & metadata.</div>
<div><br>
</div>
<div>Leonard</div>
<div><br>
</div>
<span id="OLK_SRC_BODY_SECTION">
<div style="font-family:Calibri; font-size:11pt; text-align:left; color:black; BORDER-BOTTOM: medium none; BORDER-LEFT: medium none; PADDING-BOTTOM: 0in; PADDING-LEFT: 0in; PADDING-RIGHT: 0in; BORDER-TOP: #b5c4df 1pt solid; BORDER-RIGHT: medium none; PADDING-TOP: 3pt">
<span style="font-weight:bold">From: </span>Mark Ehle <<a href="mailto:markehle@gmail.com">markehle@gmail.com</a>><br>
<span style="font-weight:bold">Date: </span>Wednesday, May 7, 2014 at 8:27 PM<br>
<span style="font-weight:bold">To: </span>"<a href="mailto:poppler@lists.freedesktop.org">poppler@lists.freedesktop.org</a>" <<a href="mailto:poppler@lists.freedesktop.org">poppler@lists.freedesktop.org</a>><br>
<span style="font-weight:bold">Subject: </span>[poppler] Combine bounding box data and tiff to create pdf?<br>
</div>
<div><br>
</div>
<div>
<div>
<div dir="ltr">Folks - <br>
<br>
I am using pdtotxt to extract text from pdf file in a digital newspaper archive I am creating for a local public library. So far, it's working great. But - I am using up a far amount of disk space and would like to figure out a way to create an OCR'd pdf from
 an image and the bounding box data. That way I would not have to store the PDF files as well as the images. Is there a way to do that?<br>
<br>
Thanks - <br>
<br>
Mark<br>
</div>
</div>
</div>
</span>
</body>
</html>