<div dir="ltr">Folks - <br><br>I am using pdtotxt to extract text from pdf file in a digital newspaper archive I am creating for a local public library. So far, it's working great. But - I am using up a far amount of disk space and would like to figure out a way to create an OCR'd pdf from an image and the bounding box data. That way I would not have to store the PDF files as well as the images. Is there a way to do that?<br>
<br>Thanks - <br><br>Mark<br></div>