<div dir="ltr">On 17 January 2014 at 10:30, Peter Waller <span dir="ltr"><<a href="mailto:peter@scraperwiki.com" target="_blank">peter@scraperwiki.com</a>></span> wrote:<br><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>A screenshot from the poppler glib demo app demonstrates this, attached below. Poppler gets 696 characters and 1261 layout rectangles.</div></div></blockquote><div><snip> <br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div><a href="http://pwaller.net/sw/2014-01-17-broken.pdf" target="_blank">http://pwaller.net/sw/2014-01-17-broken.pdf</a><br></div></div></blockquote></div><snip><br><blockquote style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex" class="gmail_quote">I've reported this on bugzilla here: <a href="https://bugs.freedesktop.org/show_bug.cgi?id=73885">https://bugs.freedesktop.org/show_bug.cgi?id=73885</a><br></blockquote><div><br></div><div>Link to old thread: <a href="http://thread.gmane.org/gmane.comp.freedesktop.poppler/8683">http://thread.gmane.org/gmane.comp.freedesktop.poppler/8683</a> <br></div><div> <br></div><div>I've investigated this briefly. An observation:<br><br><a href="http://cgit.freedesktop.org/poppler/poppler/tree/glib/poppler-page.cc?id=poppler-0.33.0#n825">http://cgit.freedesktop.org/poppler/poppler/tree/glib/poppler-page.cc?id=poppler-0.33.0#n825</a><br><br></div><div>The sel_text->getLength() is 1283 (which doesn't match with the 1261 from poppler_page_get_layout).<br><br></div><div>If I change this to use a g_strndup() with the correct length:<br><br><blockquote style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex" class="gmail_quote">result = g_strndup (sel_text->getCString (), sel_text->getLength());<br></blockquote><div><br></div><div>And then look at result[696:], then I find that the rest of the string is filled with 0 bytes.<br><br></div><div>I'm extremely keen to get this fixed, so any pointers would be appreciated. The rate of encountering this bug is increasing all the time!<br><br></div><div>Thanks,<br><br></div><div>- Peter<br></div></div></div></div>