<html style="direction: ltr;">
  <head>

    <meta http-equiv="content-type" content="text/html; charset=utf-8">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    Hi all,<br>
    <br>
    I am working on a toolkit which does some text analysis on the given
    text documents. This toolkit primarily was supposed to work with XML
    files. But since the input files in the real applications are mostly
    *.doc/*.docx/*.odt/*.ppt/*.pptx/*.odp/*.pdf/ets, I need to write a
    library for reading these file formats and convert their contents
    into the desired XML format.  I was looking for such a library and
    learned that LibreOffice does have such a functionality.<br>
    I searched for the part of the code in LibreOffice which is
    responsible of reading the given files (in different formats), but
    couldn't find it.<br>
    Could you please point me to this part of the code in the
    LibreOffice project?<br>
    <br>
    <br>
    Thank you in advance,<br>
    Amin<br>
  </body>
</html>