Hi Michael,<br><br>first of all thanks for replying.. I was thinking no one would :-)<br><br>From your reply I assume that testing the filters, and doing regression tests is something I could do, maybe identifying the main conversion issues in groups of documents and kind of creating a "major conversion issues" table, and prioritizing those issues. Is there already something like that?<br>
<br>I know that you can convert documents through the command line, using LibreOffice headless mode, and that can be something that's useful for scripting automatic tests... although I know that sometimes the main problems are "visual" and it's difficult to automatically detect the problems... <br>
<br>Is there any kind of repository for documents that are candidates for conversion testing? I mean documents which are known to have conversion problems, and that are used to test improvements to the filters?<br><br>I would like very much to become more involved in improving the conversion filters, since it seems to be a major problem in LibreOffice adoption, and everything that can be done to help in that area would certainly boost LibreOffice adoption specially in the enterprise world.<br>
<br>Thanks<br>Flávio<br><br><div class="gmail_quote">2012/7/5 Michael Stahl <span dir="ltr"><<a href="mailto:mstahl@redhat.com" target="_blank">mstahl@redhat.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
hi Flavio,<br>
<div class="im"><br>
On 03/07/12 12:45, Flavio Moringa wrote:<br>
<br>
> I chose as my masters dissertation investigation topic trying to improve<br>
> the document conversion engine in LibreOffice (ex: converting docx to<br>
> odt), and as such I would like to know who is working on the conversion<br>
> engines and how can I help.<br>
<br>
</div>the document conversion engines in LibreOffice are called Writer, Calc,<br>
Draw and Impress.  conversion from e.g. DOCX to ODT happens by importing<br>
the DOCX file with the DOCX import filter into Writer, and then<br>
exporting the document from Writer with the ODF export filter.<br>
<br>
there are also a few filters (such as XSLT filters, and writerperfect if<br>
i remember correctly) that use ODF as an intermediate format, i.e., they<br>
import by converting their format to ODF and then importing that into<br>
the LO application, and export the reverse way.<br>
<div class="im"><br>
> I'm not a programmer, so what I'm interested in doing is something in<br>
> the lines of investigating the main conversion problems, identifying the<br>
> possible conversion flows, analysing the way the conversion flow is<br>
> implemented in LibreOffice, and eventually trying to improve this flow<br>
> somehow.<br>
<br>
</div>it seems to me the main conversion problem is a lack of manpower to<br>
improve the filters.  oh, and more regression tests would be useful.<br>
</blockquote></div><br><br clear="all"><br>-- <br><font size="-1"><b>Flávio Moringa</b></font><font size="1"><br>
Project Leader<br><br><img src="http://people.caixamagica.pt/flaviomoringa/images/caixamagica.png"><br>
<br>
Caixa Mágica Software<br>
Energia Open Source<br>
Rua Soeiro Pereira Gomes, Lote 1 - 4.º B,<br>
Edifício Espanha, 1600-196 Lisboa - Portugal<br>
Tel.: +351 217 921 260 Fax: +351 217 921 261<br><a href="http://www.caixamagica.pt" target="_blank">http://www.caixamagica.pt</a><br>
<a href="https://twitter.com/flaviomoringa" target="_blank">https://twitter.com/flaviomoringa</a><br>
<a href="https://www.facebook.com/flavio.moringa" target="_blank">https://www.facebook.com/flaviomoringa</a><br><a href="http://pt.linkedin.com/in/flaviomoringa" target="_blank">http://pt.linkedin.com/in/flaviomoringa</a><br>
</font><font size="1"><a href="http://people.caixamagica.pt/flaviomoringa" target="_blank">http://people.caixamagica.pt/flaviomoringa</a><br><br></font><br>