Hello all ,<br>    I am a student who wish to participate in GSoc as a Go-oo student,<br>I have been seeing the list of ideas from quite a few days , the <br>ideas seem interesting and i am actually confused to choose an idea .<br>
Ideas like &quot;Improve RTF Import (RTF Tokenizer)&quot; and <br>&quot;Use PDF import&#39;s layout recognition for other vector formats (e.g. postscript, wmf/emf)&quot;<br>are those which i really liked to work on and since i have a fair knowledge of C , C++ <br>
i think that i can take up these project.<br>but since i know less about different file formats (have worked with formats like .bmp and .jpeg in past<br>
for a hobby project)<br>will someone please help me in knowing the different file formats involved in the project,<br>and also the concept of &quot;Tokenizer&quot; and &quot;layot recognition&quot;  .<br><br>Thanks and regards ,<br>
  Manu C<br>