<html>
    <head>
      <base href="https://bugs.documentfoundation.org/">
    </head>
    <body><table border="1" cellspacing="0" cellpadding="8">
        <tr>
          <th>Bug ID</th>
          <td><a class="bz_bug_link 
          bz_status_UNCONFIRMED "
   title="UNCONFIRMED - FORMATTING: redundancy in content.xml"
   href="https://bugs.documentfoundation.org/show_bug.cgi?id=136434">136434</a>
          </td>
        </tr>

        <tr>
          <th>Summary</th>
          <td>FORMATTING: redundancy in content.xml
          </td>
        </tr>

        <tr>
          <th>Product</th>
          <td>LibreOffice
          </td>
        </tr>

        <tr>
          <th>Version</th>
          <td>Inherited From OOo
          </td>
        </tr>

        <tr>
          <th>Hardware</th>
          <td>All
          </td>
        </tr>

        <tr>
          <th>OS</th>
          <td>All
          </td>
        </tr>

        <tr>
          <th>Status</th>
          <td>UNCONFIRMED
          </td>
        </tr>

        <tr>
          <th>Severity</th>
          <td>enhancement
          </td>
        </tr>

        <tr>
          <th>Priority</th>
          <td>medium
          </td>
        </tr>

        <tr>
          <th>Component</th>
          <td>Writer
          </td>
        </tr>

        <tr>
          <th>Assignee</th>
          <td>libreoffice-bugs@lists.freedesktop.org
          </td>
        </tr>

        <tr>
          <th>Reporter</th>
          <td>christianw_lehmann@arcor.de
          </td>
        </tr></table>
      <p>
        <div>
        <pre>Description:
In <a class="bz_bug_link 
          bz_status_UNCONFIRMED "
   title="UNCONFIRMED - Writer crashes with large file"
   href="show_bug.cgi?id=136409">Bug 136409</a>, I had remarked on redundant markup in content.xml which blows up
ODT files. The attached file ‚redundancy_in_xml.odt’ illustrates some of the
reasons for this:

File ‘content.xml’
The section “<office:font-face-decls>” contains 9 font faces only one of which
is used in this document.
In the section ‘<office:automatic-styles>’, several text styles have the same
definition, differing only in the value of the attribute ‘officeooo:rsid’; but
this is devoid of useful effects. In this sense, the following styles are the
same:
“T1” - “T6”
“T7” - “T12”
“T13” and “T14”.
Styles T4 – T6 contain specifications of fonts which are never used.
The section ‘<text:sequence-decls>’ contains five declarations none of which is
used in the text.
The section ‘<office:text>’ contains 13 occurrences of the tag ‘<text:span
text:style-name="Kommentarzeichen">’. A style of this name is also listed among
the “Applied Styles” in the panel “Character Styles”. It is, in fact, not
applied in the document. It has apparently been taken over from the source
where this text line was copied from from.

Steps to Reproduce:
Unpack the attached odt file and examine the content.xml.

Actual Results:
The file contains markup not used in the document.

Expected Results:
The file should be clean.


Reproducible: Always


User Profile Reset: No



Additional Info:
The attached file was copied out from the larger file submitted as mentioned in
<a class="bz_bug_link 
          bz_status_UNCONFIRMED "
   title="UNCONFIRMED - Writer crashes with large file"
   href="show_bug.cgi?id=136409">Bug 136409</a>. That is the source of some (though not all) of the redundant markup
information. If copying such useless information cannot be avoided while the
document is being edited, then LO should offer a function (> Tools > Purge)
which streamlines the xml files of a stored odt file. Redundancy and overweight
lead to errors and crashes.</pre>
        </div>
      </p>


      <hr>
      <span>You are receiving this mail because:</span>

      <ul>
          <li>You are the assignee for the bug.</li>
      </ul>
    </body>
</html>