<div dir="ltr">Hello,<div><br></div><div>I do a fair bit of work where I move data between LibreOffice, MySQL, Vertica, Google Docs, Hadoop, Python, and a few other systems. The formatting of TSV files is ad-hoc. Each system has little differences in how strings are escaped, and similar. In addition, there is no way to preserve metadata.</div><div><br></div><div>I drafted a modest proposed spec for standardizing TSV files by standardizing types, and adding metadata, and was hoping to solicit feedback on that proposal:</div><div><br></div><div><a href="http://www.tsvx.org/">http://www.tsvx.org/</a></div><div><br></div><div>I'm trying to maintain the parts of TSV which make it great -- simplicity, human-readability, and rapid single-pass parsing, but add enough structure to eliminate all the scripting that goes on when moving data between systems, as well as to eliminate some of the brittleness (TSV files break if a column is added, and one-pass parsing breaks if an unexpected type is found 10GB down).</div><div><br></div><div>Since this touches closely on LibreOffice, and if it becomes standards, it's something we'd all have to live with, I was hoping to solicit some feedback on this from LibreOffice developers.</div><div><br></div><div>github issues (<a href="https://github.com/pmitros/tsvx/issues">https://github.com/pmitros/tsvx/issues</a>) are the preferred way of communicating, but I'll monitor this thread, and personal email is okay as well.</div><div><br></div><div>Piotr</div><div><br></div></div>