<HTML><BODY><div class="js-helper js-readmsg-msg"><div id="style_16880144531209465473"><div id="style_16880144531209465473_BODY"><div class="cl_023413"><div><div>Hi</div><div> </div><div>I have no affiliation with GSoc or any other code program</div><div> </div><div>I am looking at the thesaurus files (as «I am not a coder»), with a view to providing an updated technical.dic thesaurus with many new terms and «a clear upgrade/merge/integrate path from an external data source» (wikipedia).</div><div>603 lines of references as opposed to the current 378 lines, each term (possibly) searchable directly on wikipedia .Then maybe I will see about concept/design to integrate (hypothetical) web search in xml  (help, thesaurus) interface. Right click on an item in help or Bayram Cicek’s search interface and you get an option to search the internet, or wikipedia article… (as concept).</div><div> </div><div>Anyway, I deleted the two foreign language thesaurus files hu_AkH11.dic and sl.dic, looking at the bug reports mentioned below, but I quickly realized the dic files were needed when compiling. But blank placeholders (empty text files) are good too.</div><div> </div><div>I have edited code references to remove hu_AkH11.dic, and it compiles OK without even a placeholder (empty) file.</div><div>Aside from Linguistic.backup..xcs, line 217, where else is hu_AkH11.dic referenced. I looked in the references below and I believe that it is bloat. I will try compiling HU language support if people think it is useful.</div><div>I would expect then that even with HU language and dictionary support installed, the (original) hu_AkH11.dic thesaurus will not exist or be called for. I don’t speak Hungarian though.</div><div> </div><div>sl.dic is integrated to the unit test, I can see. Not touching it today. I will put the text back into the placeholder file for my next build.</div><div> </div><div>«en_US or other language builds get these files unnecessarily, the only task is fixing our packaging.»   OK, how can I help with packaging?</div><div> </div><div>Laszlo do you have a local repo for your lo code, the en_US spelling dictionary? Your language code is different to this specific technical.dic thesaurus, yes?</div><div> </div><div>Thanks</div><div> </div><div>Alex Tao</div><div>Tao Submarines and Systems</div><div>Chios, Aegean Sea</div><div> </div><div class="mail-quote-collapse"><blockquote style="border-left:1px solid #0857A6;margin:10px;padding:0 0 0 10px;">Thursday, June 29, 2023 1:44 AM +03:00 from Németh László <<a href="/compose?To=nemeth@numbertext.org">nemeth@numbertext.org</a>>:<br> <div id=""><div class="js-helper_mr_css_attr js-readmsg-msg_mr_css_attr"><div><div id="style_16879922852144403581_BODY_mr_css_attr"><div class="cl_021953_mr_css_attr"><div><div>Hi,</div> <div class="gmail_quote_mr_css_attr"><div class="gmail_attr_mr_css_attr">Andras Timar <<a href="http://e.mail.ru/compose/?mailto=mailto%3atimar74@gmail.com" target="_blank">timar74@gmail.com</a>> ezt írta (időpont: 2023. jún. 28., Sze, 17:55):</div><blockquote style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex" class="gmail_quote_mr_css_attr"><div><div>Hi Alex,</div> <div class="gmail_quote_mr_css_attr"><div class="gmail_attr_mr_css_attr">On Wed, Jun 28, 2023 at 5:15PM Alex <<a href="http://e.mail.ru/compose/?mailto=mailto%3ataosubmarines@mail.ru" target="_blank">taosubmarines@mail.ru</a>> wrote:</div><blockquote style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex" class="gmail_quote_mr_css_attr"><div><div>Hi everyone</div><div> </div><div>Today I try to determine how to remove two unwanted wordbook files from libreoffice/extras/source/wordbook:</div><div>hu_AkH11.dic and sl.dic.</div><div>These foreign language (incomplete) dics should be removed, unless they are used in some unit test.</div><div>Bug 139961, 68576 etc</div><div> </div><div>Can be removed? OK?</div><div> </div></div></blockquote><div> </div><div>I'm not sure, if it's OK. We added these dictionaries for a reason. It's better to ask the maintainers first (I CC-ed them).</div><div>From the technical point of view, if you remove the files from source, and all references to them, the build should pass. Maybe you need a clean build from scratch. Use "git grep <font face="arial, sans-serif">sl.dic" and "git grep </font><span style="color:rgb(0,0,0)"><font face="arial, sans-serif">hu_AkH11.dic" commands, they are more reliable than opengrok.</font></span></div></div></div></blockquote><div> </div><div>You can remove hu_AkH11.dic with the following git command:</div><div> </div><div>$ git revert 6247c966942a0e43320a234302a67c1f92c2eea7</div><div> </div><div> Because this was added with that commit:</div><div> </div>$ git log libreoffice/extras/source/wordbook/hu_AkH11.dic<br>commit 6247c966942a0e43320a234302a67c1f92c2eea7</div><div class="gmail_quote_mr_css_attr"> </div><div class="gmail_quote_mr_css_attr">But these are not unwanted dictionaries, as András wrote.</div><div class="gmail_quote_mr_css_attr"> </div><div class="gmail_quote_mr_css_attr">In theory, they are packaged only with their language builds, sl-SI and hu-HU. If not, i.e. en_US or other language builds get these files unnecessarily, the only task is fixing our packaging. If the packaging problem is related to some Linux distributions, I believe, our task is only to report that in their bug trackers.</div><div class="gmail_quote_mr_css_attr"> </div><div class="gmail_quote_mr_css_attr">Is this a GSoC project? I haven't found information about the planned improvement of the (en_US?) thesaurus or the thesaurus code base.</div><div class="gmail_quote_mr_css_attr">(By the way, I had an interesting improvement here: English stemming and affixation during thesaurus usage by adding extra language data to the en_US spelling dictionary. Unfortunately, by accident this was removed by the recent maintainer.)</div><div class="gmail_quote_mr_css_attr"> </div><div class="gmail_quote_mr_css_attr">Best regards,</div><div class="gmail_quote_mr_css_attr">László</div><div class="gmail_quote_mr_css_attr"> </div><div class="gmail_quote_mr_css_attr"><div> </div><blockquote style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex" class="gmail_quote_mr_css_attr"><div><div class="gmail_quote_mr_css_attr"><div> </div><div><span style="color:rgb(0,0,0)"><font face="arial, sans-serif">Best regards,<br>Andras</font></span></div><div> </div><div> </div></div></div></blockquote></div></div></div></div></div></div></div></blockquote></div><div> </div></div></div></div></div></div></BODY></HTML>