[Libreoffice-commits] dictionaries.git: cs_CZ/cs_CZ.aff cs_CZ/cs_CZ.dic cs_CZ/README_cs.txt

Stanislav Horacek (via logerrit) logerrit at kemper.freedesktop.org
Wed Jun 2 20:27:20 UTC 2021


 cs_CZ/README_cs.txt |    4 --
 cs_CZ/cs_CZ.aff     |   74 ++++------------------------------------------------
 cs_CZ/cs_CZ.dic     |    8 ++---
 3 files changed, 10 insertions(+), 76 deletions(-)

New commits:
commit 412f5dd223df85956dc38f429733e7972d496391
Author:     Stanislav Horacek <stanislav.horacek at gmail.com>
AuthorDate: Thu May 27 22:34:39 2021 +0200
Commit:     Stanislav Horáček <stanislav.horacek at gmail.com>
CommitDate: Wed Jun 2 22:26:57 2021 +0200

    Czech Hunspell: remove rule based on circumfix and make other updates
    
    the rule does not produce correctly capitalized results
    minor updates of word list
    all changes suggested by Miroslav Pošta
    
    Change-Id: I1ecfd7ea6daaf155228bd2405708fb097fa07997
    Reviewed-on: https://gerrit.libreoffice.org/c/dictionaries/+/116281
    Tested-by: Stanislav Horáček <stanislav.horacek at gmail.com>
    Reviewed-by: Stanislav Horáček <stanislav.horacek at gmail.com>

diff --git a/cs_CZ/README_cs.txt b/cs_CZ/README_cs.txt
index f13e5c4..d21512e 100644
--- a/cs_CZ/README_cs.txt
+++ b/cs_CZ/README_cs.txt
@@ -584,7 +584,7 @@ Slova byla přidávána především na základě seznamů slov vygenerovaných
 
 Chybná či problematická slova a tvary k odebrání byly vyhledávány především pomocí kontroly pravopisu Windows v seznamech slov (words, tzn. slovních tvarů) vygenerovaných z žákovských a internetových korpusů. Díky tomu bylo např. zjištěno, že původní pravidla povolují určité typy častých překlepů (zejména u nerodilých uživatelů češtiny). Dále byly cíleně odebírány některé zastaralé varianty, které jsou sice přípustné, ale Dodatek MŠMT je nepovažuje za základní (slova z prvního výčtu, např. analysa, fantasie, explose, slova zakončená na -isace, -isovat, -isování, -isovaný, -isační). Je možné, že by je využili chemici a snad i jiné profese, v kontrole pravopisu určené pro současný jazyk pro ně ale místo není. (Je pravděpodobné, že slovník nadále některá taková slova obsahuje.)
 
-Soubor s afixy byl upraven především takto: byl přehodnocen přístup k přechodníkům, byla přidána pravidla pro tvorbu přivlastňovacích přídavných jmen od maskulin životných ("otcův"), byla přidána pravidla pro stupňování adjektiv koncovkou -ejší/ější, byla přidána pravidla pro tvar 1. osoby sg. sloves na -u (vedle -i, např. "děkuju"), byla přidána pravidla pro vytváření přídavných jmen od jmen pomístních prostým přidáním koncovky -ský (a změnou velkého písmena na písmeno malé), byl opraven 6. p. mn. č. maskulin na -ga/ha/cha/ka (např. kolezích), byly provedeny další drobnější úpravy.
+Soubor s afixy byl upraven především takto: byl přehodnocen přístup k přechodníkům, byla přidána pravidla pro tvorbu přivlastňovacích přídavných jmen od maskulin životných ("otcův"), byla přidána pravidla pro stupňování adjektiv koncovkou -ejší/ější, byla přidána pravidla pro tvar 1. osoby sg. sloves na -u (vedle -i, např. "děkuju"), byl opraven 6. p. mn. č. maskulin na -ga/ha/cha/ka (např. kolezích), byly provedeny další drobnější úpravy.
 
 
 Podrobněji
@@ -597,8 +597,6 @@ Přístup k přechodníkům: Soubor s afixy původně obsahoval pravidla pro tvo
 
 S přechodníky souvisí adjektiva od nich odvozená (např. "zpívající"). Pod příznakem X byla přidána pravidla pro tvorbu těchto adjektiv od přechodníků uvedených ve slovníku. Další mohou být přidána buď takto spolu s přechodníkem, nebo prostým přidáním adjektiva (na -cí nebo -vší) s příznakem Y.
 
-Podrobněji k odvozování adjektiv od pomístních jmen: Jistě by se dala sestavit pravidla na paradigmatickou (pravidelnou) tvorbu adjektiv od různě zakončených slov, čímž by se slovník mohl výrazně zmenšit, ale při vkládání značek by se pak muselo nahlížet do tabulky s legendou, aby se nevytvořily nekorektní tvary. Proto jsem vytvořil jen komplex pravidel pro prosté přidání koncovky -ský (ve všech pádech sg. i pl.) a změny iniciálního velkého písmene na písmeno malé. (Jedná se o příznak ý automaticky kombinovaný s příznakem Ú a Ů.) Zdá se totiž, že prosté přidání -ský představuje cca 75 % případů. Je to opět volitelná možnost: lze buď postaru vložit do slovníku i přídavné jméno, nebo prostě přidat k pomístnímu jménu příznak "ý". (Starou metodu jsem na novou nezměnil. Je však možné udělat to dodatečně a zmenšit tak počet položek ve slovníku o několik stovek nebo tisíců.) Technická poznámka: 
 řešení je realizováno příkazem CIRCUMFIX, který je v jazykových souborech pro různé jazyky poměrně vzácný.
-
 Ke stupňování adjektiv: Byla vytvořena pravidla pro stupňování adjektiv koncovkou -ejší/ější. Jedná se o příznak y. (Jen několik desítek adjektiv se stupňuje pomocí koncovky -ší/čí.) Nově je tedy možné u takového adjektiva jen uvést příznak y. Jím se vytvoří všechny tvary komparativu a superlativu a dále stupňované příslovce. Starý systém byl na nový převeden jen u slov, která byla v původním slovníku jen v komparativu (a superlativu), nikoliv tedy v pozitivu. Tuto úpravu by bylo možné provést i v ostatních případech, čímž by se ušetřilo několik tisíc řádků. (Pokud jde o předponu "nejne", bylo by možné na ni rezignovat a tyto nečetné případy vyřešit jinak. Naopak příznak N by bylo třeba zachovat.) Je třeba otestovat, zda je vhodné, aby se od stupňovaného adjektiva automaticky tvořilo i stupňované příslovce - je třeba přiznat, že toto je poněkud nesystémové.
 
 Zakázány byly tvary dokáži/dokáží a další podobné. V současné češtině se považují za zastarávající nebo knižní, respektive hyperkorektní, a proto je v přehledu tvarů neuvádí ani Internetová jazyková příručka Ústavu pro jazyk český. V některých typech textů se vyskytují se zvýšenou frekvencí možná právě proto, že je dosavadní kontroly pravopisu povolují.
diff --git a/cs_CZ/cs_CZ.aff b/cs_CZ/cs_CZ.aff
index 22e1441..3df9b9e 100644
--- a/cs_CZ/cs_CZ.aff
+++ b/cs_CZ/cs_CZ.aff
@@ -85,7 +85,7 @@ SFX P   0           ech        [^aeoklgh]
 SFX P   g           zích       g
 SFX P   h           zích       [^c]h
 SFX P   ch          ších       ch
-SFX P   0           ův/Y       [^aeoklc] # jména zakončená na -e (Šebrle, Goethe) a -c (Balzac) nejsou pokryta
+SFX P   0           ův/Y       [^aeoklc]
 SFX P   0           a          [^eě]k
 SFX P   0           u          [^eě]k
 SFX P   0           ovi        [^eě]k
@@ -192,15 +192,15 @@ SFX P   a           o          a
 SFX P   a           ou         a
 SFX P   a           ů          a
 SFX P   a           ům         a
-SFX P   a           ech        [^cčďghkňšťž]a # u pária se povoluje dubleta
+SFX P   a           ech        [^cčďghkňšťž]a
 SFX P   ka          cích       ka
 SFX P   ga          zích       ga
 SFX P   cha         ších       cha
 SFX P   ha          zích       [^c]ha
-SFX P   a           ích        [ščžci]a # typ bača, nindža, míša, paňáca, pária
-SFX P   ďa          dích       ďa # typ méďa
-SFX P   ňa          ních       ňa # typ fouňa
-SFX P   ťa          tích       ťa # typ ťunťa
+SFX P   a           ích        [ščžci]a
+SFX P   ďa          dích       ďa
+SFX P   ňa          ních       ňa
+SFX P   ťa          tích       ťa
 SFX P   a           ův/Y       a
 SFX P   e           a          e
 SFX P   e           u          e
@@ -2786,68 +2786,6 @@ SFX y   í           ěji/E     ní
 SFX y   ký          čeji/E  [^cs]ký
 SFX y   í           eji/E   [^n]í
 
-CIRCUMFIX Ů
-
-PFX Ú Y 44
-PFX Ú A a/Ů A
-PFX Ú Á á/Ů Á
-PFX Ú Ä ä/Ů Ä
-PFX Ú Å å/Ů Å
-PFX Ú B b/Ů B
-PFX Ú C c/Ů C
-PFX Ú Č č/Ů Č
-PFX Ú D d/Ů D
-PFX Ú Ď ď/Ů Ď
-PFX Ú E e/Ů E
-PFX Ú É é/Ů É
-PFX Ú F f/Ů F
-PFX Ú G g/Ů G
-PFX Ú H h/Ů H
-PFX Ú I i/Ů I
-PFX Ú Í í/Ů Í
-PFX Ú J j/Ů J
-PFX Ú K k/Ů K
-PFX Ú L l/Ů L
-PFX Ú Ľ ľ/Ů Ľ
-PFX Ú M m/Ů M
-PFX Ú N n/Ů N
-PFX Ú Ň ň/Ů Ň
-PFX Ú O o/Ů O
-PFX Ú Ó ó/Ů Ó
-PFX Ú Ö ö/Ů Ö
-PFX Ú P p/Ů P
-PFX Ú Q q/Ů Q
-PFX Ú R r/Ů R
-PFX Ú Ř ř/Ů Ř
-PFX Ú S s/Ů S
-PFX Ú Š š/Ů Š
-PFX Ú T t/Ů T
-PFX Ú Ť ť/Ů Ť
-PFX Ú U u/Ů U
-PFX Ú Ú ú/Ů Ú
-PFX Ú Ü ü/Ů Ü
-PFX Ú V v/Ů V
-PFX Ú W w/Ů W
-PFX Ú X x/Ů X
-PFX Ú Y y/Ů Y
-PFX Ú Ý ý/Ů Ý
-PFX Ú Z z/Ů Z
-PFX Ú Ž ž/Ů Ž
-
-SFX ý Y 12 # spolu s pravidlem Ú a Ů nabízí možnost vytvořit z pomístního jména adjektivum prostým přidáním koncovky -ský
-SFX ý   0           ský/ÚŮ     .
-SFX ý   0           ská/ÚŮ     .
-SFX ý   0           ské/ÚŮ     .
-SFX ý   0           ského/ÚŮ   .
-SFX ý   0           skému/ÚŮ   .
-SFX ý   0           ském/ÚŮ    .
-SFX ý   0           ským/ÚŮ    .
-SFX ý   0           skou/ÚŮ    .
-SFX ý   0           ští/ÚŮ     .
-SFX ý   0           ských/ÚŮ   .
-SFX ý   0           skými/ÚŮ   .
-SFX ý   0           skýma/ÚŮ   .
-
 SFX í Y 23 # cizí jména (Victoria, Balzac, Jake, Kennedy, Luigi, Mallarmé), jen sg.
 SFX í   a           e          ia
 SFX í   a           i          ia
diff --git a/cs_CZ/cs_CZ.dic b/cs_CZ/cs_CZ.dic
index 10b5057..eb51e0f 100644
--- a/cs_CZ/cs_CZ.dic
+++ b/cs_CZ/cs_CZ.dic
@@ -1,4 +1,4 @@
-261171
+261169
 a
 AACR
 áách
@@ -49051,7 +49051,7 @@ genotyp/H
 genotypový/YKRN
 genový/YKRN
 genplk.
-genpor.t
+genpor.
 Genrt/PV
 Genrtová/Y
 Genser/PV
@@ -218699,8 +218699,7 @@ třídeskový/YR
 třídicí/Y
 třídící/YN
 třídič/S
-třidička/Zq
-třídička/Zq
+třídička/Z
 třídílný/YKRN
 třídimenzionální/YKR
 třídírenský/YR
@@ -261166,7 +261165,6 @@ zživotnění/SN
 Žyrková/Y
 žžonka/ZQ
 µA
-μg
 µg
 µm
 µV


More information about the Libreoffice-commits mailing list