1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333
|
esk soubor afix
Prefixy
V etin se pouv nkolik destek pepon. Protoe jsou distribuovny
nepravideln a poet pznak pouitelnch programem ispell je nedostaten,
byly v eskm slovnku pro ispell pouity pro pedpony pouze tyi pznaky:
N - generuje pedponu ne- (zejmna pro slovesa, pdavn jmna a pslovce)
E - generuje pedponu nej- (vytvoen tetho stupn ze druhho stupn
pdavnch jmen)
W - generuje pedpony ne-, nej- a nejne- (pro druh stupe pdavnch jmen;
vytv zpor a tet stupe vetn zporu)
F - generuje pedpony jedna-, dvaa-, tia-, tyia-, tyrya-, pta-, esta-,
sedma-, osma-, devta- (pro slovky a sloeniny obsahujc slovky
jako jednadvacet)
Pro snadn pouvn ostatnch pedpon jsou ve zdrojovch souborech pouity
seznamy tvaru {,do,po,pi,u,vy,za}hladit/ACN. Tyto seznamy jsou perlovm
skriptem glob.p expandovny na seznam slov, kter ji lze pout jako
vstup programu buildhash:
hladit/ACN
dohladit/ACN
pohladit/ACN
pihladit/ACN
uhladit/ACN
vyhladit/ACN
zahladit/ACN
Skript glob.p pracuje tak, e rozdluje ten dky na etzce neobsahujc
mezeru ani pomlku i spojovnk. Pokud nkter z takto vzniklch etzc
obsahuje seznam uzaven ve sloench zvorkch a skldajc se z podetzc
oddlench rkami, bude tento etzec nahrazen sadou etzc, kter z nj
vzniknou postupnm nahrazovnm celho seznamu jeho jednotlivmi prvky.
Vechny vsledn etzce jsou vypisovny po jednom na dku.
Skript glob.p by bylo mon pout i pro jin ely ne pro expanzi
seznam pedpon - napklad pro slova jako balk{o,}n/H. Toto pouit vak
nedoporuuji, protoe by mohlo psobit problmy jinm pomocnm programm
a skriptm pro zpracovn eskho slovnku.
Skript glob.p nen schopen expandovat v jednom etzci vce ne jeden seznam
(napklad {nad,od,pod}{,e}pisovn/SN), ani vnoen seznamy. Protoe vak
kad dek rozdl na etzce v mstech mezer nebo pomlek, me bt na
jednom dku vce seznam.
Vloen vech pouitelnch pedpon k jednotlivm slovm mus tedy zajistit
osoba, kter vytv nebo roziuje slovnk. Pitom je teba dvat pozor
na to, e nkter pedpony mn vid sloves (honit x dohonit), tranzitivitu
a tm i existenci trpnho rodu (jsat x rozjsat), psob zmny ve slovnm
zkladu (brt x sebrat) i ve zpsobu ohbn (krst > kradu x ukrst >
ukradnu), a tm i mn pznaky pslunch slov.
Pro slovesa se pouvaj nejastji pedpony do-, na-, nad-, nade-, o-, ob-,
obe-, od-, ode-, po-, pod-, pode-, popo-, pou-, poz-, pro-, pe-, ped-,
pede-, pi-, roz-, roze-, s-, se-, sou-, spo-, spolu-, u-, v-, ve-, vy-,
vz-, z-, za- a ze-; pro podstatn jmna bez-, beze-, do-, d-, n-, nad-,
nade-, o-, ob-, obe-, od-, ode-, mezi-, po-, pod-, pode-, popo-, pou-,
pro-, pr-, pe-, ped-, pede-, p-, roz-, roze-, s-, se-, sou-, spo-,
spolu-, -, v-, ve-, v-, vz-, z-, ze- a z; pro pdavn jmna a pslovce
se pouvaj vechny ve uveden pedpony a ppony vyjadujc mnostv
jako jedno-, dvou-, dvoj-, t-, troj-, vce-, mnoho-, mlo-, pomrn
asto se vyskytuj tak ciz pedpony a-, anti-, de-, dez-, in-, inter-,
intra-, im-, re-, trans-, un-, mono-, di-, tri-, single-, multi- a dal.
Sufixy
Nkter slova se sklouj nebo asuj podle vce vzor. Pro tato slova
je teba uvdt vechny pznaky, i kdy nkter z nich negeneruj dn
tvary navc (napklad kln/HL i kdy by stailo kln/L). Slovnk bude
pravdpodobn pouit i pro jin programy ne ispell, a v nich budou
takovto informace potebn.
Pznaky pro podstatn jmna muskho rodu ivotn
P - generuje vechny tvary podstatnch jmen vzor pn a pedseda krom 1.
pdu mnonho sla; vchoz tvar je 1. pd jednotnho sla
Pznak P lze pout i pro slova konc na -o skloovan podle vzoru pn
(dingo, pjmen Bidlo apod.), pro ciz jmna konc na -e, kter se pi
skloovn odsouv (Goethe, Shakespeare) i pro slova konc na -u (guru,
gurua). U slov koncch na -ek a -k se toto e/ v dalch tvarech vypout,
stejn tomu je i u slov koncch na -el, ped kterm nen b, d, t, , ,
i, o nebo u. Slova, kter tomuto nevyhovuj (lev, bel a syn - 5. pd
jednotnho sla synu nikoli syne) a u kterch dochz ke zmn slovnho
zkladu (bh, vl, pn) mus bt uvedena jako nepravideln se vemi tvary.
Podle monch tvar 1. pdu mnonho sla se pznak P dopluje jednm
nebo nkolika z pznak I, D, V. Pznak I generuje koncovku -i (vetn
mken h > zi, ch > i, r > i, k > ci), pznak D koncovku - a pznak
V koncovku -ov.
D - generuje tvary cizch podstatnch jmen zakonench v 1. pd mnonho
sla koncovkou -es, -os nebo -us (Aristoteles, diskobolos, Kristus),
kter se v dalch tvarech vypout
Pznak D m tedy dv funkce: u slov zakonench -es, -os nebo -us generuje
vechny tvary podstatnho jmna vzoru pn, zatmco u ostatnch slov generuje
pouze koncovku -.
U - generuje vechny tvary podstatnch jmen vzoru mu a soudce, krom tvaru
pro 1. pd mnonho sla s koncovkou -ov; u slov zakonench na -ec
a -e (s vjimkou -le) vypout -e-
Ze ivotnch podstatnch jmen muskho rodu lze obvykle vytvoit pdavn
jmna individuln pivlastovac (vzor otcv). Tato pdavn jmna je nutn
uvst ve slovnku zvlṻ s pznakem Y.
Pznaky pro podstatn jmna muskho rodu neivotn
H - generuje vechny tvary podle vzoru hrad bez pohybnho -e-, krom
tvaru s koncovkou -
Q - generuje vechny tvary podle vzoru hrad s pohybnm -e-, krom tvaru
s koncovkou -, a dle vechny tvary slov podle vzoru hrad, zakonench
v 1. pd jednotnho sla na -us nebo -os, kter se v dalch pdech
odsouv, u slov na -ismus generuje t tvary na -izmus
L - generuje vechny tvary podle podvzoru ostrov (nebo les, kter ovem
kols mezi vzory ostrov a hrad), vetn tvaru s koncovkou -
R - generuje tvar s koncovkou -
S - generuje tvary podle vzoru stroj
Pro podstatn jmna skloovan podle vzoru hrad (2. pd hradu) je teba
vybrat pznak H, pokud nemaj pohybn -e-, nebo pznak Q, pokud pohybn
-e- maj. Podle tvaru 1. pdu jednotnho sla nelze zjistit, zda je ve
slov pohybn -e- nebo nen. Napklad ve slov lek zvis pohybnost -e-
na vznamu: ve vznamu "leknut" se sklouje lek, leku, zatmco ve vznamu
"mal l" se sklouje lek, lku.
Pznak H lze pout i pro ciz slova s koncovm -e skloovan podle vzoru
hrad (software) a pro pomnon podstatn jmna vzoru hrad (rozpaky).
U slov, kter maj koncovku -, je nutn uvst tak pznak R.
U slov s koncovkou -us nebo -os generuje pznak H tvary -usu, -usem (nap.
autobus, autobusu, ...), zatmco pznak Q tvary bez -us- (nap. realismus,
realismu, ...; generuje i realizmus, realizmu, ...).
Pznak Q m tedy vce funkc; krom generovn vech tvar vzoru hrad pro
slova s pohybnm -e- a generovn vech tvar slov, kter jsou skloovna
podle vzoru hrad, a jsou zakoneny na odsouvan -us a -os, se pouv i pro
generovn tvar s przdnou koncovkou pro slova podle vzor ena, re a
msto. Tak pznak S m vce funkc, krom vzoru stroj se pouv i pro
vzor staven a pro jednotn slo vzoru re.
Pznaky pro podstatn jmna enskho rodu
Z - generuje tvary vzor ena, re (ne) a pse
K - generuje tvary vzoru kost
Q - generuje tvar s nulovou koncovkou pro slova vzoru ena a re
C - generuje tvary mnonho sla vzoru re (Daleice, dvee)
S - generuje tvary jednotnho sla vzoru re (Roudnice)
Pro podstatn jmna enskho rodu se pouv pznak Z nebo K. Pro slova
vzoru ena a re, kter maj v 2. pd mnonho sla pravideln tvar
s przdnou koncovkou se pidv pznak Q. Nen-li tvar 2. pdu mnonho
sla pravideln (houba > hub), uvede se ve slovnku na jednom dku slovo
s pznakem Z a tvar 2. pdu mnonho sla.
Pznak Z lze pout i pro ciz slova typu Antarktis. V tomto ppad
vygeneruje 1. pd jednotnho sla s tvarem -ida a dal tvary krom
2. pdu mnonho sla (kter generuje pznak Q).
Existuje tm kontinuum slov kolsajcch mezi vzory pse a kost. U
nkterch slov lze pout kombinaci pznak KZ, u jinch ZI, nkdy je
teba jet doplnit chybjc tvary, vjimen je nutn slovo povaovat
(pro ispell) za nepravideln. Pro vyzkouen generovanch tvar lze pout
pkaz sh inter a na vzvu ispell.cz: zadat slovo s lomtkem a pznaky,
napklad mod/ZI.
Pro pomnon jmna vzoru re se pouv pznak C, kter na rozdl od
pznaku Z generuje i tvar 2. pdu mnonho sla. A naopak, zejmna pro
jmna obc, kter maj tvary jednotnho sla vzoru re (Roudnice, Suice)
je vhodn pout pznak S generujc pouze tvary jednotnho sla (i kdy
v nkterch ppadech me bt pouit mnonho sla namst, napklad
mluv-li se o vce obcch stejnho jmna).
Z podstatnch jmen enskho rodu, kter oznauj osoby, nkter zvata
apod., lze obvykle vytvoit pdavn jmna individuln pivlastovac
(vzor matin). Tato pdavn jmna je nutn uvst ve slovnku zvlṻ
s pznakem Y.
Pznaky pro podstatn jmna stednho rodu
M - generuje tvary vzor msto, moe, krom tvar vzoru msto s koncovkou
-/-e a s przdnou koncovkou, funguje tak pro slova typu akvrium
K - generuje tvary vzoru kue a slov typu tma (tmatu, ...)
S - generuje tvary vzoru staven
C - generuje tvary jednotnho sla vzoru staven (pro hromadn podstatn
jmna)
Q - generuje tvar s przdnou koncovkou pro slova vzoru msto
R - generuje tvar s koncovkou -/-e pro slova vzoru msto
Pro slova vzoru msto, kter maj v 2. pd mnonho sla pravideln tvar
s przdnou koncovkou se pidv pznak Q. Slova jako psmeno, semeno mus
bt uvedena s pznaky MQRI a navc mus bt zvlṻ uveden tvar s koncovkou
-e (psmene).
Pznaky pro pdavn jmna
Univerzlnm pznakem pro pdavn jmna je pznak Y, kter generuje tvary
pdavnch jmen podle vzor mlad, jarn (lze pout i na druh stupe
pdavnch jmen jako mlad), otcv i matin. Dal pznaky se pouvaj
pro odvozovn:
K - odvozuje nzvy vlastnost - podstatn jmna vzoru kost (mlad > mladost)
C - odvozuje nzvy vlastnost s mkenm (exotick > exotinost oproti
pznaku K: anglick > anglickost)
R - odvozuje pslovce, dochz k mken -k > -ce, -ch > -e, -h > -ze,
-r > -e, -[dtnbpvm] > -[dtnbpvm]
O - odvozuje pslovce, bez mken (dlouh > dlouho)
N - pouze pedpona ne-
E - pouze pedpona nej-
W - pedpony ne-, nej- a nejne-
Pznak Y lze pout i pro skloovn podstatnch jmen vzor hajn, prvod,
hajn, jzdn, telec i podstatnch jmen yetti, pony, grizzly, regenschori
a cizch slov na -oj, -ij (Tolstoj, Dostojevskij).
Pznaky pro zjmena
Y - generuje tvary substantivnho skloovn podle vzor mlad a jarn, dle
tvary pro slova typu kdo, co, mj, n a ten (krom samotnho slova co).
Pznaky pro slovesa
A - z infinitivu generuje vechny tvary sloves krom pest trpnho
pro vechny vzory krom vzor krt, dlat (volat), szet a tnout
a nkterch slov prvn slovesn tdy se zmnou kmene
B - z infinitivu generuje vechny tvary sloves krom pest trpnho
pro vzor krt, dle generuje tvary ptomnho asu a tvary
rozkazovacho zpsobu z 1. nebo 3. osoby jednotnho sla - lze
pout pro vygenerovn tvar oznamovacho zpsobu pro slovesa
prvn slovesn tdy se zmnou kmene
J - z infinitivu generuje vechny tvary sloves krom pest trpnho
pro vzory dlat (volat), szet a tnout
T - generuje z infinitivu tvary trpnho rodu bez mken
C - generuje z infinitivu tvary trpnho rodu s mkenm
(pemoci > pemoen, sytit > sycen, hladit > hlazen, prosit > proen,
vozit > voen, myslit > mylen, hustit > hutn, opozdit > opodn,
thnout > taen, nadchnout > naden, stihnout > stien, svlknout
> svleen, tisknout > titn, odemknout > odemen)
O - generuje z muskho rodu minulho i trpnho pest dal tvary
X - generuje tvary pechodnku minulho z muskho rodu pechodnku minulho
nebo i z infinitivu
N - generuje pedponu ne-
Dky existenci pechodnku budoucho se tm ze vech sloves (dokonavch
i nedokonavch) generuj tvary pechodnku ptomnho.
Ve slovnku doposud chyb jakkoli informace o dokonavosti sloves. Tuto
informaci bude nutn doplnit pro pidn pznaku X, kter lze pout pouze
pro dokonav slovesa. Naopak z nedokonavch sloves je teba vygenerovat
pdavn jmna typu dlajc a pidat je do slovnku s pznaky YN.
Pznaky pro slovky
Pro slovky lze pouvat nsledujc pznaky:
ZQ - pro slovky skloovan podle vzoru ena (nula, jednika, dvojka, ...)
a re (dvojice, ...)
I - pro koncovku -i (pt, est, ...)
Y - pro slovky skloovan jako pdavn jmna (prvn, druh, ...)
Ojedinle lze pout dal pznaky pro slova, kter se sklouj jako
podstatn jmna (sto, tisc, milion), a pznaky N a F.
Pznaky pro pslovce
Pslovce je vhodn v nejvy mon me odvozovat z pdavnch jmen pomoc
pznak R a O. V nkterch ppadech jsou pro pslovce pouiteln pznaky
N, E a W popsan v kapitole Prefixy.
Nesklonn slova
Ojedinle lze pout nkter z pznak pro vygenerovan jinho slova
z nesklonnho slova (pznak N).
Pomocn skripty
Pro ovovn, zda je slovo uvedeno ve slovnku a jak tvary jsou generovny
pouitm uritch pznakm lze pout skript inter:
sh inter # Sputn skriptu
ispell.cz: husit
ispell.cz: (dn odpov) Slovo husit ve slovnku je
ispell.cz: husiti
husiti Slovo husiti ve slovnku nen
ispell.cz: husita/PD
husita Vpis vech tvar generovanch pouit pznak P a D
husit na slovo husita
husitech
husito
husitou
husitovi
husitu
husit
husitm
husity
ispell.cz: Ctrl-D Ukonen skriptu
Pro ulehen prce s piazovnm pznak lze pout skript blemma, kter
se podle tvar natench slov pokus pevst tato slova do zkladnho tvaru
a piadit jim pznaky. Skript blemma nepouv dn slovnk a vychz
pouze z tvar slov, proto je jeho innost nzk (asi 40%) a dl chyby,
take jeho vstup je nutn pekontrolovat. :-(
Pkaz
perl blemma -f soubor | sort -u
vype na standardn vstup slova, kterm se podailo piadit pznaky;
pkaz
perl blemma -r soubor
slova, u nich se to nepodailo.
Nevyeen problmy
Nkter problmy se pravdpodobn nedaj rozumn eit pomoc ispellu:
- Nkter zkratky (nap., atd.) by mly bt povaovny za bezchybn, pouze
pokud je za nimi teka.
- stice -li by mla bt povaovna za bezchybnou, pouze je-li ped n
spojovnk.
- Povolit sloeniny, jejich prvn sloka je tvoena slovy jako jsou
modro-, tmavo-, bled-, krtko-, mnoho-, a druh je pdavn jmno,
pslovce apod.. Mon lze njakm zpsobem pout volbu ~ u nkterho
pznaku. Pitom se nesm povolit sloeniny obecn.
|