File: ceskeaff.txt

package info (click to toggle)
aspell-cs 0.0.20040614.1-2
  • links: PTS
  • area: main
  • in suites: lenny, squeeze
  • size: 2,284 kB
  • ctags: 2
  • sloc: perl: 173; sh: 61; makefile: 47
file content (333 lines) | stat: -rw-r--r-- 15,282 bytes parent folder | download | duplicates (11)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
                         esk soubor afix

                              Prefixy

V etin se pouv nkolik destek pepon. Protoe jsou distribuovny
nepravideln a poet pznak pouitelnch programem ispell je nedostaten,
byly v eskm slovnku pro ispell pouity pro pedpony pouze tyi pznaky:

N - generuje pedponu ne- (zejmna pro slovesa, pdavn jmna a pslovce)
E - generuje pedponu nej- (vytvoen tetho stupn ze druhho stupn
    pdavnch jmen)
W - generuje pedpony ne-, nej- a nejne- (pro druh stupe pdavnch jmen;
    vytv zpor a tet stupe vetn zporu)
F - generuje pedpony jedna-, dvaa-, tia-, tyia-, tyrya-, pta-, esta-,
    sedma-, osma-, devta- (pro slovky a sloeniny obsahujc slovky
    jako jednadvacet)

Pro snadn pouvn ostatnch pedpon jsou ve zdrojovch souborech pouity
seznamy tvaru {,do,po,pi,u,vy,za}hladit/ACN. Tyto seznamy jsou perlovm
skriptem glob.p expandovny na seznam slov, kter ji lze pout jako
vstup programu buildhash:

hladit/ACN
dohladit/ACN
pohladit/ACN
pihladit/ACN
uhladit/ACN
vyhladit/ACN
zahladit/ACN

Skript glob.p pracuje tak, e rozdluje ten dky na etzce neobsahujc
mezeru ani pomlku i spojovnk. Pokud nkter z takto vzniklch etzc
obsahuje seznam uzaven ve sloench zvorkch a skldajc se z podetzc
oddlench rkami, bude tento etzec nahrazen sadou etzc, kter z nj
vzniknou postupnm nahrazovnm celho seznamu jeho jednotlivmi prvky.
Vechny vsledn etzce jsou vypisovny po jednom na dku.

Skript glob.p by bylo mon pout i pro jin ely ne pro expanzi
seznam pedpon - napklad pro slova jako balk{o,}n/H. Toto pouit vak
nedoporuuji, protoe by mohlo psobit problmy jinm pomocnm programm
a skriptm pro zpracovn eskho slovnku.

Skript glob.p nen schopen expandovat v jednom etzci vce ne jeden seznam
(napklad {nad,od,pod}{,e}pisovn/SN), ani vnoen seznamy. Protoe vak
kad dek rozdl na etzce v mstech mezer nebo pomlek, me bt na
jednom dku vce seznam.

Vloen vech pouitelnch pedpon k jednotlivm slovm mus tedy zajistit
osoba, kter vytv nebo roziuje slovnk. Pitom je teba dvat pozor
na to, e nkter pedpony mn vid sloves (honit x dohonit), tranzitivitu
a tm i existenci trpnho rodu (jsat x rozjsat), psob zmny ve slovnm
zkladu (brt x sebrat) i ve zpsobu ohbn (krst > kradu x ukrst >
ukradnu), a tm i mn pznaky pslunch slov.

Pro slovesa se pouvaj nejastji pedpony do-, na-, nad-, nade-, o-, ob-,
obe-, od-, ode-, po-, pod-, pode-, popo-, pou-, poz-, pro-, pe-, ped-,
pede-, pi-, roz-, roze-, s-, se-, sou-, spo-, spolu-, u-, v-, ve-, vy-,
vz-, z-, za- a ze-; pro podstatn jmna bez-, beze-, do-, d-, n-, nad-,
nade-, o-, ob-, obe-, od-, ode-, mezi-, po-, pod-, pode-, popo-, pou-,
pro-, pr-, pe-, ped-, pede-, p-, roz-, roze-, s-, se-, sou-, spo-,
spolu-, -, v-, ve-, v-, vz-, z-, ze- a z; pro pdavn jmna a pslovce
se pouvaj vechny ve uveden pedpony a ppony vyjadujc mnostv
jako jedno-, dvou-, dvoj-, t-, troj-, vce-, mnoho-, mlo-, pomrn
asto se vyskytuj tak ciz pedpony a-, anti-, de-, dez-, in-, inter-,
intra-, im-, re-, trans-, un-, mono-, di-, tri-, single-, multi- a dal.

                               Sufixy

Nkter slova se sklouj nebo asuj podle vce vzor. Pro tato slova
je teba uvdt vechny pznaky, i kdy nkter z nich negeneruj dn
tvary navc (napklad kln/HL i kdy by stailo kln/L). Slovnk bude
pravdpodobn pouit i pro jin programy ne ispell, a v nich budou
takovto informace potebn.

            Pznaky pro podstatn jmna muskho rodu ivotn

P - generuje vechny tvary podstatnch jmen vzor pn a pedseda krom 1.
    pdu mnonho sla; vchoz tvar je 1. pd jednotnho sla

Pznak P lze pout i pro slova konc na -o skloovan podle vzoru pn
(dingo, pjmen Bidlo apod.), pro ciz jmna konc na -e, kter se pi
skloovn odsouv (Goethe, Shakespeare) i pro slova konc na -u (guru,
gurua). U slov koncch na -ek a -k se toto e/ v dalch tvarech vypout,
stejn tomu je i u slov koncch na -el, ped kterm nen b, d, t, , ,
i, o nebo u. Slova, kter tomuto nevyhovuj (lev, bel a syn - 5. pd
jednotnho sla synu nikoli syne) a u kterch dochz ke zmn slovnho
zkladu (bh, vl, pn) mus bt uvedena jako nepravideln se vemi tvary.

Podle monch tvar 1. pdu mnonho sla se pznak P dopluje jednm
nebo nkolika z pznak I, D, V. Pznak I generuje koncovku -i (vetn
mken h > zi, ch > i, r > i, k > ci), pznak D koncovku - a pznak
V koncovku -ov.

D - generuje tvary cizch podstatnch jmen zakonench v 1. pd mnonho
    sla koncovkou -es, -os nebo -us (Aristoteles, diskobolos, Kristus),
    kter se v dalch tvarech vypout

Pznak D m tedy dv funkce: u slov zakonench -es, -os nebo -us generuje
vechny tvary podstatnho jmna vzoru pn, zatmco u ostatnch slov generuje
pouze koncovku -.

U - generuje vechny tvary podstatnch jmen vzoru mu a soudce, krom tvaru
    pro 1. pd mnonho sla s koncovkou -ov; u slov zakonench na -ec
    a -e (s vjimkou -le) vypout -e-

Ze ivotnch podstatnch jmen muskho rodu lze obvykle vytvoit pdavn
jmna individuln pivlastovac (vzor otcv). Tato pdavn jmna je nutn
uvst ve slovnku zvlṻ s pznakem Y.

           Pznaky pro podstatn jmna muskho rodu neivotn

H - generuje vechny tvary podle vzoru hrad bez pohybnho -e-, krom
    tvaru s koncovkou -
Q - generuje vechny tvary podle vzoru hrad s pohybnm -e-, krom tvaru
    s koncovkou -, a dle vechny tvary slov podle vzoru hrad, zakonench
    v 1. pd jednotnho sla na -us nebo -os, kter se v dalch pdech
    odsouv, u slov na -ismus generuje t tvary na -izmus
L - generuje vechny tvary podle podvzoru ostrov (nebo les, kter ovem
    kols mezi vzory ostrov a hrad), vetn tvaru s koncovkou -
R - generuje tvar s koncovkou -
S - generuje tvary podle vzoru stroj

Pro podstatn jmna skloovan podle vzoru hrad (2. pd hradu) je teba
vybrat pznak H, pokud nemaj pohybn -e-, nebo pznak Q, pokud pohybn
-e- maj. Podle tvaru 1. pdu jednotnho sla nelze zjistit, zda je ve
slov pohybn -e- nebo nen. Napklad ve slov lek zvis pohybnost -e-
na vznamu: ve vznamu "leknut" se sklouje lek, leku, zatmco ve vznamu
"mal l" se sklouje lek, lku.

Pznak H lze pout i pro ciz slova s koncovm -e skloovan podle vzoru
hrad (software) a pro pomnon podstatn jmna vzoru hrad (rozpaky).

U slov, kter maj koncovku -, je nutn uvst tak pznak R.

U slov s koncovkou -us nebo -os generuje pznak H tvary -usu, -usem (nap.
autobus, autobusu, ...), zatmco pznak Q tvary bez -us- (nap. realismus,
realismu, ...; generuje i realizmus, realizmu, ...).

Pznak Q m tedy vce funkc; krom generovn vech tvar vzoru hrad pro
slova s pohybnm -e- a generovn vech tvar slov, kter jsou skloovna
podle vzoru hrad, a jsou zakoneny na odsouvan -us a -os, se pouv i pro
generovn tvar s przdnou koncovkou pro slova podle vzor ena, re a
msto. Tak pznak S m vce funkc, krom vzoru stroj se pouv i pro
vzor staven a pro jednotn slo vzoru re.

                Pznaky pro podstatn jmna enskho rodu

Z - generuje tvary vzor ena, re (ne) a pse
K - generuje tvary vzoru kost
Q - generuje tvar s nulovou koncovkou pro slova vzoru ena a re
C - generuje tvary mnonho sla vzoru re (Daleice, dvee)
S - generuje tvary jednotnho sla vzoru re (Roudnice)

Pro podstatn jmna enskho rodu se pouv pznak Z nebo K. Pro slova
vzoru ena a re, kter maj v 2. pd mnonho sla pravideln tvar
s przdnou koncovkou se pidv pznak Q. Nen-li tvar 2. pdu mnonho
sla pravideln (houba > hub), uvede se ve slovnku na jednom dku slovo
s pznakem Z a tvar 2. pdu mnonho sla.

Pznak Z lze pout i pro ciz slova typu Antarktis. V tomto ppad
vygeneruje 1. pd jednotnho sla s tvarem -ida a dal tvary krom
2. pdu mnonho sla (kter generuje pznak Q).

Existuje tm kontinuum slov kolsajcch mezi vzory pse a kost. U
nkterch slov lze pout kombinaci pznak KZ, u jinch ZI, nkdy je
teba jet doplnit chybjc tvary, vjimen je nutn slovo povaovat
(pro ispell) za nepravideln. Pro vyzkouen generovanch tvar lze pout
pkaz sh inter a na vzvu ispell.cz: zadat slovo s lomtkem a pznaky,
napklad mod/ZI.

Pro pomnon jmna vzoru re se pouv pznak C, kter na rozdl od
pznaku Z generuje i tvar 2. pdu mnonho sla. A naopak, zejmna pro
jmna obc, kter maj tvary jednotnho sla vzoru re (Roudnice, Suice)
je vhodn pout pznak S generujc pouze tvary jednotnho sla (i kdy
v nkterch ppadech me bt pouit mnonho sla namst, napklad
mluv-li se o vce obcch stejnho jmna).

Z podstatnch jmen enskho rodu, kter oznauj osoby, nkter zvata
apod., lze obvykle vytvoit pdavn jmna individuln pivlastovac
(vzor matin). Tato pdavn jmna je nutn uvst ve slovnku zvlṻ
s pznakem Y.

                Pznaky pro podstatn jmna stednho rodu

M - generuje tvary vzor msto, moe, krom tvar vzoru msto s koncovkou
    -/-e a s przdnou koncovkou, funguje tak pro slova typu akvrium
K - generuje tvary vzoru kue a slov typu tma (tmatu, ...)
S - generuje tvary vzoru staven
C - generuje tvary jednotnho sla vzoru staven (pro hromadn podstatn
    jmna)
Q - generuje tvar s przdnou koncovkou pro slova vzoru msto
R - generuje tvar s koncovkou -/-e pro slova vzoru msto

Pro slova vzoru msto, kter maj v 2. pd mnonho sla pravideln tvar
s przdnou koncovkou se pidv pznak Q. Slova jako psmeno, semeno mus
bt uvedena s pznaky MQRI a navc mus bt zvlṻ uveden tvar s koncovkou
-e (psmene).

                      Pznaky pro pdavn jmna

Univerzlnm pznakem pro pdavn jmna je pznak Y, kter generuje tvary
pdavnch jmen podle vzor mlad, jarn (lze pout i na druh stupe
pdavnch jmen jako mlad), otcv i matin. Dal pznaky se pouvaj
pro odvozovn:

K - odvozuje nzvy vlastnost - podstatn jmna vzoru kost (mlad > mladost)
C - odvozuje nzvy vlastnost s mkenm (exotick > exotinost oproti
    pznaku K: anglick > anglickost)
R - odvozuje pslovce, dochz k mken -k > -ce, -ch > -e, -h > -ze,
    -r > -e, -[dtnbpvm] > -[dtnbpvm]
O - odvozuje pslovce, bez mken (dlouh > dlouho)

N - pouze pedpona ne-
E - pouze pedpona nej-
W - pedpony ne-, nej- a nejne-

Pznak Y lze pout i pro skloovn podstatnch jmen vzor hajn, prvod,
hajn, jzdn, telec i podstatnch jmen yetti, pony, grizzly, regenschori
a cizch slov na -oj, -ij (Tolstoj, Dostojevskij).


                          Pznaky pro zjmena

Y - generuje tvary substantivnho skloovn podle vzor mlad a jarn, dle
    tvary pro slova typu kdo, co, mj, n a ten (krom samotnho slova co).


                          Pznaky pro slovesa

A - z infinitivu generuje vechny tvary sloves krom pest trpnho
    pro vechny vzory krom vzor krt, dlat (volat), szet a tnout
    a nkterch slov prvn slovesn tdy se zmnou kmene
B - z infinitivu generuje vechny tvary sloves krom pest trpnho
    pro vzor krt, dle generuje tvary ptomnho asu a tvary
    rozkazovacho zpsobu z 1. nebo 3. osoby jednotnho sla - lze
    pout pro vygenerovn tvar oznamovacho zpsobu pro slovesa
    prvn slovesn tdy se zmnou kmene
J - z infinitivu generuje vechny tvary sloves krom pest trpnho
    pro vzory dlat (volat), szet a tnout
T - generuje z infinitivu tvary trpnho rodu bez mken
C - generuje z infinitivu tvary trpnho rodu s mkenm
    (pemoci > pemoen, sytit > sycen, hladit > hlazen, prosit > proen,
    vozit > voen, myslit > mylen, hustit > hutn, opozdit > opodn,
    thnout > taen, nadchnout > naden, stihnout > stien, svlknout
    > svleen, tisknout > titn, odemknout > odemen)
O - generuje z muskho rodu minulho i trpnho pest dal tvary
X - generuje tvary pechodnku minulho z muskho rodu pechodnku minulho
    nebo i z infinitivu
N - generuje pedponu ne-

Dky existenci pechodnku budoucho se tm ze vech sloves (dokonavch
i nedokonavch) generuj tvary pechodnku ptomnho.

Ve slovnku doposud chyb jakkoli informace o dokonavosti sloves. Tuto
informaci bude nutn doplnit pro pidn pznaku X, kter lze pout pouze
pro dokonav slovesa. Naopak z nedokonavch sloves je teba vygenerovat
pdavn jmna typu dlajc a pidat je do slovnku s pznaky YN.

                          Pznaky pro slovky

Pro slovky lze pouvat nsledujc pznaky:

ZQ - pro slovky skloovan podle vzoru ena (nula, jednika, dvojka, ...)
     a re (dvojice, ...)
I  - pro koncovku -i (pt, est, ...)
Y  - pro slovky skloovan jako pdavn jmna (prvn, druh, ...)

Ojedinle lze pout dal pznaky pro slova, kter se sklouj jako
podstatn jmna (sto, tisc, milion), a pznaky N a F.

                          Pznaky pro pslovce

Pslovce je vhodn v nejvy mon me odvozovat z pdavnch jmen pomoc
pznak R a O. V nkterch ppadech jsou pro pslovce pouiteln pznaky
N, E a W popsan v kapitole Prefixy.

                             Nesklonn slova

Ojedinle lze pout nkter z pznak pro vygenerovan jinho slova
z nesklonnho slova (pznak N).

                             Pomocn skripty

Pro ovovn, zda je slovo uvedeno ve slovnku a jak tvary jsou generovny
pouitm uritch pznakm lze pout skript inter:

sh inter              # Sputn skriptu
ispell.cz: husit
ispell.cz:            (dn odpov) Slovo husit ve slovnku je
ispell.cz: husiti
husiti                Slovo husiti ve slovnku nen
ispell.cz: husita/PD
husita                Vpis vech tvar generovanch pouit pznak P a D
husit                na slovo husita
husitech
husito
husitou
husitovi
husitu
husit
husitm
husity
ispell.cz: Ctrl-D    Ukonen skriptu

Pro ulehen prce s piazovnm pznak lze pout skript blemma, kter
se podle tvar natench slov pokus pevst tato slova do zkladnho tvaru
a piadit jim pznaky. Skript blemma nepouv dn slovnk a vychz
pouze z tvar slov, proto je jeho innost nzk (asi 40%) a dl chyby,
take jeho vstup je nutn pekontrolovat. :-(

Pkaz

    perl blemma -f soubor | sort -u

vype na standardn vstup slova, kterm se podailo piadit pznaky;
pkaz

    perl blemma -r soubor

slova, u nich se to nepodailo.

                          Nevyeen problmy

Nkter problmy se pravdpodobn nedaj rozumn eit pomoc ispellu:

- Nkter zkratky (nap., atd.) by mly bt povaovny za bezchybn, pouze
  pokud je za nimi teka.
- stice -li by mla bt povaovna za bezchybnou, pouze je-li ped n
  spojovnk.
- Povolit sloeniny, jejich prvn sloka je tvoena slovy jako jsou
  modro-, tmavo-, bled-, krtko-, mnoho-, a druh je pdavn jmno,
  pslovce apod.. Mon lze njakm zpsobem pout volbu ~ u nkterho
  pznaku. Pitom se nesm povolit sloeniny obecn.