File: ceskeaff.txt

package info (click to toggle)
ispell-czech 20040229-4.1
  • links: PTS
  • area: main
  • in suites: lenny
  • size: 3,580 kB
  • ctags: 5
  • sloc: perl: 711; makefile: 70; sh: 43
file content (333 lines) | stat: -rw-r--r-- 15,282 bytes parent folder | download | duplicates (9)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
                         �esk� soubor afix�

                              Prefixy

V �e�tin� se pou��v� n�kolik des�tek p�epon. Proto�e jsou distribuov�ny
nepravideln� a po�et p��znak� pou�iteln�ch programem ispell je nedostate�n�,
byly v �esk�m slovn�ku pro ispell pou�ity pro p�edpony pouze �ty�i p��znaky:

N - generuje p�edponu ne- (zejm�na pro slovesa, p��davn� jm�na a p��slovce)
E - generuje p�edponu nej- (vytvo�en� t�et�ho stupn� ze druh�ho stupn�
    p��davn�ch jmen)
W - generuje p�edpony ne-, nej- a nejne- (pro druh� stupe� p��davn�ch jmen;
    vytv��� z�por a t�et� stupe� v�etn� z�poru)
F - generuje p�edpony jedna-, dvaa-, t�ia-, �ty�ia-, �tyrya-, p�ta-, �esta-,
    sedma-, osma-, dev�ta- (pro ��slovky a slo�eniny obsahuj�c� ��slovky
    jako jednadvacet)

Pro snadn� pou��v�n� ostatn�ch p�edpon jsou ve zdrojov�ch souborech pou�ity
seznamy tvaru {,do,po,p�i,u,vy,za}hladit/ACN. Tyto seznamy jsou perlov�m
skriptem glob.p expandov�ny na seznam slov, kter� ji� lze pou��t jako
vstup programu buildhash:

hladit/ACN
dohladit/ACN
pohladit/ACN
p�ihladit/ACN
uhladit/ACN
vyhladit/ACN
zahladit/ACN

Skript glob.p pracuje tak, �e rozd�luje �ten� ��dky na �et�zce neobsahuj�c�
mezeru ani poml�ku �i spojovn�k. Pokud n�kter� z takto vznikl�ch �et�zc�
obsahuje seznam uzav�en� ve slo�en�ch z�vork�ch a skl�daj�c� se z pod�et�zc�
odd�len�ch ��rkami, bude tento �et�zec nahrazen sadou �et�zc�, kter� z n�j
vzniknou postupn�m nahrazov�n�m cel�ho seznamu jeho jednotliv�mi prvky.
V�echny v�sledn� �et�zce jsou vypisov�ny po jednom na ��dku.

Skript glob.p by bylo mo�n� pou��t i pro jin� ��ely ne� pro expanzi
seznam� p�edpon - nap��klad pro slova jako balk{o,�}n/H. Toto pou�it� v�ak
nedoporu�uji, proto�e by mohlo p�sobit probl�my jin�m pomocn�m program�m
a skript�m pro zpracov�n� �esk�ho slovn�ku.

Skript glob.p nen� schopen expandovat v jednom �et�zci v�ce ne� jeden seznam
(nap��klad {nad,od,pod}{,e}pisov�n�/SN), ani vno�en� seznamy. Proto�e v�ak
ka�d� ��dek rozd�l� na �et�zce v m�stech mezer nebo poml�ek, m��e b�t na
jednom ��dku v�ce seznam�.

Vlo�en� v�ech pou�iteln�ch p�edpon k jednotliv�m slov�m mus� tedy zajistit
osoba, kter� vytv��� nebo roz�i�uje slovn�k. P�itom je t�eba d�vat pozor
na to, �e n�kter� p�edpony m�n� vid sloves (honit x dohonit), tranzitivitu
a t�m i existenci trpn�ho rodu (j�sat x rozj�sat), p�sob� zm�ny ve slovn�m
z�kladu (br�t x sebrat) �i ve zp�sobu oh�b�n� (kr�st > kradu x ukr�st >
ukradnu), a t�m i m�n� p��znaky p��slu�n�ch slov.

Pro slovesa se pou��vaj� nej�ast�ji p�edpony do-, na-, nad-, nade-, o-, ob-,
obe-, od-, ode-, po-, pod-, pode-, popo-, pou-, poz-, pro-, p�e-, p�ed-,
p�ede-, p�i-, roz-, roze-, s-, se-, sou-, spo-, spolu-, u-, v-, ve-, vy-,
vz-, z-, za- a ze-; pro podstatn� jm�na bez-, beze-, do-, d�-, n�-, nad-,
nade-, o-, ob-, obe-, od-, ode-, mezi-, po-, pod-, pode-, popo-, pou-,
pro-, pr�-, p�e-, p�ed-, p�ede-, p��-, roz-, roze-, s-, se-, sou-, spo-,
spolu-, �-, v-, ve-, v�-, vz-, z-, ze- a z�; pro p��davn� jm�na a p��slovce
se pou��vaj� v�echny v��e uveden� p�edpony a p��pony vyjad�uj�c� mno�stv�
jako jedno-, dvou-, dvoj-, t��-, troj-, v�ce-, mnoho-, m�lo-, pom�rn�
�asto se vyskytuj� tak� ciz� p�edpony a-, anti-, de-, dez-, in-, inter-,
intra-, im-, re-, trans-, un-, mono-, di-, tri-, single-, multi- a dal��.

                               Sufixy

N�kter� slova se sklo�uj� nebo �asuj� podle v�ce vzor�. Pro tato slova
je t�eba uv�d�t v�echny p��znaky, i kdy� n�kter� z nich negeneruj� ��dn�
tvary nav�c (nap��klad kl�n/HL i kdy� by sta�ilo kl�n/L). Slovn�k bude
pravd�podobn� pou�it i pro jin� programy ne� ispell, a v nich budou
takov�to informace pot�ebn�.

            P��znaky pro podstatn� jm�na mu�sk�ho rodu �ivotn�

P - generuje v�echny tvary podstatn�ch jmen vzor� p�n a p�edseda krom� 1.
    p�du mno�n�ho ��sla; v�choz� tvar je 1. p�d jednotn�ho ��sla

P��znak P lze pou��t i pro slova kon��c� na -o sklo�ovan� podle vzoru p�n
(dingo, p��jmen� Bidlo apod.), pro ciz� jm�na kon��c� na -e, kter� se p�i
sklo�ov�n� odsouv� (Goethe, Shakespeare) i pro slova kon��c� na -u (guru,
gurua). U slov kon��c�ch na -ek a -�k se toto e/� v dal��ch tvarech vypou�t�,
stejn� tomu je i u slov kon��c�ch na -el, p�ed kter�m nen� b, d, t, �, �,
i, o nebo u. Slova, kter� tomuto nevyhovuj� (lev, ��bel a syn - 5. p�d
jednotn�ho ��sla synu nikoli syne) a u kter�ch doch�z� ke zm�n� slovn�ho
z�kladu (b�h, v�l, p�n) mus� b�t uvedena jako nepravideln� se v�emi tvary.

Podle mo�n�ch tvar� 1. p�du mno�n�ho ��sla se p��znak P dopl�uje jedn�m
nebo n�kolika z p��znak� I, D, V. P��znak I generuje koncovku -i (v�etn�
m�k�en� h > zi, ch > �i, r > �i, k > ci), p��znak D koncovku -� a p��znak
V koncovku -ov�.

D - generuje tvary ciz�ch podstatn�ch jmen zakon�en�ch v 1. p�d� mno�n�ho
    ��sla koncovkou -es, -os nebo -us (Aristoteles, diskobolos, Kristus),
    kter� se v dal��ch tvarech vypou�t�

P��znak D m� tedy dv� funkce: u slov zakon�en�ch -es, -os nebo -us generuje
v�echny tvary podstatn�ho jm�na vzoru p�n, zat�mco u ostatn�ch slov generuje
pouze koncovku -�.

U - generuje v�echny tvary podstatn�ch jmen vzoru mu� a soudce, krom� tvaru
    pro 1. p�d mno�n�ho ��sla s koncovkou -ov�; u slov zakon�en�ch na -ec
    a -e� (s v�jimkou -le�) vypou�t� -e-

Ze �ivotn�ch podstatn�ch jmen mu�sk�ho rodu lze obvykle vytvo�it p��davn�
jm�na individu�ln� p�ivlast�ovac� (vzor otc�v). Tato p��davn� jm�na je nutn�
uv�st ve slovn�ku zvlṻ s p��znakem Y.

           P��znaky pro podstatn� jm�na mu�sk�ho rodu ne�ivotn�

H - generuje v�echny tvary podle vzoru hrad bez pohybn�ho -e-, krom�
    tvaru s koncovkou -�
Q - generuje v�echny tvary podle vzoru hrad s pohybn�m -e-, krom� tvaru
    s koncovkou -�, a d�le v�echny tvary slov podle vzoru hrad, zakon�en�ch
    v 1. p�d� jednotn�ho ��sla na -us nebo -os, kter� se v dal��ch p�dech
    odsouv�, u slov na -ismus generuje t� tvary na -izmus
L - generuje v�echny tvary podle podvzoru ostrov (nebo les, kter� ov�em
    kol�s� mezi vzory ostrov a hrad), v�etn� tvaru s koncovkou -�
R - generuje tvar s koncovkou -�
S - generuje tvary podle vzoru stroj

Pro podstatn� jm�na sklo�ovan� podle vzoru hrad (2. p�d hradu) je t�eba
vybrat p��znak H, pokud nemaj� pohybn� -e-, nebo p��znak Q, pokud pohybn�
-e- maj�. Podle tvaru 1. p�du jednotn�ho ��sla nelze zjistit, zda je ve
slov� pohybn� -e- nebo nen�. Nap��klad ve slov� �lek z�vis� pohybnost -e-
na v�znamu: ve v�znamu "leknut�" se sklo�uje �lek, �leku, zat�mco ve v�znamu
"mal� �l" se sklo�uje �lek, �lku.

P��znak H lze pou��t i pro ciz� slova s koncov�m -e sklo�ovan� podle vzoru
hrad (software) a pro pomno�n� podstatn� jm�na vzoru hrad (rozpaky).

U slov, kter� maj� koncovku -�, je nutn� uv�st tak� p��znak R.

U slov s koncovkou -us nebo -os generuje p��znak H tvary -usu, -usem (nap�.
autobus, autobusu, ...), zat�mco p��znak Q tvary bez -us- (nap�. realismus,
realismu, ...; generuje i realizmus, realizmu, ...).

P��znak Q m� tedy v�ce funkc�; krom� generov�n� v�ech tvar� vzoru hrad pro
slova s pohybn�m -e- a generov�n� v�ech tvar� slov, kter� jsou sklo�ov�na
podle vzoru hrad, a jsou zakon�eny na odsouvan� -us a -os, se pou��v� i pro
generov�n� tvar� s pr�zdnou koncovkou pro slova podle vzor� �ena, r��e a
m�sto. Tak� p��znak S m� v�ce funkc�, krom� vzoru stroj se pou��v� i pro
vzor staven� a pro jednotn� ��slo vzoru r��e.

                P��znaky pro podstatn� jm�na �ensk�ho rodu

Z - generuje tvary vzor� �ena, r��e (n��e) a p�se�
K - generuje tvary vzoru kost
Q - generuje tvar s nulovou koncovkou pro slova vzoru �ena a r��e
C - generuje tvary mno�n�ho ��sla vzoru r��e (Dale�ice, dve�e)
S - generuje tvary jednotn�ho ��sla vzoru r��e (Roudnice)

Pro podstatn� jm�na �ensk�ho rodu se pou��v� p��znak Z nebo K. Pro slova
vzoru �ena a r��e, kter� maj� v 2. p�d� mno�n�ho ��sla pravideln� tvar
s pr�zdnou koncovkou se p�id�v� p��znak Q. Nen�-li tvar 2. p�du mno�n�ho
��sla pravideln� (houba > hub), uvede se ve slovn�ku na jednom ��dku slovo
s p��znakem Z a tvar 2. p�du mno�n�ho ��sla.

P��znak Z lze pou��t i pro ciz� slova typu Antarktis. V tomto p��pad�
vygeneruje 1. p�d jednotn�ho ��sla s tvarem -ida a dal�� tvary krom�
2. p�du mno�n�ho ��sla (kter� generuje p��znak Q).

Existuje t�m�� kontinuum slov kol�saj�c�ch mezi vzory p�se� a kost. U
n�kter�ch slov lze pou��t kombinaci p��znak� KZ, u jin�ch ZI, n�kdy je
t�eba je�t� doplnit chyb�j�c� tvary, v�jime�n� je nutn� slovo pova�ovat
(pro ispell) za nepravideln�. Pro vyzkou�en� generovan�ch tvar� lze pou��t
p��kaz sh inter a na v�zvu ispell.cz: zadat slovo s lom�tkem a p��znaky,
nap��klad mod�/ZI.

Pro pomno�n� jm�na vzoru r��e se pou��v� p��znak C, kter� na rozd�l od
p��znaku Z generuje i tvar 2. p�du mno�n�ho ��sla. A naopak, zejm�na pro
jm�na obc�, kter� maj� tvary jednotn�ho ��sla vzoru r��e (Roudnice, Su�ice)
je vhodn� pou��t p��znak S generuj�c� pouze tvary jednotn�ho ��sla (i kdy�
v n�kter�ch p��padech m��e b�t pou�it� mno�n�ho ��sla nam�st�, nap��klad
mluv�-li se o v�ce obc�ch stejn�ho jm�na).

Z podstatn�ch jmen �ensk�ho rodu, kter� ozna�uj� osoby, n�kter� zv��ata
apod., lze obvykle vytvo�it p��davn� jm�na individu�ln� p�ivlast�ovac�
(vzor mat�in). Tato p��davn� jm�na je nutn� uv�st ve slovn�ku zvlṻ
s p��znakem Y.

                P��znaky pro podstatn� jm�na st�edn�ho rodu

M - generuje tvary vzor� m�sto, mo�e, krom� tvar� vzoru m�sto s koncovkou
    -�/-e a s pr�zdnou koncovkou, funguje tak� pro slova typu akv�rium
K - generuje tvary vzoru ku�e a slov typu t�ma (t�matu, ...)
S - generuje tvary vzoru staven�
C - generuje tvary jednotn�ho ��sla vzoru staven� (pro hromadn� podstatn�
    jm�na)
Q - generuje tvar s pr�zdnou koncovkou pro slova vzoru m�sto
R - generuje tvar s koncovkou -�/-e pro slova vzoru m�sto

Pro slova vzoru m�sto, kter� maj� v 2. p�d� mno�n�ho ��sla pravideln� tvar
s pr�zdnou koncovkou se p�id�v� p��znak Q. Slova jako p�smeno, semeno mus�
b�t uvedena s p��znaky MQRI a nav�c mus� b�t zvlṻ uveden tvar s koncovkou
-e (p�smene).

                      P��znaky pro p��davn� jm�na

Univerz�ln�m p��znakem pro p��davn� jm�na je p��znak Y, kter� generuje tvary
p��davn�ch jmen podle vzor� mlad�, jarn� (lze pou��t i na druh� stupe�
p��davn�ch jmen jako mlad��), otc�v i mat�in. Dal�� p��znaky se pou��vaj�
pro odvozov�n�:

K - odvozuje n�zvy vlastnost� - podstatn� jm�na vzoru kost (mlad� > mladost)
C - odvozuje n�zvy vlastnost� s m�k�en�m (exotick� > exoti�nost oproti
    p��znaku K: anglick� > anglickost)
R - odvozuje p��slovce, doch�z� k m�k�en� -k� > -ce, -ch� > -�e, -h� > -ze,
    -r� > -�e, -[dtnbpvm]� > -[dtnbpvm]�
O - odvozuje p��slovce, bez m�k�en� (dlouh� > dlouho)

N - pouze p�edpona ne-
E - pouze p�edpona nej-
W - p�edpony ne-, nej- a nejne-

P��znak Y lze pou��t i pro sklo�ov�n� podstatn�ch jmen vzor� hajn�, pr�vod��,
hajn�, j�zdn�, telec� i podstatn�ch jmen yetti, pony, grizzly, regenschori
a ciz�ch slov na -oj, -ij (Tolstoj, Dostojevskij).


                          P��znaky pro z�jmena

Y - generuje tvary substantivn�ho sklo�ov�n� podle vzor� mlad� a jarn�, d�le
    tvary pro slova typu kdo, co, m�j, n� a ten (krom� samotn�ho slova co).


                          P��znaky pro slovesa

A - z infinitivu generuje v�echny tvary sloves krom� p���est� trpn�ho
    pro v�echny vzory krom� vzor� kr�t, d�lat (volat), s�zet a tnout
    a n�kter�ch slov prvn� slovesn� t��dy se zm�nou kmene
B - z infinitivu generuje v�echny tvary sloves krom� p���est� trpn�ho
    pro vzor kr�t, d�le generuje tvary p��tomn�ho �asu a tvary
    rozkazovac�ho zp�sobu z 1. nebo 3. osoby jednotn�ho ��sla - lze
    pou��t pro vygenerov�n� tvar� oznamovac�ho zp�sobu pro slovesa
    prvn� slovesn� t��dy se zm�nou kmene
J - z infinitivu generuje v�echny tvary sloves krom� p���est� trpn�ho
    pro vzory d�lat (volat), s�zet a tnout
T - generuje z infinitivu tvary trpn�ho rodu bez m�k�en�
C - generuje z infinitivu tvary trpn�ho rodu s m�k�en�m
    (p�emoci > p�emo�en, sytit > sycen, hladit > hlazen, prosit > pro�en,
    vozit > vo�en, myslit > my�len, hustit > hu�t�n, opozdit > opo�d�n,
    t�hnout > ta�en, nadchnout > nad�en, stihnout > sti�en, svl�knout
    > svle�en, tisknout > ti�t�n, odemknout > odem�en)
O - generuje z mu�sk�ho rodu minul�ho �i trpn�ho p���est� dal�� tvary
X - generuje tvary p�echodn�ku minul�ho z mu�sk�ho rodu p�echodn�ku minul�ho
    nebo i z infinitivu
N - generuje p�edponu ne-

D�ky existenci p�echodn�ku budouc�ho se t�m�� ze v�ech sloves (dokonav�ch
i nedokonav�ch) generuj� tvary p�echodn�ku p��tomn�ho.

Ve slovn�ku doposud chyb� jak�koli informace o dokonavosti sloves. Tuto
informaci bude nutn� doplnit pro p�id�n� p��znaku X, kter� lze pou��t pouze
pro dokonav� slovesa. Naopak z nedokonav�ch sloves je t�eba vygenerovat
p��davn� jm�na typu d�laj�c� a p�idat je do slovn�ku s p��znaky YN.

                          P��znaky pro ��slovky

Pro ��slovky lze pou��vat n�sleduj�c� p��znaky:

ZQ - pro ��slovky sklo�ovan� podle vzoru �ena (nula, jedni�ka, dvojka, ...)
     a r��e (dvojice, ...)
I  - pro koncovku -i (p�t, �est, ...)
Y  - pro ��slovky sklo�ovan� jako p��davn� jm�na (prvn�, druh�, ...)

Ojedin�le lze pou��t dal�� p��znaky pro slova, kter� se sklo�uj� jako
podstatn� jm�na (sto, tis�c, milion), a p��znaky N a F.

                          P��znaky pro p��slovce

P��slovce je vhodn� v nejvy��� mo�n� m��e odvozovat z p��davn�ch jmen pomoc�
p��znak� R a O. V n�kter�ch p��padech jsou pro p��slovce pou�iteln� p��znaky
N, E a W popsan� v kapitole Prefixy.

                             Nesklonn� slova

Ojedin�le lze pou��t n�kter� z p��znak� pro vygenerovan� jin�ho slova
z nesklonn�ho slova (p��znak N).

                             Pomocn� skripty

Pro ov��ov�n�, zda je slovo uvedeno ve slovn�ku a jak� tvary jsou generov�ny
pou�it�m ur�it�ch p��znak�m lze pou��t skript inter:

sh inter              # Spu�t�n� skriptu
ispell.cz: husit�
ispell.cz:            (��dn� odpov��) Slovo husit� ve slovn�ku je
ispell.cz: husiti
husiti                Slovo husiti ve slovn�ku nen�
ispell.cz: husita/PD
husita                V�pis v�ech tvar� generovan�ch pou�it� p��znak� P a D
husit�                na slovo husita
husitech
husito
husitou
husitovi
husitu
husit�
husit�m
husity
ispell.cz: Ctrl-D    Ukon�en� skriptu

Pro uleh�en� pr�ce s p�i�azov�n�m p��znak� lze pou��t skript blemma, kter�
se podle tvar� na�ten�ch slov pokus� p�ev�st tato slova do z�kladn�ho tvaru
a p�i�adit jim p��znaky. Skript blemma nepou��v� ��dn� slovn�k a vych�z�
pouze z tvar� slov, proto je jeho ��innost n�zk� (asi 40%) a d�l� chyby,
tak�e jeho v�stup je nutn� p�ekontrolovat. :-(

P��kaz

    perl blemma -f soubor | sort -u

vyp�e na standardn� v�stup slova, kter�m se poda�ilo p�i�adit p��znaky;
p��kaz

    perl blemma -r soubor

slova, u nich� se to nepoda�ilo.

                          Nevy�e�en� probl�my

N�kter� probl�my se pravd�podobn� nedaj� rozumn� �e�it pomoc� ispellu:

- N�kter� zkratky (nap�., atd.) by m�ly b�t pova�ov�ny za bezchybn�, pouze
  pokud je za nimi te�ka.
- ��stice -li by m�la b�t pova�ov�na za bezchybnou, pouze je-li p�ed n�
  spojovn�k.
- Povolit slo�eniny, jejich� prvn� slo�ka je tvo�ena slovy jako jsou
  modro-, tmavo-, bled�-, kr�tko-, mnoho-, a druh� je p��davn� jm�no,
  p��slovce apod.. Mo�n� lze n�jak�m zp�sobem pou��t volbu ~ u n�kter�ho
  p��znaku. P�itom se nesm� povolit slo�eniny obecn�.