File: README.sk

package info (click to toggle)
aspell-sk 0.52-0-4
  • links: PTS
  • area: main
  • in suites: etch, etch-m68k, jessie, jessie-kfreebsd, lenny, squeeze, wheezy
  • size: 2,368 kB
  • ctags: 2
  • sloc: sh: 61; makefile: 13
file content (294 lines) | stat: -rw-r--r-- 12,680 bytes parent folder | download | duplicates (2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
�vod:
----
T�to verzia, ktor� obsahuje viac ako 859 000 slov, je vytvoren� pod�a
po�iadaviek Kevina Atkinsona - autora aspellu, tak�e u� ni� nebr�ni, 
aby ste aktu�lne verzie slovensk�ho slovn�ka pre aspell mohli n�js� 
aj v r�mci projektu aspell (http://aspell.net).

Pokia� viem, slovn�k by nemal obsahova� nespr�vne slov�, resp. nespr�vne 
tvary slov, ale moja osobn� sk�senos� s r�znymi slovn�kmi (aj komer�n�mi) 
je tak�, �e ni� nie je dokonal� a chyby sa vyskytuj� v�ade. Preto, 
ak n�jdete chybu, informujte ma o nej na adrese <zdpo@mailbox.sk>.

Ver�m, �e spolo�n�m �sil�m budeme m�c� vytvori� datab�zu slov, ktor� 
sa bude pribli�ova� k dokonalosti :-).


��renie:
-------
aspell-sk je ABSOL�TNE BEZ Z�RUKY. Ide o vo�ne ��rite�n� softv�r a jeho
��renie za ist�ch podmienok je v�tan�; podrobnosti z�skate v s�boroch 
COPYING, Copyright alebo gnu.sk.txt (slovensk� preklad GNU GPL 
od Juraja Koles�ra).

S�bory v tomto bal��ku s� v zdrojovej forme, skomprimovan� programom 
word-list-compress (s��as� bal��ka Aspell).


Vlastnosti:
----------
Hlavn�m cie�om aspellu je lep�ie vyh�ad�vanie 'pon�knut�ch slov' 
pri kontrole pravopisu. To znamen�, �e pokia� aspell n�jde nespr�vne 
slovo, tak by v�m mal pon�knu� to najvhodnej�ie (spr�vne) slovo 
na najvy��om mieste v ponuke.

aspell sa tie� sna�� u�i� z va�ich ch�b - zaznamen�va va�e preklepy, 
a pod�a nich sa sna�� n�js� najvhodnej�ie slov�.

Pokia� je vytvoren� osobn� slovn�k (.aspell.sk.pws), tento slovn�k sa
pri kontrole pou�ije ako prv�.

Je to jedin� kontrola pravopisu, ktor� mi funguje v programe LyX.

Pokia� viem, ako jedin� umo��uje pou��va� viac slovn�kov pre jeden jazyk.
Pridanie �al�ieho slovn�ka je jednoduch�. Vytvorte si svoj vlastn� zoznam
tak, aby jedno slovo bolo na jednom riadku. Tento zoznam usporiadajte 
('sort -u -f <vas.zoznam >tmp.subor') a potom vygenerujete nov� slovn�k 
pomocou pr�kazu:

  aspell --lang=sk create master ./slovak-moj-slovnik <tmp.subor
  
Potom skop�rujte 'slovak-moj-slovnik' do /usr/lib/aspell 
('cp ./slovak-moj-slovnik /usr/lib/aspell') a do s�boru ~/.aspell.conf
pridajte riadok:

  add-extra-dicts		slovak-moj-slovnik


Oproti ispellu m� aspell hlavne tieto nev�hody:
- je n�ro�nej�� na pam�
- pod�a niektor�ch reakci� je aspell pomal�� ako ispell (resp. je 
  n�ro�nej�� na hardv�r). V ka�dom pr�pade ja som aspell za�al pou��va� 
  na Pentiu 100MHz so 40M RAM (z�kladn� datab�za asi 40 000 slov) 
  a po upgrade na Duron 950MHz 256M RAM som zaznamenal zr�chlenie iba 
  pri generovan� (kompil�cii) slovn�ka, ale nie pri samotnej kontrole. 
  Tak�e teoreticky by nemal by� probl�m pou��va� aspell aj na slabom 
  hardv�ri. (Po prechode na verziu 0.50 m�m dojem, �e aspell je r�chlej��)

TIP: Pokia� je aspell pomal�, sk�ste si vytvori� svoj vlastn� slovn�k 
  (napr. tak, �e pozmen�te s�bory z tohoto projektu), ktor� bude obsahova�
  iba vami pou��van� slov�. V literat�re a aj z mojich testov viem, �e 
  �lovek m�lokedy pou��va viac ako 20 000 slov v p�somnom prejave, a preto
  slovn�k o ve�kosti viac ako 800 tis�c slov m�e by� pre va�e potreby
  zbyto�ne ve�k�.

�al�ie inform�cie (v angli�tine) n�jdete v dokument�cii, ktor� je s��as�ou
bal��ka Aspell.


In�tal�cia a konfigur�cia:
--------------------------
In�tal�cia prebieha pomocou klasickej kombin�cie:

	./configure
	make
	make install

V�etky nain�talovan� s�bory je mo�n� odstr�ni� pomocou pr�kazu:

	make uninstall

V /usr/share/doc/aspell-sk-0.52-0 sa nach�dza uk�kov� konfigura�n� s�bor
sample.aspell.conf. Pokia� chcete, skop�rujte ho do svojho domovsk�ho 
prie�inku pod n�zvom ".aspell.conf" (cp sample.aspell.conf ~/.aspell.conf). 
Pokia� chcete, aby bol platn� pre cel� v� opera�n� syst�m, tak ho 
skop�rujte do /etc pod n�zvom "aspell.conf". Aktu�lne nastavenie
Aspellu z�skate po zadan� tohto pr�kazu 'aspell dump config |less'

T�to podpora testovan� na distrib�cii Mandrake Linux 9.2 s aspell-0.50.5.

Dostupn� slovn�ky zist�te po zadan� pr�kazu 'aspell dump dicts'.
Pozor! Verzie slovn�kov z rady aspell-0.33.x nie s� kompatibiln� s verziami
z rady aspell-0.50.x! Z tohoto d�vodu in�talujte slovn�ky zo zdrojov�ch
s�borov (ftp://ftp.gnu.org/gnu/aspell).


Pou��vanie:
----------
V KDE spustite Ovl�dacie centrum (kliknut�m na ikonu, alebo pr�kazom 
'kcontrol'). V Osobn�ch nastaveniach kliknite na "Kontrola pravopisu".
Ako klienta si zvo�te "aspell" (Pokia� ho nem�te v ponuke, tak m�te probl�m
s in�tal�ciou - bu� aspellu alebo KDE), k�dovanie nastavte na "ISO 8859-2"
a slovn�k na "�tandardne - Slovensk� [sk]" pr�padne "Nezn�my [sk]".
Teraz m�te nastaven�, aby v�etky aplik�cie KDE pou��vali �tandardne ako
kontrolu pravopisu aspell. Samozrejme v��ina aplik�cii umo��uje, aby ste
pre ne pou�ili in� nastavenie.

Ak chcete pou��va� aspell v LyXe, tak do ~/.lyx/preferences (resp. lyxrc 
v ~/.lyx alebo v /usr/share/lyx/) dajte tieto riadky do sekcie 
"SPELLCHECKER SECTION" (nezabudnite odstr�ni� star� nastavenia!):
\spell_command "aspell"
\accept_compound true
\use_alt_language true
\alternate_language "sk"
\use_escape_chars true
\escape_chars "���������������͵������������ع������������ݾ�"

Pou�itie aspellu na konzole je jednoduch�. Pokia� chcete interakt�vnu 
kontrolu, pou�ite:

  aspell --lang sk -c kontrolovany.subor

Pokia� m�te v ~/.aspell.conf riadok s 'lang sk', tak nemus�te
pou��va� vo�bu '--lang sk'.

Pre neinterakt�vnu kontrolu pou�ite:
 
  aspell --lang sk -l <kontrolovany.subor >chybne.slova

Pokia� m�te z�ujem kontrolova� pravopis v html, php, sgml s�boroch 
(pr�padne aj in�ch s�boroch, ktor� 'riadiace pr�kazy' resp. 'tagy' d�vaj�
do sekvencie <>), pou�ite sgml m�d aspellu (--mode=sgml alebo -H).  Aspell
by mal tento m�d aktivova� automaticky pre s�bory s pr�ponou sgml, htm,
html a php, pr�padne si m�ete nastavi� v aspell.conf jeho aktivavanie pre
va�u ob��ben� pr�ponu pomocou pr�kazu 'add-sgml-extension'. Podobne
pre s�bory v TeXu a LaTeXu je mo�n� pou�i� tex m�d (--mode=tex alebo -t).
Podrobnej�ie inform�cie mo�no n�js� v dokument�cii programu aspell.


Chcete pom�c�?
-------------
"Slovn�k slovensk�ho jazyka obsahuje asi 120 869 slov, Pravidl� slovensk�ho
pravopisu asi 40 000 slov. Na to, aby sa �lovek dohovoril 
o najnevyhnutej��ch veciach, sta�� 500 slov. V�skumami sa zistilo, �e 
telesne pracuj�cemu �loveku sta�� na dorozumenie ove�a menej slov."

"Pas�vna slovn� z�soba �es�ro�n�ho die�a�a je 2000-3000 slov, �trn�s� 
ro�n� �iak u� pozn� 20 000 slov a 24-ro�n� �lovek a� 30 000 slov. Akt�vne 
pou��vaj� �iaci z�kladnej �koly 1 500-3 000 slov, dospel� �udia a� 10 000.
Goethe pou�il vo svojich dielach spolu asi 20 000 slov a Pu�kin 21 197 
slov."

        - Jozef Mistr�k, Sloven�ina pre ka�d�ho, 1967

Z vy��ie uveden�ch v�rokov je zrejm�, �e pre jednotliv� oblasti pou��vania
je mo�n� vytvori� "dokonal� slovn�k" resp. slovn�k, ktor� bude pokr�va� 
v�etky pou��van� slov�. Obzvlṻ sa to t�ka napr. firiem alebo �radov, kde
sa pou��va formalizovan� p�somn� styk. Preto nem�m z�ujem o prepisovanie 
PSP, alebo export datab�z slov (okrem in�ho, asi by ste sa pravdepodobne 
dostali do konfliktu so z�konom). Navy�e v�sledkom prepisovan� s� �asto 
chyby. Rad�ej preferujem pomal�, ale zato presn� a bezchybn� pr�cu.

Pomoc h�ad�m hlavne v t�chto oblastiach:
a) Pokia� n�jdete chybn� slovo (preklep, nespr�vny tvar) - ozn�mte to.
b) Potrebn� je tie� vyselektova� slov�, ktor� nie s� v Pravidl�ch 
   do zvl�tneho s�boru (ak tak� n�jdete, po�lite mi info: toto slovo pod�a
   m�a nie je v Pravidl�ch...). Nemus�te �aka�, k�m n�jdete ve�a tak�chto 
   slov. Sk�ste ich posla� tak raz za mesiac.
c) Nezn�me slov� sa ukladaj� do domovsk�ho prie�inka do s�boru
   '.aspell.sk.pws '. Sk�ste ho raz za mesiac skontrolova� pod�a 
   Pravidiel, rozde�te tieto slov� na spisovn� a nespisovn� (resp. odborn�
   - Pravidl� ve�mi m�lo toti�to popisuj� pr�ve r�zne odborn� term�ny)
   skomprimujte ich (vysk��ajte, �o v�m d� lep�� kompresn� pomer: gzip 
   alebo bzip2?). 
d) Do bud�cnosti by som chcel rozdeli� cel� slovn�k na nieko�ko �ast� pod�a
   frekvencie pou��vania - pokia� m�te pr�stup k rozsiahlej��m textom 
   v sloven�ine zistite pros�m frekvenciu slov a po�lite mi ju. Tento 
   pr�kaz by v�m pritom mohol pom�c�:
   'cat clanok_.txt | tr "A-Z.?:\!(),\"-" "a-z " | tr " " "\n" \
    | sort -f | uniq -i -c | sort -r -n > frekvencia_slov.txt'
  

Pr�kaz 'aspell --lang sk -l <kontrolovany.subor | sort -f -u >nezname.slova'
v�m skontroluje s�bor 'kontrolovany.subor' a vytvor� zoznam slov
'nezname.slova', ktor� v s�bore nepoznal. Pri takejto kontrole sa nezn�me 
slov� neukladaj� do '~/.aspell.sk.pws'!

Pokia� nem�te pr�stup k s�borom vhodn�m na kontrolovanie, sk�ste 
prekontrolova� slovensk� preklady (s�bory .po) (odpor��am str�nku 
http://slovencina.linux.sk/) alebo preklady KDE (bal�k kde-i18n-sk) a 
KOFFICE (koffice-i18n-sk) v programe kbabel (bal�k kdesdk, resp kdesdk3)
alebo gtranslator (www.gtranslator.org) a informujte autora prekladu 
(je v�dy uveden� v hlavi�ke 'po' s�boru) o preklepe. Neinformujte ho 
o nespisovn�ch slov�ch a podobne, lebo autori prekladov sa �asto musia 
uchy�ova� k r�znym slov�m. Takto pom�e aj k zlep�eniu �rovne prekladov.

Podobn�m rie�en�m je "hacknutie" prekladov nain�talovan�ch vo va�om syst�me.
Pr�klad:
  
  msgunfmt /usr/share/locale/sk/LC_MESSAGES/mc.mo >mc.sk.po

Pokia� chcete dekomprimova� d�tov� s�bory so zoznamami slov, tak to m�e
urobi� pomocou pr�kazu:

  word-list-compress decompress <sk-misc.cwl

Do verzie 0.50.3-1.1 som pridal roz�iruj�ci slovn�k sk-extend. Obsahuje
skratky, r�mske ��slice a pod. Pokia� m�te z�ujem o jeho pou�itie 
pri kontrole, tak do konfigura�n�ho s�boru (~/.aspell.conf) pridajte:

  add-extra-dicts 	sk-extend.rws

Tento roz�iruj�ci slovn�k slovn�k sl��i ako uk�ka mo�nost� programu 
Aspell. Pokia� m�te slov�, ktor� som z r�znych pr��in nezaradil 
do hlavn�ho slovn�ka, vytvorte si svoj vlastn� slovn�k pod�a tohoto
pr�kladu.

Tom� H�ger si v�imol ist� probl�my pri pou��van� "add-extra-dicts".
Tu je jeho poznatok:

Program aspell v aktu�lnej verzii neumo��uje s��asn� pr�cu so slovn�kmi 
pre r�zne jazyky, preto ak v� aspell.conf obsahuje odpor��an� riadok 
(add-extra-dicts sk-extend.rws), pokus o pou�itie inojazy�n�ho slovn�ka 
skon�� ne�spechom:

  $ aspell --lang en -l
  Unhandled Error: Expected language "sk" but got "en".
  Aborted

�iasto�n�m rie�en�m je pou�itie sk-extended.multi ako master slovn�ka
(aspell -d sk-extended <command>).  To je tie� mo�n� docieli� pridan�m
nasleduj�ceho riadku do aspell.conf-u:

  master sk-extended.multi

Pri tomto nastaven� bude automaticky pou�it� hlavn� aj roz��ren� slovn�k.
Pozor, pre pou�itie inojazy�n�ho slovn�ka je potom nutn� aspellu 
explicitne zada� in� master slovn�k, t.j. 'aspell --lang en <command>' 
pou�ije na kontrolu slovensk� slovn�k, ale 'aspell -d en <command>' 
pou�ije anglick� slovn�k.


R�zne inform�cie:
----------------
Ak� je vz�ah medzi ispell-sk, aspell-sk a myspell-sk_SK?
Ve�mi bl�zky a to hlavne v�aka tomu, �e pracujem na v�etk�ch troch. D�vod 
pre to je nasledovn�: aspell som pou��val viac ako rok, potom som 
potreboval slovensk� podporu pre OpenOffice (myspell). myspell prevzal
engine z programu pspell/aspell a z programu ispell affix kompresiu. Tak 
som sa za�al hra� s ispellom a zistil som, �e ma ist� nedostatky. Ke�e 
nikto v tom �ase (teda pokia� viem nikto okrem J�na Matisa) sa o slovensk�
podporu pre ispell nezauj�mal, za�al som robi� jeho rev�ziu. Verzia 
ispell-sk-0.1.7 bola vytvoren� hlavne pre t�ch, ktor� sa zapojili/zapoja 
do rev�zie (dos� ve�a slov bolo odstr�nen�ch, ve�a preklepov 
opraven�ch...). Z tejto verzie boli potom exportnut� niektor� (spr�vne) 
slov� pre aspell-sk. Podpora pre myspell-sk je roben� priebe�ne.
Pokia� nie�o nen�jde jeden z t�chto korek�n�ch programov, tak na 90% ich 
nen�jdu ani ostatn�.

Pod�a m�jho osobn�ho hodnotenia je kvalita vy��ie spomenut�ch 
slovn�kov/programov nasledovn�:
najlep�� je aspell-sk, potom myspell-sk_SK a posledn� je ispell-sk.

Moment�lne hlavne pracujem na ispell-sk, tak�e ten je a bude asi 
naj�astej�ie aktualizovan�. Potom nasleduje myspell-sk_SK a najmenej
aktualizovan� je aspell-sk. 

Pokia� za�lete slov� do hociktor�ho projektu, po istej dobe (ur�ite nie 
hne�) sa objavia vo v�etk�ch troch (ak by ste upravili slov� pod�a 
ispellovskej affix kompresie - u�etr�te mi kopu pr�ce a slov� sa objavia 
aj aspell-sk aj v myspell-sk_SK).

Pre v�etky projekty sme vytvorili nov� str�nky, ktor� moment�lne n�jdete 
na http://rak.isternet.sk/~zdpo


Odkazy:
-------
http://aspell.net/
ftp://ftp.gnu.org/gnu/aspell
http://savannah.gnu.org/projects/aspell/
http://sourceforge.net/projects/aspell/

aspell-sk-0.52-0, Copyright (C) 2004 Zdenko Podobn� <zdpo@mailbox.sk>