File: README

package info (click to toggle)
ispell-czech 20040229-5.2
 • links: PTS
 • area: main
 • in suites: bullseye, buster, sid, stretch
 • size: 3,588 kB
 • ctags: 5
 • sloc: perl: 703; makefile: 76; sh: 43
file content (92 lines) | stat: -rw-r--r-- 3,722 bytes parent folder | download | duplicates (9)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
             Czech data for ispell

The dictionary is rapidly evolving - see ftp://ftp.vslib.cz/pub/unix/ispell/
for actual version!

             �esk� data pro ispell

V�echny tyto soubory jsou ve st�diu pom�rn� rychl�ch zm�n. Sledujte
ftp://ftp.vslib.cz/pub/unix/ispell/, kde jsou zve�ej�ov�ny nejnov�j�� verze.

Slovn�k je rozd�len na n�sleduj�c� ��sti:

hlavni.cat	Pravideln� sklo�ovan� podstatn� jm�na a p��davn� jm�na,
		(v�etn� t�ch, kter� maj� krom� pravideln�ch tvar� jeden
		nebo v�ce tvar� nepravideln�ch), v�echna slovesa, a
		p��slovce odvozen� od p��davn�ch jmen flagem R
nepravid.cat	Nepravideln� podstatn� jm�na a p��davn� jm�na (jsou
		uvedeny v�echny tvary bez flag�)
nesklon.cat	Nesklonn� podstatn� a p��davn� jm�na (maj� jedin� tvar)
zajmena.cat	Z�jmena
cislovk.cat	��slovky
prislovc.cat	P��slovce (krom� p��slovc� odvozen�ch z p��davn�ch jmen
		flagem R)
predlozk.cat	P�edlo�ky (v�etn� v�ceslovn�ch)
spojky.cat	Spojky (v�etn� v�ceslovn�ch)
citoslov.cat	Citoslovce
castice.cat	��stice
zkratky.cat	Inici�lov� zkratky a zkratky typu nap�., apod.
nezaraz.cat	Dosud neza�azen� slova
krestni.cat   K�estn� jm�na
prijmeni.cat  �esk� p��jmen�
narstjaz.cat  Jm�na n�rod�, st�t� a jazyk�
obce.cat    Jm�na obc� v �R
geogr.cat    Zem�pisn� jm�na v �R i ve sv�t�, jm�na m�st mimo �R
cizi.cat    Ciz� jm�na
nazvy.cat    Ostatn� n�zvy

Zdrojov� soubor czech.a-z pro vytvo�en� slovn�ku pro ispell se z�sk� takto:

  perl -pe 'print "echo "' *.cat | sh - | \
   perl -pe 's/ +/\n/g; s/[{}\.]//g; s/-/\n/g' > czech.a-z

Slou�en� soubor se zpracuje p��kazem buildhash:

  buildhash czech.a-z czech.aff czech.hash

kter� vytvo�� slovn�k pro ispell. Po zkop�rov�n� souboru czech.aff a
czech.hash do adres��e, ve kter�m ispell o�ek�v� slovn�ky, lze ispell
pou��vat p��kazem

  ispell -d czech kontrolovan�_soubor

Pokud p�i nalezen� nezn�m�ho slova p�i kontrole textu zvol�te mo�nost
I)nsert, p�id� se slovo do souboru $HOME/.ispell_czech. Chcete-li pomoci
s vytv��en�m slovn�ku, za�lete tento soubor (pokud mo�no vy�i�t�n� od
nespisovn�ch a ciz�ch slov a p��padn�ch HTML zna�ek nebo p��kaz� pro
TeX) na adresu Petr.Kolar@vslib.cz.

Pokud chcete pouze p�isp�t k roz���en� slovn�ku a nechcete text zdlouhav�
interaktivn� kontrolovat, m��ete pou��t p��kaz

  ispell -d czech -l < kontrolovan�_soubor > v�stup

kter� pracuje neinteraktivn� a ulo�� do souboru v�stup v�echna slova
ze vstupn�ho souboru, kter� nejsou obsa�ena ve slovn�ku spell checkeru.
Tento v�stupn� soubor za�lete pro ��ely roz�i�ov�n� slovn�ku. Zas�lejte
pouze slovn�ky vznikl� kontrolou sou�asn�ch p�ev�n� spisovn�ch text�
(M�cha nebo Neruda pravd�podobn� nen� na z�vadu, ale t�eba Bible Kralick�
u� vhodn� nen�).

Rozd�len� zdrojov�ho slovn�ku na ��sti je provedeno z toho d�vodu, aby
bylo mo�n� slovn�k snadno dopl�ovat (zat�m ov�em pom��e v�ce, kdy� po�lete
syrov� seznam nezn�m�ch slov):

Soubor v�stup se slou�� se souborem hlavni.cat, retrogr�dn� set��d�
(slova se set��d� jako by byla napsan� pozp�tku, aby se snadno dopl�ovaly
flagy):

  perl retro.p hlavni.cat v�stup | perl sort.p | perl retro.p > hlavni1.cat

V souboru hlavni1.cat je pak t�eba (na ��dc�ch, kter� neobsahuj� ��dn�
lom�tko) doplnit flagy. Slova, kter� do souboru nepat�� (p��slovce apod.),
se potom p�em�st� do jin�ch soubor�. Na z�v�r se p�ipoj� dosud neza�azen�
slova do nezaraz.cat a v�sledkem je nov� verze souboru hlavni.cat:

  grep -v / hlavni1.cat >> nezaraz.cat
  grep / hlavni1.cat > hlavni.cat

Pro dopl�ov�n� flag� lze pou��t i skript blemma - viz soubor ceskeaff.txt.
Jeho ��innost je v�ak pom�rn� n�zk� a chybovost pom�rn� velk�.

                         Petr.Kolar@vslib.cz