File: READMEde.txt

package info (click to toggle)
gocr 0.52-3
  • links: PTS
  • area: main
  • in suites: bullseye
  • size: 1,824 kB
  • sloc: ansic: 18,197; sh: 545; makefile: 334; xml: 20
file content (78 lines) | stat: -rw-r--r-- 3,093 bytes parent folder | download | duplicates (4)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78

This is the short german version for README.
Dies ist die deutsche Kurzinformation fuer README.

                      --- GOCR v0.38 ---

Worum gehts?
- OCR = optical character recognition = Schrifterkennung
- liest pnm, pbm, pgm, ppm, einige pcx und tga Bilddateien
   (auf un*x-systemen mit libpnm fast alle Formate)
- gibt text aus
- Dieses Programm ist herausgegeben unter GPL (General Public License).
   Das bedeutet unter anderem:  FREI FUER ALLE BENUTZER.

Wie kompilieren?
  
  gzip -cd gocr-0.38.tgz | tar xfv -   # auspacken
  cd gocr-0.38	  # Ordner wechseln
  ./configure     # Makefile anpassen
  make  	  # gcc/g++ sollte installiert sein


Wie starten?
  gocr -h       	# Kurz(!)-Hilfe
  gocr file.pbm		# minimale Argumente 
  gocr -v 1 -v 32 -m 4 file.pbm # zusaetzlich debug-Modus und Layout-Analyse
 Optionen (bitte auch das aktuelle Manual zu gocr (man gocr) ansehen!):
  [-i] name - Bilddatei (pnm,pgm,pbm,ppm,pcx), - fuer stdin
  -o name   - Ausgabefile (Umlenkung der Standardausgabe)
  -e name   - Ausgabefile (Umlenkung der Fehlerausgabe)
  -x name   - Fortschrittsanzeige (file, fifo oder fd=1..255)
  -p name   - Verzeichnis der optionalen Datenbasis (z.B.: ./db/)
  -l num    - Schwellenwert 0<160<=255
  -d num    - Schmutzgroesse (Entfernen von Schmutz, -1=autodetect)
  -s num    - Wortabstand in Punkten (0 = autodetect)
  -v num    - Mehr Infos  [summiert]
      1      mehr Informationen
      2      Groesse der Boxen anzeigen (siehe -c)
      4      Boxen anzeigen (siehe -c)
      8      Ausgabe der Muster nach Erkennung
     16      Zeilenerkennung ausgeben
     32      debug-Ausgaben outXX.pgm
  -c string - Liste der auszugebenen Zeichen (_ = nicht erkanntes Zeichen)
  -C string - Zeichenfilter (z.B.: hexdigits: 0-9A-Fx, nur ASCII)
  -m num    - Arbeitsarten, ~ = abschalten
      2      Datenbank nutzen (in Entwicklung)
      4      Layout-Analyse (zum Testen)
      8      ~ vergleiche nichterkannte Zeichen
     16      ~ Teile verklebte Zeichen
     32      ~ Kontextkorrektur
     64      Zeichen komprimieren
    130      Datenbank erweitern (unbekannte Zeichen, Interaktiv)
    256      OCR Engine abschalten, macht nur Sinn mit -m 2
 Beispiel: gocr -v 6 -v 32 -c _YV text1.pbm
 - Programm ist noch sehr langsam, bitte Geduld!
  
Was geht nicht?
- vieles ... siehe README

Wie koennen Sie helfen?
- Schicken Sie Bemerkungen und KLEINE Beispieldaten als .pbm.gz, png oder
  jpeg. Bitte den fehlerhaft erkannten Bereich mit Bildbearbeitung 
  vorher auf ca. 3 Textzeilen reduzieren, das erleichtert das Debuggen.  
- Geld oder einen neuen Notebook koennte ich auch brauchen (paypal).
  Ok, paypal ist nicht mehr was es mal war, also vergesst es und mangelnde
  Zeit zum programmieren ist jetzt das groessere Problem.
- Gute Ideen nehme ich gern entgegen
  (d.h. kleine Aenderungen mit grosser Wirkung).
- Lob und Tadel nehm ich ebenfalls gerne entgegen.

Bugs:
- Das Programm hat sicher viele Fehler, nur welche? (siehe README)

Letzte Neuerungen: (siehe README)

Authoren: (siehe README und AUTHORS)

                      --- HAVE FUN ---