File: ocrconfiguration.page

package info (click to toggle)
ocrfeeder 0.7.11-6
  • links: PTS, VCS
  • area: main
  • in suites: jessie, jessie-kfreebsd
  • size: 4,444 kB
  • ctags: 1,947
  • sloc: python: 18,713; sh: 809; makefile: 139; xml: 38
file content (52 lines) | stat: -rw-r--r-- 4,342 bytes parent folder | download | duplicates (2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
<?xml version="1.0" encoding="utf-8"?>
<page xmlns="http://projectmallard.org/1.0/" type="topic" id="ocrconfigutation" xml:lang="cs">

<info>
    <link type="guide" xref="index#configuration"/>
    <link type="seealso" xref="automaticrecognition"/>
    <link type="seealso" xref="manualeditionandcorrection"/>
    <desc>Nastavení výkonných programů OCR, které provádí rozpoznání textu</desc>
</info>

<title>Nastavení výkonných programů OCR</title>

<p>Aplikace <app>OCRFeeder</app> používá k získání textu z obrázků výkonné programy OCR nainstalované v systému. To znamená, že jakýkoliv program OCR, který lze použít z příkazové řádky, je možné použít i v aplikaci <app>OCRFeeder</app>.</p>

<section>

<title>Automatické nalezení výkonných programů OCR</title>

<p>Výkonné programy OCR (<em>Tesseract</em>, <em>GOCR</em>, <em>Ocrad</em> a <em>Cuneiform</em>), které jsou již nainstalovány, jsou ve většině systému zjištěny a nastaveny automaticky při prvním spuštění aplikace <app>OCRFeeder</app>.</p>

<p>Pokud je výkonný program OCR nainstalován až po té, co již byla aplikace <app>OCRFeeder</app> nastavena, nebude nastaven automaticky, ale podle typu výkonného programu, může uživatel jít do dialogového okna <gui>Výkonné programy OCR</gui> a zvolit s jej v seznamu po zmáčknutí tlačítka <gui>Vyhledat</gui>.</p>

<note style="tip"><p>Již nastavené výkonné programy OCR mohou být nalezeny znovu a je na uživateli, aby je odškrtl, pokud se nemají znovu přidat.</p></note>

</section>

<section>

<title>Ruční nastavení</title>

<p>Aktuálně nastavené výkonné programy OCR jsou zobrazeny v dialogovém okně <gui>Výkonné programy OCR</gui>, které můžete otevřít z <guiseq><gui>Nástroje</gui><gui>Výkonné programy OCR</gui></guiseq>.</p>

<p>Po straně nastavených výkonných programů OCR v dialogovém okně <gui>Výkonné programy OCR</gui> jsou tlačítka, která umožňují přidat, upravit nebo smazat některý z aktuálních a vyhledat výkonné programy nainstalované v systému.</p>

<p>Když přidáváte nebo upravujete výkonný program OCR (zmáčknutím tlačítka <gui>Přidat</gui> či <gui>Upravit</gui>), zobrazí se dialogové okno s následujícími poli:</p>

<list>
    <item><p><gui>Název</gui>: Název výkonného programu. Tento název bude používán v uživatelském rozhraní, kde je potřeba se na výkonný program odkázat;</p></item>
    <item><p><gui>Formát obrazu</gui>: Formát obrazu, se kterým výkonný program pracuje (například <em>TIF</em> v případě programu <em>Tesseract</em>);</p></item>
    <item><p><gui>Řetězec při selhání</gui>: Některé výkonné programy nahrazují nerozpoznané znaky jiným, předdefinovaným znakem (například <em>_</em> v případě programu <em>GOCR</em>);</p></item>
    <item><p><gui>Cesta k výkonnému programu</gui>: Cesta v systému ke spustitelnému souboru výkonného programu (například <em>/usr/bin/tesseract</em>);</p></item>
    <item><p><gui>Argumenty výkonného programu</gui>: Argumenty, které předávají obraz do výkonného programu a provedou výpis rozpoznaného textu na standardní výstup. Aplikace <app>OCRFeeder</app> spustí výkonný program s těmito argumenty stejně, jako by to bylo na příkazovém řádku a rozpoznaný text se očekává na standardním výstupu. Některé výkonné programy to tak již dělají, jako třeba <em>Ocrad</em> a <em>GOCR</em>, jiné jako <em>Tesseract</em>, zapisují text do souboru.</p>
    <p>Protože cesta ke čtenému obrázku je potřeba vždy, je pro tento účel poskytován speciální argument <em>$IMAGE</em> a při spuštění výkonného programu je nahrazen cestou k obrázku. Pro případy, kdy je zapotřebí název souboru, jak bylo uvedeno dříve, je poskytován speciální argument <em>$FILE</em>, který bude nahrazen názvem dočasného souboru.</p>
    <p>Takže v případě programu <em>Tesseract</em> (který zapisuje rozpoznaný text do souboru), by argumenty byly <em>$IMAGE $FILE; cat $FILE.txt; rm $FILE</em>.</p></item>

</list>

<note style="advanced"><p>Nastavení výkonných programů je uchováváno v jejich vlastním souboru XML v domovské složce uživatele pod <em>.ocrfeeder/engines/</em>.</p></note>

</section>

</page>