File: segmentation.html

package info (click to toggle)
omegat 3.6.0.10%2Bdfsg-3
  • links: PTS, VCS
  • area: main
  • in suites: bookworm, bullseye, sid, trixie
  • size: 63,728 kB
  • sloc: xml: 114,044; java: 74,758; sh: 174; javascript: 108; makefile: 22
file content (228 lines) | stat: -rw-r--r-- 10,546 bytes parent folder | download | duplicates (2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
<html>
<head>
  <link rel="stylesheet" href="./OmegaT.css" type="text/css">
  <meta http-equiv="content-type" content="text/html; charset=UTF-8">

  <title>Sorburuaren segmentazioa - OmegaT 2.2 erabiltzailearen eskuliburua</title>
</head>

<body>
  <h2>Sorburuaren segmentazioa</h2>

  <ul>
    <li>
      <p><a href="#structure">Egitura mailako segmentazioa</a></p>
    </li>

    <li>
      <p><a href="#sentence">Esaldi mailako segmentazioa</a></p>

      <ul>
        <li>
          <p><a href="#about">Segmentazio-arauak</a></p>
        </li>

        <li>
          <p><a href="#setup">Arauen konfigurazioa</a></p>

          <ul>
            <li>
              <p><a href="#priority">Lehentasuna</a></p>
            </li>

            <li>
              <p><a href="#creation">Arauen sorrera</a></p>
            </li>

            <li>
              <p><a href="#break">Etena/Salbuespena</a></p>
            </li>

            <li>
              <p><a href="#examples">Adibide sinple batzuk</a></p>
            </li>
          </ul>
        </li>
      </ul>
    </li>

    <li>
      <p><a href="regexp.html">Adierazpen erregularrak</a></p>
    </li>
  </ul>

  <p>Itzulpen-memoriak kudeatzeko tresnek segmentu deritzen testu-unitateekin egiten dute lan. OmegaT-k testu bat segmentatzeko bi modu dauzka: paragrafo mailako segmentazioa eta esaldi mailako segmentazioa. Segmentazio-mota ezartzeko, hautatu <strong>Proiektua → Propietateak</strong> menu nagusian eta erabili bertan dagoen kontrol-laukia. Kontuan izan paragrafo mailako segmentazioa zaharkitua dagoela eta proiekturik gehienetan esaldi mailako segmentazioa erabiltzea komeni dela. Esaldi mailako segmentazioa hautatu bada, joan menu nagusiko <strong>Aukerak → Segmentazioa...</strong> atalera arauak ezartzeko.</p>

  <p>Kontuan izan garapenaren zati handi bat segmentazio-arau fidagarriak garatzen eman dela; beraz, kasurik gehienetan ez da beharrezkoa izango segmentazio-arau propioak idaztea. Bestalde, funtzionaltasun hau oso erabilgarria da kasu berezietan, batez ere benetan itzuli nahi dena itzultzeko aldaketarik gabe geratu behar duena aldatzeko arriskutik salbu utziz.</p>

  <p><strong>Oharra!</strong> Proiektua irekita dagoen bitartean iragazkien aukerak aldatzeak datu-galerak eragin ditzake. Segmentazio-ezarpenak proiektua hasi ondoren aldatzen badituzu, proiektua birkargatu egin beharko duzu aldaketak indarrean sartzeko.</p>
  <hr>

  <h2><a name="structure" id="structure"></a>Egitura mailako segmentazioa</h2>

  <p>OmegaT-k, hasteko, testua egitura-mailan segmentatzen du. Prozesu honetan zehar, sorburu-fitxategiaren egitura erabiltzen da soilik segmentuak sortzeko.</p>

  <p>Esaterako, <a href="fileFilters.html#filter_options">testu-fitxategiak</a> segmentatzeko lerro-jauziak, lerro hutsak eta antzekoak erabiltzen dira. Gertatu daiteke egitura-mailako segmentaziorik ez sortzea. Formatua daukaten fitxategiak (OpenOffice.org-eko dokumentuak, HTML dokumentuak, etab.) bloke (paragrafo) mailako etiketak erabiliz segmentatzen dira. XHTML edo HTML fitxategietan itzulgai diren objektuen <a href=
  "fileFilters.html#filter_options">atributuak</a> ere segmentuak banatzeko erauzi daitezke.</p>
  <hr>

  <h2><a name="sentence" id="sentence"></a>Esaldi mailako segmentazioa</h2>

  <p>Sorburu-fitxategia unitate logikoetan segmentatu ondoren, OmegaT-k bloke hauek esaldietan segmentatuko ditu.</p>

  <h3><a name="about" id="about"></a>Segmentazio-arauak</h3>

  <p>Segmentazio-prozesu honelakoa da: irudikatu kurtsorea testuan zehar mugitzen ari dela, bakoitzean karaktere bat igaroz. Kurtsorearen posizio bakoitzerako arau bakoitza aplikatzen da, taulan adierazitako ordenan, eta <strong>Aurretik</strong> eredua aplikatzen zaio kurtsorearen ezkerraldean dagoen testuari eta <strong>Ondoren</strong> eredua kurtsoaren eskuinaldean dagoenari. Araua testuarekin bat badator, aplikazioak gelditu egiten du arauen azterketa (salbuespen-arauaren kasuan) edo segmentu berri bat sortzen du (eten-arauaren kasuan).</p>

  <p>Esaldien segmentazioa garatzeko <a href="http://www.lisa.org/standards/srx/">Segmentation Rules eXchange (SRX)</a> estandarra jarraitu da - hala ere, OmegaT-k ez ditu SRX formatuaren ezaugarri guztiak onartzen. Eta ezin dira SRX formatuan definitutatko arauak inportatu/esportatu. Hala ere, SRX-a ezagutzen baduzu, orduan badakizu OmegaT-k nola egiten duen segmentazioa.</p>

  <p>Bi arau-mota daude.</p>

  <ul>
    <li>
      <p><strong>Eten-arauek</strong> testua segmentuetan banatzen dute. Adibiez, <i>"Ba al zuen zentzurik? Ez nago ziur."</i> bi segmentutan banatu beharko litzateke, eten-araua egon beharko litzateke "<code>?</code>" ikurrerako.</p>
    </li>

    <li>
      <p><strong>Salbuespen-arauek</strong> banatu behar EZ diren testu-zatiak zehazten dituzte. Puntua duen arren, <i>"XX. mendea"</i> ez litzateke banatu behar; beraz, salbuespen-arau bat finkatu beharko litzateke XX hitzerako (eta XIX, XVIII, etab-etarako), puntu bat badaukate ondoren.</p>
    </li>
  </ul>

  <p>Aurredefinitutako eten-arauek aski izan beharko lukete Europako hizkuntza gehienetan eta japonieran. Zure hizkuntzetarako salbuespen-arau gehiago definitu zenitzake,segmentu esanguratsu eta koherenteagoak sortzeko.</p>

  <h3><a name="setup" id="setup"></a>Arauen konfigurazioa</h3>

  <h3><a name="priority" id="priority"></a>Lehentasuna</h3>

  <p>Hizkuntza-eredu bati dagozkion segmentazio-arauen multzoak hizkuntzaren lehentasun ordenan aplikatzen dira, alegia, hizkuntza espezifikoetarako arauak lehenetsitako hizkuntzetarako arauen gainetik egongo dira. Esaterako, Kanadako frantsesaren (FR-CA) arauek lehentasuna izango dute frantsesaren (FR.*) arauen gainetik, eta azken hau, lehenetsitakoen (.*) gainetik egongo da. Beraz, Kanadako frantsesetik itzultzen bada, proiektuak hizkuntza horretarako definitutako arauak, frantseserako definitutakoak eta lehenetsitakoak erabiliko ditu, ordena horretan.</p>

  <h3><a name="creation" id="creation"></a>Arauen sorrera</h3>

  <p>Arauen multzo hutsa editatu edo hedatzeko, sakatu bere izenean koadroan. Hautatutako multzoaren arauak koadroaren azpiko leihoan agertuko dira.</p>

  <p>Hizkuntza berri baterako arau-multzo hutsa sortzeko, sakatu koadroaren goiko aldean ageri den <strong>Gehitu...</strong> botoia. Lerro hutsa ageriko da taularen behealdean <font color="black" face=
  "Times New Roman" size="3"><span style="font-size: 12pt; color: black;" lang=
  "EN-US">(agian beherantz mugitu beharko duzu korritze-barra hura ikusteko)</span></font>. Aldatu arauen multzoaren izena eta hizkuntza-eredua. Hizkuntza-ereduaren sintaxia <a href="regexp.html">adierazpen erregularren</a> sintaxiaren moldekoa da. Zure arauen multzoa hizkuntza-herrialdea bikote bati badagokio, <strong>Mugitu gora</strong> botoia erabiliz taularen goialdera eraman dezazun gomendatzen dizugu.&nbsp;</p>

  <h3><a name="break" id="break"></a>Etena/Salbuespena</h3>

  <p>Etena/Salbuespena zutabeko kontrol-laukiak arauaren izaera ezartzen du: kontrol-laukia markatuta badago, arauak etenak sortuko ditu, eta markatu gabe badago, salbuespenak sortuko ditu. Bi adierazpen erregularrek, Aurretik eta Ondoren zutabeetan adierazten direnek, kokapen baten aurretik eta ondoren zerk egon behar duen zehazten dute, eten- edo salbuespen-araua eratuz.</p>

  <h3><a name="examples" id="examples"></a>Adibide sinple batzuk</h3>

  <table summary="just formatting" border="0" cellpadding="4" cellspacing="0">
    <tbody>
      <tr bgcolor="#DDDDDD">
        <td width="26%">
          <p><strong>Asmoa</strong></p>
        </td>

        <td>
          <p><strong>Aurretik</strong></p>
        </td>

        <td>
          <p><strong>Ondoren</strong></p>
        </td>

        <td width="52%">
          <p><strong>Oharra</strong></p>
        </td>
      </tr>

      <tr>
        <td width="26%">
          <p>sortu segmentu bat puntu baten ('<code>.</code>') eta zuriune baten artean</p>
        </td>

        <td>
          <p><code>\.</code></p>
        </td>

        <td>
          <p><code>\s</code></p>
        </td>

        <td width="52%">
          <p>"<code>\.</code>" zeinuak  "<code>.</code>" karakterea ordezkatzen du. "<code>\s</code>" zeinuak edozein espazio zuri ordezkatzen du</p>
        </td>
      </tr>

      <tr bgcolor="#DDDDDD">
        <td width="26%">
          <p>ez sortu segmentua Mr. ondoren</p>
        </td>

        <td>
          <p><code>Mr\.</code></p>
        </td>

        <td>
          <p><code>\s</code></p>
        </td>

        <td width="52%">
          <p>Salbuespen-araua da, beraz arauaren kontrol-laukiak markatu gabe egon behar du</p>
        </td>
      </tr>

      <tr>
        <td width="26%">
          <p>sortu segmentu bat "。" ondoren (japonierako puntua)</p>
        </td>

        <td>
          <p><span lang="zxx"><code>。</code></span></p>
        </td>

        <td></td>

        <td width="52%">
          <p>Begiratu nola <i>ondoren</i> hutsik dagoen</p>
        </td>
      </tr>

      <tr bgcolor="#DDDDDD">
        <td width="26%">
          <p>ez sortu segmentua M., Mr., Mrs. eta Ms. ondoren</p>
        </td>

        <td>
          <p><code>Mr??s??\.</code></p>
        </td>

        <td>
          <p><code>\s</code></p>
        </td>

        <td width="52%">
          <p>salbuespen-araua - ikusi ?-ren erabilera Adierazpen erregularretan (identifikatzaile asea)</p>
        </td>
      </tr>
    </tbody>
  </table>
  <hr>

  <h2><a name="regex" id="regex"></a>Adierazpen erregularrak</h2>

  <p>Segmentazio-arauetan erabiltzen diren adierazpen erregularrak Javak onartzen dituenak dira. <a href="regexp.html">Adierazpen erregularren formak</a> eranskinean laburpen bat dago. Informazio zehatzagoa behar baduzu, kontsultatu <a href=
  "http://java.sun.com/j2se/1.5/docs/api/java/util/regex/Pattern.html"> http://java.sun.com/j2se/1.5/docs/api/java/util/regex/Pattern.html</a>.</p>

  <p>Sarean gai honi buruzko tutorial errazak aurki ditzakezu (esaterako, <a href=
  "http://www.regular-expressions.info/quickstart.html">http://www.regular-expressions.info/quickstart.html</a>.)</p>
  <hr>

  <table summary="just formatting" style="width: 100%;" border="0" cellpadding=
  "2" cellspacing="2">
    <tbody>
      <tr>
        <td style="text-align: left;"><a href="legalNotices.html">Legezko oharrak</a></td>

        <td style="text-align: center;"><a href="index.html">Orri nagusia</a></td>

        <td style="text-align: right;"><a href="xindex.html">Aurkibidea</a></td>
      </tr>
    </tbody>
  </table>
</body>
</html>