File: regex.3

package info (click to toggle)
manpages-es 1.24a-6
  • links: PTS
  • area: main
  • in suites: potato
  • size: 4,256 kB
  • ctags: 7
  • sloc: makefile: 66; sh: 62
file content (320 lines) | stat: -rw-r--r-- 8,546 bytes parent folder | download | duplicates (3)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
.\" Copyright (C), 1995, Graeme W. Wilford. (Wilf.)
.\"
.\" Permission is granted to make and distribute verbatim copies of this
.\" manual provided the copyright notice and this permission notice are
.\" preserved on all copies.
.\"
.\" Permission is granted to copy and distribute modified versions of this
.\" manual under the conditions for verbatim copying, provided that the
.\" entire resulting derived work is distributed under the terms of a
.\" permission notice identical to this one
.\" 
.\" Since the Linux kernel and libraries are constantly changing, this
.\" manual page may be incorrect or out-of-date.  The author(s) assume no
.\" responsibility for errors or omissions, or for damages resulting from
.\" the use of the information contained herein.  The author(s) may not
.\" have taken the same level of care in the production of this manual,
.\" which is licensed free of charge, as they might when working
.\" professionally.
.\" 
.\" Formatted or processed versions of this manual, if unaccompanied by
.\" the source, must acknowledge the copyright and authors of this work.
.\"
.\" Wed Jun 14 16:10:28 BST 1995 Wilf. (G.Wilford@ee.surrey.ac.uk)
.\" Tiny change in formatting - aeb, 950812
.\" Modified 8 May 1998 by Joseph S. Myers (jsm28@cam.ac.uk)
.\"
.\" Translated Thu Oct 15 1998 by Juan Piernas <piernas@ditec.um.es>
.\"
.\" show the synopsis section nicely
.de xx
.in \\n(INu+\\$1
.ti -\\$1
..
.TH REGCOMP 3 "8 Mayo 1998" GNU "Manual del Programador de Linux"
.SH NOMBRE
regcomp, regexec, regerror, regfree \- funciones para expresiones
regulares POSIX
.SH SINOPSIS
.B #include <regex.h>
.sp
.xx \w'\fBint\ regcomp(\fR'u
.BI "int\ regcomp(regex_t *" preg ", const char *" regex , 
.BI "int " cflags );
.xx \w'\fBint\ regexec(\fR'u
.BI "int\ regexec(const regex_t *" preg ", const char *" string ,
.BI "size_t " nmatch ", regmatch_t " pmatch[] , 
.BI "int " eflags );
.xx \w'\fBsize_t\ regerror(\fR'u
.BI "size_t\ regerror(int " errcode , 
.BI "const regex_t *" preg ", char *" errbuf , 
.BI "size_t " errbuf_size );
.xx \w'\fBvoid\ regfree(\fR'
.BI "void\ regfree(regex_t *" preg );
.SH "COMPILACIN DE EXPRESIONES REGULARES POSIX"
.B regcomp 
se utiliza para compilar una expresin regular en un formato apropiado para
ser usado por
.B regexec
en bsquedas posteriores.

A
.B regcomp
se le pasan como parmetros
.IR preg , 
un puntero a un rea de almacenamiento temporal de patrones,
.IR regex ,
un puntero a una cadena terminada en un carcter nulo y
.IR cflags ,
banderas utilizadas para determinar el tipo de compilacin.

Toda bsqueda con expresiones regulares se debe realizar mediante un buffer
de patrones compilados, por tanto, a
.B regexec
siempre se le debe proporcionar la direccin de un buffer de patrones
inicializado mediante
.BR regcomp .

.I cflags 
debe ser un
.BR O -lgico
a nivel de bits de una o ms de las siguientes opciones:
.TP 
.B REG_EXTENDED
Utilizar el tipo de sintaxis 'Expresin Regular Extendida 
.BR POSIX '
cuando se interprete
.IR regex .
Si no se activa esta opcin, se utiliza el tipo de sintaxis 'Expresin Regular
Bsica
.BR POSIX '.
.TP 
.B REG_ICASE
No distinguir entre maysculas y minsculas. Las siguientes bsquedas
.B regexec
que usen este buffer de patrones no distinguirn entre maysculas y
minsculas.
.TP 
.B REG_NOSUB
No se necesita soporte para obtener las posiciones de subcadenas
coincidentes. Los parmetros
.I nmatch
y
.I pmatch
de
.B regexec
se ignoran si el buffer de patrones proporcionado se compil con esta
opcin.
.TP 
.B REG_NEWLINE
Los operadores "coincidir con cualquier carcter" no coinciden con un
carcter "nueva lnea".

Una lista de no-coincidencia
.RB ( [^...] )
que no contenga un carcter "nueva lnea" no coincidir con una "nueva
lnea".

Un operador "coincidir al principio de lnea"    
.RB ( ^ )
coincide con la cadena vaca inmediatamente posterior a un carcter "nueva
lnea", sin tener en cuenta si
.IR eflags ,
la bandera de ejecucin de
.BR regexec ,
contiene 
.B REG_NOTBOL
o no.

Un operador "coincidir al final de lnea"
.RB ( $ )
coincide con la cadena vaca inmediatamente anterior a un carcter "nueva
lnea", sin tener en cuenta si
.IR eflags 
contiene
.B REG_NOTEOL
o no.
.SH "COINCIDENCIAS EN LAS EXPRESIONES REGULARES POSIX"
.B regexec
se utiliza para comprobar si una cadena
.IR string ,
terminada en un carcter nulo,
coincide con alguno de los patrones precompilados del buffer
.IR preg .
.I nmatch
y
.I pmatch
se utilizan para informar respecto a la localizacin de cualquier
coincidencia.
.I eflags
puede ser
.B REG_NOTBOL
o
.B REG_NOTEOL 
o un
.BR O -lgico
de ambos valores, lo que cambia el comportamiento en las coincidencias tal
como se describe a continuacin.
.TP
.B REG_NOTBOL
El operador "coincidir al principio de lnea" siempre falla en las
coincidencias (pero vea la opcin de compilacin
.B REG_NEWLINE 
ms arriba).
Esta bandera se puede utilizar cuando se pasan diferentes porciones de una
cadena a
.B regexec
y el comienzo de la cadena no se debe interpretar como el principio de una
lnea.
.TP
.B REG_NOTEOL
El operador "coincidir al final de lnea" siempre falla en la coincidencias
(pero vea la opcin de compilacin
.B REG_NEWLINE
ms arriba).
.SS "DESPLAZAMIENTOS DE BYTES"
A menos que se especificara
.B REG_NOSUB
en la compilacin del buffer de patrones, es posible obtener informacin
sobre la posicin de subcadenas coincidentes.
.I pmatch
debe tener un tamao de al menos
.I nmatch
elementos.
Estos se rellenan al ejecutar
.BR regexec 
con las posiciones de cadenas coincidentes. Cualquier elemento de la
estructura no utilizado contendr el valor -1.

La estructura 
.BR regmatch_t , 
que es el tipo de
.IR pmatch ,
se define en
.IR regex.h .

.RS
.B typedef struct
.br
.B {
.br
.BI "  regoff_t " rm_so ;
.br
.BI "  regoff_t " rm_eo ;
.br
.B }
.B regmatch_t;
.RE

Cada elemento 
.I rm_so
que no es -1 indica el principio de la siguiente mayor
subcadena coincidente dentro de la cadena. El elemento
relativo
.I rm_eo 
indica el final de la coincidencia.
.SH "INFORMES DE ERROR POSIX"
.B regerror
se utiliza para convertir los cdigos de error que pueden devolver tanto
.B regcomp
como
.B regexec
en cadenas de mensaje de error.

A
.B regerror
se le pasa el cdigo de error,
.IR errcode ,
el buffer de patrones
.IR preg ,
un puntero al buffer de una cadena de caracteres, 
.IR errbuf ,
y el tamao del buffer de la cadena, 
.IR errbuf_size .
Devuelve el tamao de
.I errbuf
necesario para contener la cadena con el mensaje de error terminada en un
carcter nulo. Si tanto
.I errbuf
como
.I errbuf_size
no son cero,
.I errbuf
se rellena con los primeros
.I "errbuf_size - 1"
caracteres del mensaje de error y un carcter nulo terminador.
.SH "LIBERACIN DE BUFFERS DE PATRONES POSIX"
Si a 
.B regfree
se le pasa un buffer de patrones precompilados,
.IR preg ,
liberar la memoria  del buffer de patrones reservada por el proceso de
compilacin,
.BR regcomp .
.SH "VALOR DEVUELTO"
.B regcomp
devuelve cero si la compilacin tiene xito y un cdigo de error si falla.

.B regexec
devuelve cero si hay coincidencia y
.B REG_NOMATCH
en caso de fallo.
.SH ERRORES
.B regcomp
puede devolver los siguientes errores:
.TP
.B REG_BADRPT
Uso incorrecto de operadores de repeticin, como el uso de
.RB ` * '
como primer carcter.
.TP
.B REG_BADBR
Uso incorrecto del operador de referencia inversa.
.TP
.B REG_EBRACE
Existe una llave de un operador de intervalo no emparejada.
.TP
.B REG_EBRACK
Existe un corchete de un operador de lista no emparejado.
.TP
.B REG_ERANGE
Uso incorrecto de un operador de rango; por ejemplo, el lmite superior del
rango ocurre antes que el lmite inferior.
.TP
.B REG_ECTYPE
Nombre de clase de caracteres desconocido.
.TP
.B REG_ECOLLATE
Elemento de comparacin invlido.
.TP
.B REG_EPAREN
Existe un parntesis de un operador de grupo no emparejado.
.TP
.B REG_ESUBREG
Referencia inversa incorrecta a una subexpresin.
.TP
.B REG_EEND
Error indefinido. No definido por POSIX.2.
.TP
.B REG_EESCAPE
Barra invertida (\\) al final.
.TP
.B REG_BADPAT
Uso incorrecto de operadores de patrn tales como grupo o lista.
.TP
.B REG_ESIZE
La expresin regular compilada necesita un buffer de patrones mayor que
64Kb. No definido por POSIX.2.
.TP
.B REG_ESPACE
Las rutinas de expresiones regulares se ejecutaron fuera de sus lmites de
memoria.
.SH "CONFORME A"
POSIX.2
.SH FALLOS
Actualmente (GNU libc al da 980503), GNU libc no soporta elementos de
comparacin en las expresiones regulares.
.SH "VASE TAMBIN"
.BR regex (7),
.B "El manual de expresiones regulares de GNU"