File: regex.3

package info (click to toggle)
manpages-es 1.55-9
  • links: PTS
  • area: main
  • in suites: squeeze
  • size: 7,468 kB
  • ctags: 6
  • sloc: sh: 1,629; makefile: 64
file content (319 lines) | stat: -rw-r--r-- 8,535 bytes parent folder | download | duplicates (4)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
.\" Copyright (C), 1995, Graeme W. Wilford. (Wilf.)
.\"
.\" Permission is granted to make and distribute verbatim copies of this
.\" manual provided the copyright notice and this permission notice are
.\" preserved on all copies.
.\"
.\" Permission is granted to copy and distribute modified versions of this
.\" manual under the conditions for verbatim copying, provided that the
.\" entire resulting derived work is distributed under the terms of a
.\" permission notice identical to this one
.\" 
.\" Since the Linux kernel and libraries are constantly changing, this
.\" manual page may be incorrect or out-of-date.  The author(s) assume no
.\" responsibility for errors or omissions, or for damages resulting from
.\" the use of the information contained herein.  The author(s) may not
.\" have taken the same level of care in the production of this manual,
.\" which is licensed free of charge, as they might when working
.\" professionally.
.\" 
.\" Formatted or processed versions of this manual, if unaccompanied by
.\" the source, must acknowledge the copyright and authors of this work.
.\"
.\" Wed Jun 14 16:10:28 BST 1995 Wilf. (G.Wilford@ee.surrey.ac.uk)
.\" Tiny change in formatting - aeb, 950812
.\" Modified 8 May 1998 by Joseph S. Myers (jsm28@cam.ac.uk)
.\"
.\" Translated Thu Oct 15 1998 by Juan Piernas <piernas@ditec.um.es>
.\"
.\" show the synopsis section nicely
.de xx
.in \\n(INu+\\$1
.ti -\\$1
..
.TH REGCOMP 3 "8 Mayo 1998" GNU "Manual del Programador de Linux"
.SH NOMBRE
regcomp, regexec, regerror, regfree \- funciones para expresiones
regulares POSIX
.SH SINOPSIS
.B #include <sys/types.h>
.br
.B #include <regex.h>
.sp
.xx \w'\fBint\ regcomp(\fR'u
.BI "int\ regcomp(regex_t *" preg ", const char *" regex , 
.BI "int " cflags );
.xx \w'\fBint\ regexec(\fR'u
.BI "int\ regexec(const regex_t *" preg ", const char *" string ,
.BI "size_t " nmatch ", regmatch_t " pmatch[] , 
.BI "int " eflags );
.xx \w'\fBsize_t\ regerror(\fR'u
.BI "size_t\ regerror(int " errcode , 
.BI "const regex_t *" preg ", char *" errbuf , 
.BI "size_t " errbuf_size );
.xx \w'\fBvoid\ regfree(\fR'
.BI "void\ regfree(regex_t *" preg );
.SH "COMPILACIÓN DE EXPRESIONES REGULARES POSIX"
.B regcomp 
se utiliza para compilar una expresión regular en un formato apropiado para
ser usado por
.B regexec
en búsquedas posteriores.

A
.B regcomp
se le pasan como parámetros
.IR preg , 
un puntero a un área de almacenamiento temporal de patrones,
.IR regex ,
un puntero a una cadena terminada en un carácter nulo y
.IR cflags ,
banderas utilizadas para determinar el tipo de compilación.

Toda búsqueda con expresiones regulares se debe realizar mediante un buffer
de patrones compilados, por tanto, a
.B regexec
siempre se le debe proporcionar la dirección de un buffer de patrones
inicializado mediante
.BR regcomp .

.I cflags 
debe ser un
.BR O -lógico
a nivel de bits de una o más de las siguientes opciones:
.TP 
.B REG_EXTENDED
Utilizar el tipo de sintaxis 'Expresión Regular Extendida 
.BR POSIX '
cuando se interprete
.IR regex .
Si no se activa esta opción, se utiliza el tipo de sintaxis 'Expresión Regular
Básica
.BR POSIX '.
.TP 
.B REG_ICASE
No distinguir entre mayúsculas y minúsculas. Las siguientes búsquedas
.B regexec
que usen este buffer de patrones no distinguirán entre mayúsculas y
minúsculas.
.TP 
.B REG_NOSUB
No se necesita soporte para obtener las posiciones de subcadenas
coincidentes. Los parámetros
.I nmatch
y
.I pmatch
de
.B regexec
se ignoran si el buffer de patrones proporcionado se compiló con esta
opción.
.TP 
.B REG_NEWLINE
Los operadores "coincidir con cualquier carácter" no coinciden con un
carácter "nueva línea".

Una lista de no-coincidencia
.RB ( [^...] )
que no contenga un carácter "nueva línea" no coincidirá con una "nueva
línea".

Un operador "coincidir al principio de línea"    
.RB ( ^ )
coincide con la cadena vacía inmediatamente posterior a un carácter "nueva
línea", sin tener en cuenta si
.IR eflags ,
la bandera de ejecución de
.BR regexec ,
contiene 
.B REG_NOTBOL
o no.

Un operador "coincidir al final de línea"
.RB ( $ )
coincide con la cadena vacía inmediatamente anterior a un carácter "nueva
línea", sin tener en cuenta si
.IR eflags 
contiene
.B REG_NOTEOL
o no.
.SH "COINCIDENCIAS EN LAS EXPRESIONES REGULARES POSIX"
.B regexec
se utiliza para comprobar si una cadena
.IR string ,
terminada en un carácter nulo,
coincide con alguno de los patrones precompilados del buffer
.IR preg .
.I nmatch
y
.I pmatch
se utilizan para informar respecto a la localización de cualquier
coincidencia.
.I eflags
puede ser
.B REG_NOTBOL
o
.B REG_NOTEOL 
o un
.BR O -lógico
de ambos valores, lo que cambia el comportamiento en las coincidencias tal
como se describe a continuación.
.TP
.B REG_NOTBOL
El operador "coincidir al principio de línea" siempre falla en las
coincidencias (pero vea la opción de compilación
.B REG_NEWLINE 
más arriba).
Esta bandera se puede utilizar cuando se pasan diferentes porciones de una
cadena a
.B regexec
y el comienzo de la cadena no se debe interpretar como el principio de una
línea.
.TP
.B REG_NOTEOL
El operador "coincidir al final de línea" siempre falla en la coincidencias
(pero vea la opción de compilación
.B REG_NEWLINE
más arriba).
.SS "DESPLAZAMIENTOS DE BYTES"
A menos que se especificara
.B REG_NOSUB
en la compilación del buffer de patrones, es posible obtener información
sobre la posición de subcadenas coincidentes.
.I pmatch
debe tener un tamaño de al menos
.I nmatch
elementos.
Estos se rellenan al ejecutar
.BR regexec 
con las posiciones de cadenas coincidentes. Cualquier elemento de la
estructura no utilizado contendrá el valor -1.

La estructura 
.BR regmatch_t , 
que es el tipo de
.IR pmatch ,
se define en
.IR regex.h .

.RS
.B typedef struct
.br
.B {
.br
.BI "  regoff_t " rm_so ;
.br
.BI "  regoff_t " rm_eo ;
.br
.B }
.B regmatch_t;
.RE

Cada elemento 
.I rm_so
que no es -1 indica el principio de la siguiente mayor
subcadena coincidente dentro de la cadena. El elemento
relativo
.I rm_eo 
indica el final de la coincidencia.
.SH "INFORMES DE ERROR POSIX"
.B regerror
se utiliza para convertir los códigos de error que pueden devolver tanto
.B regcomp
como
.B regexec
en cadenas de mensaje de error.

A
.B regerror
se le pasa el código de error,
.IR errcode ,
el buffer de patrones
.IR preg ,
un puntero al buffer de una cadena de caracteres, 
.IR errbuf ,
y el tamaño del buffer de la cadena, 
.IR errbuf_size .
Devuelve el tamaño de
.I errbuf
necesario para contener la cadena con el mensaje de error terminada en un
carácter nulo. Si tanto
.I errbuf
como
.I errbuf_size
no son cero,
.I errbuf
se rellena con los primeros
.I "errbuf_size - 1"
caracteres del mensaje de error y un carácter nulo terminador.
.SH "LIBERACIÓN DE BUFFERS DE PATRONES POSIX"
Si a 
.B regfree
se le pasa un buffer de patrones precompilados,
.IR preg ,
liberará la memoria  del buffer de patrones reservada por el proceso de
compilación,
.BR regcomp .
.SH "VALOR DEVUELTO"
.B regcomp
devuelve cero si la compilación tiene éxito y un código de error si falla.

.B regexec
devuelve cero si hay coincidencia y
.B REG_NOMATCH
en caso de fallo.
.SH ERRORES
.B regcomp
puede devolver los siguientes errores:
.TP
.B REG_BADRPT
Uso incorrecto de operadores de repetición, como el uso de
.RB ` * '
como primer carácter.
.TP
.B REG_BADBR
Uso incorrecto del operador de referencia inversa.
.TP
.B REG_EBRACE
Existe una llave de un operador de intervalo no emparejada.
.TP
.B REG_EBRACK
Existe un corchete de un operador de lista no emparejado.
.TP
.B REG_ERANGE
Uso incorrecto de un operador de rango; por ejemplo, el límite superior del
rango ocurre antes que el límite inferior.
.TP
.B REG_ECTYPE
Nombre de clase de caracteres desconocido.
.TP
.B REG_ECOLLATE
Elemento de comparación inválido.
.TP
.B REG_EPAREN
Existe un paréntesis de un operador de grupo no emparejado.
.TP
.B REG_ESUBREG
Referencia inversa incorrecta a una subexpresión.
.TP
.B REG_EEND
Error indefinido. No definido por POSIX.2.
.TP
.B REG_EESCAPE
Barra invertida (\\) al final.
.TP
.B REG_BADPAT
Uso incorrecto de operadores de patrón tales como grupo o lista.
.TP
.B REG_ESIZE
La expresión regular compilada necesita un buffer de patrones mayor que
64Kb. No definido por POSIX.2.
.TP
.B REG_ESPACE
Las rutinas de expresiones regulares se ejecutaron fuera de sus límites de
memoria.
.SH "CONFORME A"
POSIX.2
.SH "VÉASE TAMBIÉN"
.BR regex (7),
.B "El manual de expresiones regulares de GNU"