1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320
|
.\" Copyright (C), 1995, Graeme W. Wilford. (Wilf.)
.\"
.\" Permission is granted to make and distribute verbatim copies of this
.\" manual provided the copyright notice and this permission notice are
.\" preserved on all copies.
.\"
.\" Permission is granted to copy and distribute modified versions of this
.\" manual under the conditions for verbatim copying, provided that the
.\" entire resulting derived work is distributed under the terms of a
.\" permission notice identical to this one
.\"
.\" Since the Linux kernel and libraries are constantly changing, this
.\" manual page may be incorrect or out-of-date. The author(s) assume no
.\" responsibility for errors or omissions, or for damages resulting from
.\" the use of the information contained herein. The author(s) may not
.\" have taken the same level of care in the production of this manual,
.\" which is licensed free of charge, as they might when working
.\" professionally.
.\"
.\" Formatted or processed versions of this manual, if unaccompanied by
.\" the source, must acknowledge the copyright and authors of this work.
.\"
.\" Wed Jun 14 16:10:28 BST 1995 Wilf. (G.Wilford@ee.surrey.ac.uk)
.\" Tiny change in formatting - aeb, 950812
.\" Modified 8 May 1998 by Joseph S. Myers (jsm28@cam.ac.uk)
.\"
.\" Translated Thu Oct 15 1998 by Juan Piernas <piernas@ditec.um.es>
.\"
.\" show the synopsis section nicely
.de xx
.in \\n(INu+\\$1
.ti -\\$1
..
.TH REGCOMP 3 "8 Mayo 1998" GNU "Manual del Programador de Linux"
.SH NOMBRE
regcomp, regexec, regerror, regfree \- funciones para expresiones
regulares POSIX
.SH SINOPSIS
.B #include <regex.h>
.sp
.xx \w'\fBint\ regcomp(\fR'u
.BI "int\ regcomp(regex_t *" preg ", const char *" regex ,
.BI "int " cflags );
.xx \w'\fBint\ regexec(\fR'u
.BI "int\ regexec(const regex_t *" preg ", const char *" string ,
.BI "size_t " nmatch ", regmatch_t " pmatch[] ,
.BI "int " eflags );
.xx \w'\fBsize_t\ regerror(\fR'u
.BI "size_t\ regerror(int " errcode ,
.BI "const regex_t *" preg ", char *" errbuf ,
.BI "size_t " errbuf_size );
.xx \w'\fBvoid\ regfree(\fR'
.BI "void\ regfree(regex_t *" preg );
.SH "COMPILACIN DE EXPRESIONES REGULARES POSIX"
.B regcomp
se utiliza para compilar una expresin regular en un formato apropiado para
ser usado por
.B regexec
en bsquedas posteriores.
A
.B regcomp
se le pasan como parmetros
.IR preg ,
un puntero a un rea de almacenamiento temporal de patrones,
.IR regex ,
un puntero a una cadena terminada en un carcter nulo y
.IR cflags ,
banderas utilizadas para determinar el tipo de compilacin.
Toda bsqueda con expresiones regulares se debe realizar mediante un buffer
de patrones compilados, por tanto, a
.B regexec
siempre se le debe proporcionar la direccin de un buffer de patrones
inicializado mediante
.BR regcomp .
.I cflags
debe ser un
.BR O -lgico
a nivel de bits de una o ms de las siguientes opciones:
.TP
.B REG_EXTENDED
Utilizar el tipo de sintaxis 'Expresin Regular Extendida
.BR POSIX '
cuando se interprete
.IR regex .
Si no se activa esta opcin, se utiliza el tipo de sintaxis 'Expresin Regular
Bsica
.BR POSIX '.
.TP
.B REG_ICASE
No distinguir entre maysculas y minsculas. Las siguientes bsquedas
.B regexec
que usen este buffer de patrones no distinguirn entre maysculas y
minsculas.
.TP
.B REG_NOSUB
No se necesita soporte para obtener las posiciones de subcadenas
coincidentes. Los parmetros
.I nmatch
y
.I pmatch
de
.B regexec
se ignoran si el buffer de patrones proporcionado se compil con esta
opcin.
.TP
.B REG_NEWLINE
Los operadores "coincidir con cualquier carcter" no coinciden con un
carcter "nueva lnea".
Una lista de no-coincidencia
.RB ( [^...] )
que no contenga un carcter "nueva lnea" no coincidir con una "nueva
lnea".
Un operador "coincidir al principio de lnea"
.RB ( ^ )
coincide con la cadena vaca inmediatamente posterior a un carcter "nueva
lnea", sin tener en cuenta si
.IR eflags ,
la bandera de ejecucin de
.BR regexec ,
contiene
.B REG_NOTBOL
o no.
Un operador "coincidir al final de lnea"
.RB ( $ )
coincide con la cadena vaca inmediatamente anterior a un carcter "nueva
lnea", sin tener en cuenta si
.IR eflags
contiene
.B REG_NOTEOL
o no.
.SH "COINCIDENCIAS EN LAS EXPRESIONES REGULARES POSIX"
.B regexec
se utiliza para comprobar si una cadena
.IR string ,
terminada en un carcter nulo,
coincide con alguno de los patrones precompilados del buffer
.IR preg .
.I nmatch
y
.I pmatch
se utilizan para informar respecto a la localizacin de cualquier
coincidencia.
.I eflags
puede ser
.B REG_NOTBOL
o
.B REG_NOTEOL
o un
.BR O -lgico
de ambos valores, lo que cambia el comportamiento en las coincidencias tal
como se describe a continuacin.
.TP
.B REG_NOTBOL
El operador "coincidir al principio de lnea" siempre falla en las
coincidencias (pero vea la opcin de compilacin
.B REG_NEWLINE
ms arriba).
Esta bandera se puede utilizar cuando se pasan diferentes porciones de una
cadena a
.B regexec
y el comienzo de la cadena no se debe interpretar como el principio de una
lnea.
.TP
.B REG_NOTEOL
El operador "coincidir al final de lnea" siempre falla en la coincidencias
(pero vea la opcin de compilacin
.B REG_NEWLINE
ms arriba).
.SS "DESPLAZAMIENTOS DE BYTES"
A menos que se especificara
.B REG_NOSUB
en la compilacin del buffer de patrones, es posible obtener informacin
sobre la posicin de subcadenas coincidentes.
.I pmatch
debe tener un tamao de al menos
.I nmatch
elementos.
Estos se rellenan al ejecutar
.BR regexec
con las posiciones de cadenas coincidentes. Cualquier elemento de la
estructura no utilizado contendr el valor -1.
La estructura
.BR regmatch_t ,
que es el tipo de
.IR pmatch ,
se define en
.IR regex.h .
.RS
.B typedef struct
.br
.B {
.br
.BI " regoff_t " rm_so ;
.br
.BI " regoff_t " rm_eo ;
.br
.B }
.B regmatch_t;
.RE
Cada elemento
.I rm_so
que no es -1 indica el principio de la siguiente mayor
subcadena coincidente dentro de la cadena. El elemento
relativo
.I rm_eo
indica el final de la coincidencia.
.SH "INFORMES DE ERROR POSIX"
.B regerror
se utiliza para convertir los cdigos de error que pueden devolver tanto
.B regcomp
como
.B regexec
en cadenas de mensaje de error.
A
.B regerror
se le pasa el cdigo de error,
.IR errcode ,
el buffer de patrones
.IR preg ,
un puntero al buffer de una cadena de caracteres,
.IR errbuf ,
y el tamao del buffer de la cadena,
.IR errbuf_size .
Devuelve el tamao de
.I errbuf
necesario para contener la cadena con el mensaje de error terminada en un
carcter nulo. Si tanto
.I errbuf
como
.I errbuf_size
no son cero,
.I errbuf
se rellena con los primeros
.I "errbuf_size - 1"
caracteres del mensaje de error y un carcter nulo terminador.
.SH "LIBERACIN DE BUFFERS DE PATRONES POSIX"
Si a
.B regfree
se le pasa un buffer de patrones precompilados,
.IR preg ,
liberar la memoria del buffer de patrones reservada por el proceso de
compilacin,
.BR regcomp .
.SH "VALOR DEVUELTO"
.B regcomp
devuelve cero si la compilacin tiene xito y un cdigo de error si falla.
.B regexec
devuelve cero si hay coincidencia y
.B REG_NOMATCH
en caso de fallo.
.SH ERRORES
.B regcomp
puede devolver los siguientes errores:
.TP
.B REG_BADRPT
Uso incorrecto de operadores de repeticin, como el uso de
.RB ` * '
como primer carcter.
.TP
.B REG_BADBR
Uso incorrecto del operador de referencia inversa.
.TP
.B REG_EBRACE
Existe una llave de un operador de intervalo no emparejada.
.TP
.B REG_EBRACK
Existe un corchete de un operador de lista no emparejado.
.TP
.B REG_ERANGE
Uso incorrecto de un operador de rango; por ejemplo, el lmite superior del
rango ocurre antes que el lmite inferior.
.TP
.B REG_ECTYPE
Nombre de clase de caracteres desconocido.
.TP
.B REG_ECOLLATE
Elemento de comparacin invlido.
.TP
.B REG_EPAREN
Existe un parntesis de un operador de grupo no emparejado.
.TP
.B REG_ESUBREG
Referencia inversa incorrecta a una subexpresin.
.TP
.B REG_EEND
Error indefinido. No definido por POSIX.2.
.TP
.B REG_EESCAPE
Barra invertida (\\) al final.
.TP
.B REG_BADPAT
Uso incorrecto de operadores de patrn tales como grupo o lista.
.TP
.B REG_ESIZE
La expresin regular compilada necesita un buffer de patrones mayor que
64Kb. No definido por POSIX.2.
.TP
.B REG_ESPACE
Las rutinas de expresiones regulares se ejecutaron fuera de sus lmites de
memoria.
.SH "CONFORME A"
POSIX.2
.SH FALLOS
Actualmente (GNU libc al da 980503), GNU libc no soporta elementos de
comparacin en las expresiones regulares.
.SH "VASE TAMBIN"
.BR regex (7),
.B "El manual de expresiones regulares de GNU"
|