Pues resulta que como la semana pasada tenía tiempo libre en el trabajo y en désedos hay una biblioteca bastante generosa, he empezado a leerme un libro que estoy seguro que el 80% o más de los que leéis el blog no vais a entender ni de qué va. Ni aun cuando os lo cuente. (Y pobres los del 20% que sí lo hagan.)
El libro en cuestión se llama Mastering Regular Expressions.
Las preguntas inmediatas son:- ¿Qué leches es eso de Regular Expressions?
- ¿Para qué sirve eso?
Siento avanzar que no tengo respuesta satisfactoria para ninguna de estas dos preguntas.
Aun así vamos a intentarlo.
Las expresiones regulares son... esto... unas cosas... es... como un toro!
Veamos un ejemplo a ver si así es más fácil empezar a coger la idea:
Cuando en el Windows buscas archivos .bmp, pones en el buscador que busque archivos llamados *.bmp, queriendo decir que * puede ser cualquier cosa. Esto no es una expresion regular, pero la idea se acerca.
Las expresiones regulares se usan en muchos lenguajes de programación para buscar patrones en variables o archivos de texto. Se parece a la utilidad de los editores de texto de buscar palabras, sólo que lo que buscamos no son palabras concretas, sino trozos de texto que cumplan con una serie de fórmulas que queremos.
Y como se desprende de lo dicho, las expresiones regulares sirven, entre otras cosas, para buscar cadenas de caracteres concretas en ficheros y para comprobar si una variable tipo texto cumple (es igual o parecida) unas determinadas características.
¿Ni idea?
Veamos un par de ejemplos que yo mismo uso. Uno es más o menos fácil de ver y el otro nos puede sonar a chino si no sabemos de qué va esto de las expresiones regulares.
- En mi trabajo, todos los días por la mañana analizamos los resultados de los tests que se han pasado a la versión diaria del software que hacemos. Estos resultados son archivos de texto (algunos de varios megas) que contienen la salida de los distintos subtests.
Aunque cada archivo tiene un informe al final, yo sólo tengo que escribir un comando para ver en pantalla los subtests que han fallado en todos y cada uno de los archivos sin tener que abrir uno por uno los ficheros. Para ello escribo en la consola:
egrep 'SubTest.+FAILED!' *version_20080421*
donde egrep es el comando de Linux que busca un patrón en un archivo, *version_20080421* es el conjunto de todos los archivos que contienen la versión que me interesa y SubTest.+FAILED! es la expresión regular que sólo me localiza las líneas que contienen al mimo tiempo la palabra SubTest y la palabra FAILED!. Así puedo ver, en unos segundos, qué cosas han fallado y me ahorro tener que abrir y analizar los ficheros donde todo ha ido bien.
- Tengo que comprobar que el contenido de una variable es un email válido (no que exista, simplemente que siga la fórmula nombre@servidor.dominio). Con hacer la siguiente comparación me sobra:
variable =~ /\w[-.\w]*\@[-\w]+(\.[-\w]+)*\.\w+/
Para mí las expresiones regulares son como escribir a máquina: no es necesario usarlas, pero ahorran mucho tiempo y una vez que sabes, te das cuenta de que hasta el momento has estado haciendo el canelo.
En mucho libros de programación dedican unas páginas a enseñarte qué son las expresiones regulares y cómo se usan en un determinado lenguaje. Pero cuando vi que había un libro exclusivamente dedicado a esto, me pregunté hasta dónde se puede llegar con las expresiones regulares, si pueden ahorrarme aun más trabajo, si me volveré loco aprendiéndolas, etc.
En fin, no pude resistir mi curiosidad y elegí este libro. Por eso y porque mis otras opciones eran Linux Kernel Development y Building Embedded Linux Systems.
Un saludo.







