Anda di halaman 1dari 30

+

Procesadores de texto &


Expresiones regulares
+
PROCESADORES DE TEXTO

Todos los archivos en las computadoras consisten


de una secuencia lineal de nmeros binarios.

Los procesadores de texto son un tipo especial de


archivo binario, donde los nmeros corresponden a
caracteres legibles por el humano, tales como
dgitos, letras, signos de puntuacin, espacios en
blanco, tabulaciones, y fin de lneas.
+
PROCESADORES DE TEXTO
Notepad++
Notepad
NoteTab
TextEdit
Komodo Edit
Text Wrangler (mac)
etc.
+
Expresiones Regulares
Son formas flexibles de bsqueda y reemplazo de
textos.

Herramientas que estn incorporadas en:


- Editores de textos.
- Lenguajes de programacin.
- Sistemas de bsqueda en Internet.

Las expresiones regulares hacen uso de COMODINES.

Los COMODINES incrementan la utilidad de una


herramienta de bsqueda y reemplazo cuando el texto
que se quiere modificar es variable.
+
Expresiones Regulares - ejercicio
1. Crea un nuevo documento en Notepad++

2. Tipea:
Agalma elegans

3. Selecciona Find en el men Search

4. Selecciona la opcin normal

5. Tipea
Find: galma
Replace: .

RESULTADO:
+
Expresiones Regulares - ejercicio
1. Crea un nuevo documento en Notepad++

2. Tipea:
Agalma elegans

3. Selecciona Find en el men Search

4. Selecciona la opcin normal

5. Tipea
Find: galma
Replace: .

RESULTADO: A. elegans
+
Expresiones Regulares - ejercicio
1. Tipea
Agalma elegans
Frillagalma vityazi
Cordagalma tottoni

2. Tipea
Find: galma
Replace: .

RESULTADO:
+
Expresiones Regulares - ejercicio
1. Tipea
Agalma elegans
Frillagalma vityazi
Cordagalma tottoni

2. Tipea
Find: galma
Replace: .

RESULTADO:
A. elegans
Frilla. vityazi
Corda. tottoni
+
Expresiones Regulares - ejercicio
1. Tipea
Agalma elegans
Frillagalma vityazi
Cordagalma tottoni

2. Tipea
Find: galma
Replace: .

RESULTADO:
A. elegans
Frilla. vityazi
Corda. tottoni (no es el resultado esperado)
+
Expresiones Regulares - ejercicio
\w indica cualquier letra (A-z), dgitos (0-9) y _

1. Tipea
+40 46N +014 15E
+21 17N -157 52W
2. Selecciona la opcin regular expressions
3. Eliminar E, N y W (todas las letras)
Find: \w
Replace: (nada)
RESULTADO:
+
Expresiones Regulares - ejercicio
\w indica cualquier letra (A-z), dgitos (0-9) y _

1. Tipea
+40 46N +014 15E
+21 17N -157 52W
2. Selecciona la opcin regular expressions
3. Eliminar E, N y W (todas las letras)
Find: \w
Replace: (nada)
RESULTADO:
++
+
+
Expresiones Regulares - ejercicio
\w indica cualquier letra (A-z), dgitos (0-9) y _

1. Tipea
+40 46N +014 15E
+21 17N -157 52W
2. Selecciona la opcin regular expressions
3. Eliminar E, N y W (todas las letras)
Find: \w
Replace: (nada)
RESULTADO:
++
+ (no es el resultado esperado)
+
Expresiones Regulares - ejercicio
\w indica cualquier letra (A-z), dgitos (0-9) y _

4. Retorna al principio
+40 46N +014 15E
+21 17N -157 52W

5. Toma ventaja de la observacin que las letras que se


desean borrar siempre estn despus del (apstrofo)
Find: \w
Replace:

RESULTADO:
+
Expresiones Regulares - ejercicio
\w indica cualquier letra (A-z), dgitos (0-9) y _

4. Retorna al principio
+40 46N +014 15E
+21 17N -157 52W

5. Toma ventaja de la observacin que las letras que se


desean borrar siempre estn despus del (apstrofo)
Find: \w
Replace:

RESULTADO:
+40 46 +014 15
+21 17 -157 52
+
Expresiones Regulares - ejercicio
( ) captura de textos

1. Tipea
5to
3ro
2do

2. Solo queremos quedarnos con el nmero y eliminar las dos letras


siguientes
Find: (\w)(\w)(\w)
Replace: \1\2

RESULTADO:
5t
3r
2d
+
Expresiones Regulares - ejercicio
( ) captura de textos

1. Tipea
5to
3ro
2do

2. Solo queremos quedarnos con el nmero y eliminar las dos letras


siguientes
Find: \w\w\w
Replace: \w\w

RESULTADO:
5t
3r
2d (no es el resultado esperado)
+
Expresiones Regulares - ejercicio
( ) captura de textos

3. Retorna al inicio
5to
3ro
2do

4. Podemos capturar el primer carcter con los parntesis


Find: (\w)\w\w
Replace: \1

RESULTADO:
5
3
2
+
Expresiones Regulares - ejercicio
( ) captura de textos

5. Retorna al inicio
5to
3ro
2do

6. Agrega el trmino Posicin: antes del nmero


Find: (\w)\w\w
Replace: Posicin: \1

RESULTADO:
Posicin: 5
Posicin: 3
Posicin: 2
+
Expresiones Regulares - ejercicio
+ El signo + despus de un carcter indica que el
trmino debe coincidir una o ms veces en
sucesin.

Por ejemplo, el trmino \w+ puede representar un solo


carcter, como la letra a, o muchos caracteres,
como el nmero 123
+
Expresiones Regulares - ejercicio
+ El signo + despus de un carcter indica que el trmino debe
coincidir una o ms veces en sucesin.

Retornando al primer ejemplo:


Agalma elegans
Frillagalma vityazi
Cordagalma tottoni
La combinacin de ( ) y + permite capturar palabras
independientemente
Find: (\w)\w+ (\w+) o (\w)(\w+) (\w+)
Replace: \1. \2 \1. \3

RESULTADO:
A. elegans
F. vityazi
C. tottoni
+
Expresiones Regulares - ejercicio
\ Obviar caracteres o remover el significado especial de los
signos de puntuacin.

1. Tipear:
Physalis peruviana (Linnaeus)
2. Emplear el carcter \ para eliminar los parntesis
Find: (\w)\w+ (\w+) \((\w)\w+\)
Replace: \1. \2 \3.

RESULTADO:
P. peruviana L.
+
Expresiones Regulares - comodines

Trmino Significado

\w Carcter para palabras, incluye letras,


nmeros y el guin bajo.

\t Caracter de tabulaciones.
\s Un espacio en blanco, incluye espacios, tabs, y
fin de linas.

\r \a Fin de lnea
\d Un dgito, de 0-9
.
+
Expresiones Regulares
-reformateando datos moleculares
+
Expresiones Regulares
-reformateando datos moleculares

Por ejemplo, para reducir los nombres o ttulos de las


secuencias.
+
Expresiones Regulares
-reformateando datos moleculares
Por ejemplo, para reducir los nombres o ttulos de las
secuencias.

>CAA58790.i= GFP [Aequorea victoria]


>(CAA58790).i= GFP [(Aequorea) victoria]
(\w+).+ \[(\w).+

Find: (\w+).+\[(\w+).+
Replace: \1_\2

RESULTADO:
>CAA58790_Aequorea
+
Expresiones Regulares
-reformateando datos moleculares
>gi|576528|gb|L37519.1|POTPPINHB Solanum
tuberosum proteinase inhibitor II mRNA, complete cds
AACACGTGGGGGCAGTACTAATTATTATCCAGCATGGCTGTTCACAAGGAAGTTAATTTCGTTGCTTACC
TACTAATTGTTCTTGGATTATTGGTACTTGTAAGCGCGATGGAGCATGTTGATGCGAAGGCTTGCACTTT
AGAATGTGGTAATCTTGGGTTTGGGATATGCCCACGTTCAGAAGGAAGTCCGGAAAATCGCATATGCACC
AACTGTTGTGCAGGTTATAAAGGTTGCAATTATTATAGTGCAAATGGGGCTTTCATTTGTGAAGGAGAAT
CTGACCCAAAAAAACCAAAAGCATGCCCCCGAAATTGCGATCCACATATTGCCTACTCAAAGTGTCCCCG
TTCAGAAGGAAAATCGCTAATTTATCCCACCGGATGTACCACATGCTGCACAGGGTACAAGGGTTGCTAC
TATTTCGGTAAAAATGGCAAGTTTGTATGTGAAGGAGAGAGTGATGAGCCCAAGGCAAATATGTACCCTG
CAATGTGACCCTAGACTTGTCCATCTTCTGGATTGGCCAACTTAATTAATGTATGAAATAAAAGGATGCA
CACATAGTGACTGCTAATCACTATAATGTGGGCATCAAAGTTGTGTGTTATGTGTAATTACTAGTTATC
TGAATTAAAAGGGAAGGGTCATCATTTTTCTTTTCT
+
Expresiones Regulares
-reformateando datos moleculares
>gi|576528|gb|L37519.1|POTPPINHB Solanum
tuberosum proteinase inhibitor II mRNA, complete cds
AACACGTGGGGGCAGTACTAATTATTATCCAGCATGGCTGTTCACAAGGAAGTTAATTTCGTTGCTTACC
TACTAATTGTTCTTGGATTATTGGTACTTGTAAGCGCGATGGAGCATGTTGATGCGAAGGCTTGCACTTT
AGAATGTGGTAATCTTGGGTTTGGGATATGCCCACGTTCAGAAGGAAGTCCGGAAAATCGCATATGCACC
AACTGTTGTGCAGGTTATAAAGGTTGCAATTATTATAGTGCAAATGGGGCTTTCATTTGTGAAGGAGAAT
CTGACCCAAAAAAACCAAAAGCATGCCCCCGAAATTGCGATCCACATATTGCCTACTCAAAGTGTCCCCG
TTCAGAAGGAAAATCGCTAATTTATCCCACCGGATGTACCACATGCTGCACAGGGTACAAGGGTTGCTAC
TATTTCGGTAAAAATGGCAAGTTTGTATGTGAAGGAGAGAGTGATGAGCCCAAGGCAAATATGTACCCTG
CAATGTGACCCTAGACTTGTCCATCTTCTGGATTGGCCAACTTAATTAATGTATGAAATAAAAGGATGCA
CACATAGTGACTGCTAATCACTATAATGTGGGCATCAAAGTTGTGTGTTATGTGTAATTACTAGTTATC
TGAATTAAAAGGGAAGGGTCATCATTTTTCTTTTCT

Find: \w\w\|\d+\|\w+\|\w\d+\.\d\|\w+ (\w+) (\w+).+


Replace: \1\_\2
+
Expresiones Regulares
+
Expresiones Regulares
+ Manipulacin de archivos: expresiones
regulares
Expresiones regulares son patrones usados para
igualar archivos y textos.

txt - iguala todos los archivos con txt al final

ls *txt
ls /gpfs/data/user/*txt

Anda mungkin juga menyukai