Mes #4

Este mes aprenderemos a manipular cadenas de Python con expresiones regulares. Para ello, utilizaremos varios tutoriales, así como los materiales del capítulo 3 del libro de NLTK.

  1. Tutorial de expresiones regulares de Regular expressions.
  2. Tutorial de expresiones regulares de PyMOTW.
  3. Ejercicios de regex.
  4. Capítulo 3. Partes de 3.4 y 3.5. Expresiones regulares y su utilización para la tokenización de textos, búsquedas de stems, etc. Ejercicios fáciles: 6, 7, 23, 25a, 25b, 26, 37, 41.
  5. Capítulo 3. Parte 3.7. Utilización de las regex para la tokenización (continuación) y el regex tokenizer de NLTK. Ejercicio 9.
  6. Capítulo 3. Parte 3.5 (parte «Searching tokenized text»). Utilización del método `findall` sobre los objetos `Text` de `nltk`. Ejercicio 35.
  7. Para experimentar con la expresiones regulares, puedes utilizar la web de Regex101.
  1. Capítulo 3. Ejercicios de regex (más complicados): Ejercicios del capítulo 3: 8, 21, 24, 25c., 34, 36, 38, 39

Ejercicios adicionales (sin relación con las regex)

Ejercicios para repasar las list comprehensions, split, join etc.: 27, 30-33

Ejercicios para repasar la tokenización con nltk: 29, 40

Ejercicios para repasar WordNet: 42

Ejercicios para repasar las distribuciones de frecuencias: 43