Mes #4 ====== Este mes aprenderemos a manipular cadenas de Python con expresiones regulares. Para ello, utilizaremos varios tutoriales, así como los materiales del `capítulo 3`_ del libro de NLTK. .. _capítulo 3: http://www.nltk.org/book/ch03.html 1. Tutorial de expresiones regulares de `Regular expressions`_. 2. Tutorial de expresiones regulares de `PyMOTW`_. 3. `Ejercicios de regex`_. 4. Capítulo 3. Partes de 3.4 y 3.5. **Expresiones regulares y su utilización para la tokenización de textos, búsquedas de stems, etc**. Ejercicios fáciles: 6, 7, 23, 25a, 25b, 26, 37, 41. 5. Capítulo 3. Parte 3.7. **Utilización de las regex para la tokenización (continuación) y el regex tokenizer de NLTK**. Ejercicio 9. 6. Capítulo 3. Parte 3.5 (parte "Searching tokenized text"). **Utilización del método `findall` sobre los objetos `Text` de `nltk`**. Ejercicio 35. 7. Para experimentar con la expresiones regulares, puedes utilizar la web de `Regex101`_. .. _Regular expressions : https://www.regular-expressions.info/quickstart.html .. _PyMOTW : https://pymotw.com/2/re/ .. _Ejercicios de regex : https://regex.sketchengine.co.uk/ .. _Regex101 : https://regex101.com/ 8. Capítulo 3. Ejercicios de regex (más complicados): Ejercicios del capítulo 3: 8, 21, 24, 25c., 34, 36, 38, 39 Ejercicios adicionales (sin relación con las regex) --------------------------------------------------- Ejercicios para repasar las list comprehensions, `split`, `join` etc.: 27, 30-33 Ejercicios para repasar la tokenización con nltk: 29, 40 Ejercicios para repasar WordNet: 42 Ejercicios para repasar las distribuciones de frecuencias: 43